スポンサーサイト  このエントリーを含むはてなブックマーク はてなブックマーク - スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

「Google日本語入力」  このエントリーを含むはてなブックマーク はてなブックマーク - 「Google日本語入力」

11/28に「補完機能は便利だけど」というエントリで、google検索を始めとする補完機能を使っているとIMEが変換結果を学習してくれないので困ると書きました。

1週間後の12/3、Google日本語入力が公開されました。google検索の補完機能を使うと学習しないのは当然変わらないですが、話題としてはタイムリーでした。

公開された翌日くらいにOperaからインストールしようとしたらOSのバージョンどうのと言われてうまく入らなかったんですが、数日後にIEから試したらすんなり入りました。Operaでダメだった原因は不明。ちなみに普段はMS IMEを使っていました。

使ってみて分かるのは、変換候補リストの横に簡単な意味や例題が表示されるMS IMEの機能が結構便利だったんだということ。同音異義語だと分からなくなることがありますからね。仕様なのか、再変換が効かないのも痛いです。手書入力もほしいところ。

私は癖で短い文節ごとに変換するので、評判になっている「長文を一気に変換できる」メリットは今のところあまり感じられません。予測変換は便利というか面白いですね。Google日本語入力に慣れて予測変換ありきで使うようになれば活用できそうです。

初期バージョンとしては十分過ぎる出来だと思いますし、すぐに改良されていくでしょう。しばらく使ってみます。

補完機能は便利だけど  このエントリーを含むはてなブックマーク はてなブックマーク - 補完機能は便利だけど

Google 検索で適当にキーワードを入力すると補完候補が出てきます。検索傾向が見られて面白いですし入力軽減にもなるので、今となっては必要な機能と思います、が。

マウスで操作していると、キーワードを入れて検索ボタンをクリックしようとした瞬間に補完候補のリストが表示されて、思ったのと全然違うキーワードで検索してしまうというイライラがあります。この弊害が発生するのはトップページだけで、検索結果のページでは検索ボタンがキーワード入力枠の右側にあるので補完候補リストとクリック位置が重なることはありません。UI デザインの問題なのでそのうち直されると思ったんですが、いまだ変わらず。

IME が変換結果を学習しません。こっちの方が面倒な弊害。これはgoogleに限ったことではないですが、何かしらの補完機能を使用して入力すると IME を通さないので学習してくれません。結果として補完機能のないツールで同じ単語を入力しようとするとちゃんと変換されず、イラっとします。

と、「沢田研二」を google で検索しようとしたら「澤田健二」になって、でも補完で「沢田研二」を選ぶものだからいつまでたっても IME が「沢田研二」を学習しないという現象から思ったのでした。なんで「沢田研二」なのかは謎。

[よく見るサイト]スラッシュドット ジャパン  このエントリーを含むはてなブックマーク はてなブックマーク - [よく見るサイト]スラッシュドット ジャパン

たまにはよく見るサイトを紹介してみます。まぁ有名なのでいまさら感もありますが、スラッシュドット ジャパン:アレゲなニュースと雑談サイト

参加者が投稿した記事に参加者がコメントを書き込んでいく技術系サイトです。記事の投稿は無制限ですが、採用されるかどうかは無制限ではなく、参加者が「タレコミ」した記事を「編集者」が取捨して掲載するという手順をとっています。編集者は今日現在で18人。そのおかげで、ある程度の水準を保っています。「ある程度」ですが。

技術系サイトとはいえコテコテの技術系な話題は少なく、ミーハーな話題も多いです。参加者が増えるにつれて興味の薄い記事が多くなりコメント全部に目を通すことも少なくなりましたが、見出しのチェックだけは今でもほぼ毎日しています。

ちなみに二千番台のIDを持つ結構古いユーザーです。いま登録したら四万番台くらい? Anonymous Coward でコメントを書き込んだことは何度かありますが、IDで書き込んだことは一度もありません。なぜなら Anonymous Coward だから。というか登録した当時はインターネットが一般的になり始めたころで、私のセキュリティ意識も薄く、ID名がほぼ個人を特定する名前だからです。

「あいまい検索」  このエントリーを含むはてなブックマーク はてなブックマーク - 「あいまい検索」

「あいまい検索」ってどんなのだっけ?

と、ネット徘徊中に「ベンチャー社長で技術者で:ストアドプロシージャにするとワークテーブルが増える?」という記事を読んで思ったのでした。本題じゃない最後の段落に以下の記述がありました。

……SQLでn-Gramを実現する、つまり、LIKE '%検索文字%' とするとインデックスが使えないけれど、インデックスを使ってあいまい検索を高速に行う……

N-gramとSQLのLIKE演算子とでは結果が等価にならないので、そういう意味で書かれていないのは分かるのですが、LIKE演算子を「あいまい検索」に分類するのは違和感があります。「部分一致検索」じゃないかな。

個人的に「あいまい検索」とは、「日本」を検索したら「JAPAN」もヒットするような検索だと思っていました。簡単に実装なんて無理というか、シソーラスが肝心であってロジックで解決するようなものではないという認識です。LIKE演算子でも「あいまい検索もできます!」って言っていいのかな。

で、いろんなところから「あいまい検索」の使用例を拾ってみました。

マイクロソフト。日本語のあいまい検索を実行する

あいまい検索を実行するには以下の手順に従います。
……
InfoPath の場合
・大文字と小文字を区別しない場合は、[大文字と小文字を区別する] チェック ボックスをオフにします。
・全角文字と半角文字を区別しない場合は、[半角と全角を区別する] チェック ボックスをオフにします。
・日本語のあいまい検索を行う場合は、[あいまい検索 (日)] チェック ボックスをオンにします。

Word の場合
・大文字と小文字を区別しない場合は、[大文字/小文字 [A/a]] チェック ボックスをオンにします。 ・全角文字と半角文字を区別しない場合は、[全角文字/半角文字 [A/A]] チェック ボックスをオンにします。 ・ひらがなとカタカナを区別しない場合は、[ひらがな/カタカナ [あ/ア]] チェック ボックスをオンにします。

InfoPathの3番目がなぞですが、「大文字/小文字を区別しない」「全角/半角を区別しない」「ひらがな/カタカナを区別しない」といった検索を「あいまい検索」としています。

続いてオラクル。日本オラクル、テキスト管理ソリューション「Oracle ConText Option Release2.0.4」を出荷開始

◆曖昧検索
日本語において同一でありながら表記形式が異なる語、たとえばバージョンとヴァージョン等を同一キーワードと認知して検索できます。

例がしょぼいので詳しくは分からないんですけど、シソーラスは使ってなさそう。

IBM。サポート情報からあいまい検索で漢字を検索した場合の検索結果が正しくない

あいまい検索は「ひらがな、半角カタカナ、全角カタカナ」「全角・半角英数字、大文字・小文字英字」等を同一視して検索するものです。

これもシソーラス関係なし。

Microsoft Access Club。マイクロソフト社のサイトではなくて、Accessに関する情報を集めたサイトです。LIKE演算子

WHERE句で検索条件を指定するときにLIKE演算子を使用すると、あいまい検索を行うことができます。

ずばり、LIKE演算子は「あいまい検索」だ。

厚生労働省図書館の蔵書検索システム。WebOPACのヘルプ? よく分かりませんが。WebOPAC HELP

あいまい検索とは、以下のものを区別しないで検索する方法です。
  全角/半角  ひらがな/カタカナ 濁音/半濁音/清音 英大文字/英小文字

IBMに近い。

Yahoo!辞書。出典は大辞泉です。あいまい-けんさく

検索するキーワードと完全に一致していなくても、表記の異なりや同義語も含め、柔軟に解釈して検索すること。

シソーラスが出てきた。

日経BP。出典は日経パソコン用語辞典2009です。あいまい検索とは

アルファベットの大文字小文字、全角と半角、「っ」と「つ」などを区別せずに検索するもの、「米国」というキーワードで同時に「アメリカ」「USA」といった同義語も探し出すものなど、いろいろな方式がある。

おぉ。後者は私のイメージにぴったり。でも「いろいろな方式がある」そうです。

IT用語辞典バイナリ。あいまい検索とは

あいまい検索とは、検索条件が完全一致しない対象を、一定のルールのもとで抽出する検索方法のことである。
……
……例えば、データベースの検索言語であるSQLでは、LIKE文を用いて、検索対象文字列が部分一致するようなレコードを抽出することができる。……
高度なあいまい検索には、文書全体の語彙を分解して、ベクトル空間上に多次元表現し、検索対象語との意味的な距離を計測することにより、一致度を見る概念検索といったものがある。また、シソーラス辞書を活用して、語の抽象度の調整や関連語への連想展開などを行うものもある。ウェブの検索エンジンでは、Googleのように、コンテンツ間の参照関係や、重要語の重み付けなどをグラフ構造の中で評価するようなものもある。このように、あいまい検索には、さまざまな方式が存在している。

今回調べた中ではこれが一番情報量多いですね。「あいまい検索には、さまざまな方式が存在している。」だそうです。

他にもググれば大量に見つかりますけど、疲れたのでここまで。

どうやらLIKE演算子による部分一致検索を「あいまい検索」と呼称しても、少なくとも間違いではなさそうですね。

しかし「あいまい検索」の意味自体が相当にあいまいです。ちゃんと具体的に説明しないと齟齬をきたしますね、これは。注意しよう。

[Windowsのコマンドたち]arp  このエントリーを含むはてなブックマーク はてなブックマーク - [Windowsのコマンドたち]arp

手元に環境がない時にヘルプだけでも読めれば助かることもあるかと思うので、Windowsのコマンドのヘルプメッセージを本ブログに残して行こうと思います。日本語化されていないものはついでにざっくり翻訳も付けておきます。今後ちょくちょく追加して行くつもりです。

arpコマンド。arpテーブルの表示・追加・削除を行います。

C:\>arp

Displays and modifies the IP-to-Physical address translation tables used by
address resolution protocol (ARP).

ARP -s inet_addr eth_addr [if_addr]
ARP -d inet_addr [if_addr]
ARP -a [inet_addr] [-N if_addr]

  -a            Displays current ARP entries by interrogating the current
                protocol data.  If inet_addr is specified, the IP and Physical
                addresses for only the specified computer are displayed.  If
                more than one network interface uses ARP, entries for each ARP
                table are displayed.
  -g            Same as -a.
  inet_addr     Specifies an internet address.
  -N if_addr    Displays the ARP entries for the network interface specified
                by if_addr.
  -d            Deletes the host specified by inet_addr. inet_addr may be
                wildcarded with * to delete all hosts.
  -s            Adds the host and associates the Internet address inet_addr
                with the Physical address eth_addr.  The Physical address is
                given as 6 hexadecimal bytes separated by hyphens. The entry
                is permanent.
  eth_addr      Specifies a physical address.
  if_addr       If present, this specifies the Internet address of the
                interface whose address translation table should be modified.
                If not present, the first applicable interface will be used.
Example:
  > arp -s 157.55.85.212   00-aa-00-62-c6-09  .... Adds a static entry.
  > arp -a                                    .... Displays the arp table.

ざっくり翻訳。

C:\>arp

ARPテーブルの内容を表示したり修正したりします。

ARP -s inet_addr eth_addr [if_addr]
ARP -d inet_addr [if_addr]
ARP -a [inet_addr] [-N if_addr]

  -a            現在のARPテーブルの内容を表示します。
                inet_addr が指定されていればそのアドレスのエ
                ントリだけ表示します。複数のネットワークイン
                ターフェイスでARPが使用されている場合、それぞ
                れのARPテーブルを表示します。
  -g            -a と同じです。
  inet_addr     インターネットアドレス
  -N if_addr    if_addr で指定されたネットワークインターフェ
                イスのエントリだけ表示します。
  -d            inet_addr で指定されたホストのエントリを削除
                します。inet_addr にはワイルドカードとして *
                も使用できます。
  -s            inet_addr と eth_addr との組み合わせのエント
                リを追加します。eth_addr は16進でハイフン区切
                りの6バイトです。これで追加されたエントリは永
                続します。
  eth_addr      物理アドレス。
  if_addr       変更されるべきARPテーブルを持つインターフェイ
                スのアドレス。これを指定しなかった場合、最初
                に見つかったインターフェイスが使われます。
例:
  > arp -s 157.55.85.212   00-aa-00-62-c6-09  .... 静的エントリを追加
  > arp -a                                    .... ARPテーブルを表示

めったに使うコマンドではありませんが、MACアドレスを確認するときなんかに arp -a することがありますね。あとIPアドレスが変わったのを即反映させるために arp -d するくらいでしょうか。

「電源を切る」ために「スタート」する?  このエントリーを含むはてなブックマーク はてなブックマーク - 「電源を切る」ために「スタート」する?

巷でよく言われるWindowsのUIの問題です。シャットダウンするために「スタート」するのはいかがなものか。最近はあまり聞きませんかね。Windows95が出た頃はよく言われていました。

スラッシュドットジャパンで知ったのですが、ちゃんといきさつがありました。Why do you have to click the Start button to shut down?

(拙訳)

なぜシャットダウンするためにスタートボタンをクリックしなければならないのか?

短い答え:車を止めるためにイグニッションキーを回さなければならないのと同じ理由です。

長い答え:初期の頃、タスクバーにスタートボタンはありませんでした。(未来の歴史コラムでは、あなたは初期の頃にタスクバーがタスクバーと呼ばれていなかったことを学ぶでしょう。)

スタートボタンの代わりに、左下のコーナーに三つのボタンがありました。ひとつは "システム(System)" ボタン(アイコンはWindowsの旗)、ひとつは "検索(Find)" ボタン(アイコンは目玉)、三つ目は "ヘルプ(Help)" ボタン(アイコンは?マーク)でした。"検索" と "ヘルプ" とは説明不要でしょう。"システム" ボタンは以下のメニューを表示していました:

 実行...
 タスクリスト...
 --------------------------
 デスクトップアイコンの整列
 ウィンドウの整列          4
 --------------------------
 シャットダウン

("ウインドウの整列" には、"重ねて表示(Cascade)"や"水平に並べて表示(Tile Horizontally)" などのオプションがありました。)

当然ながら、時間とともに "検索" と "ヘルプ" が徐々に "システム" ボタンメニューに加わり、システムボタンメニュー自体が徐々に Windows 95 のスタートメニューに変化していきました。

しかしある問題がユーザビリティテストで挙がり続けていました。人々はコンピュータを起動してただそこに座り、次に何をするべきか迷うのです。

私たちがシステムボタンに "スタート" とラベル付けすることを決めたのはこのときです。

それは "お馬鹿さん、ここをクリックしなさい" と言っているのです。そしてそれは、私たちのユーザビリティの順位を急激に上昇させました。なぜなら人々は突如として、何かをしたいときにどこをクリックするべきかを知ったからです。

では、なぜ "シャットダウン" がスタートメニューにあるのか?

私たちが人々にコンピュータをシャットダウンするように言ったとき、彼らはスタートボタンをクリックしたのです。

なぜなら、どのみちあなたがシャットダウンしたいときには、どこかから始めなければならないのですから。

(さらに、もし私たちがスタートボタンの隣に "シャットダウン" ボタンを置いたとしたら、貴重な画面の領域を確保するために、誰もが私たちにそれを取り除くよう求めたことでしょう。)

つまり、ユーザビリティテストの結果として、そのインターフェイスが優れていたからなんですね。まったく理にかなっています。理論的に整合の取れたものが必ずしも使いやすいわけじゃない。

で、かく言う私はといえば、スタートメニューからシャットダウンすることに最初から特に違和感ありませんでした。言われてみて初めて、ああなるほどという程度です。「シャットダウン作業をスタートする」で良いですよね。

なんにせよ、すっきりしました。

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。