ヘッダー

意味構造検索システム Kamome

 


Kamome の使い方 1 2 3

トップページの検索質問文入力フォームに、検索したい内容を文や句で入力し、検索ボタンを押します。

初期入力画面

検索質問文フォーム

検索質問文入力のコツ

※探している文書に含まれていそうな文や句を想像して入力するとうまく見つかることが多くなります。

※数やアルファベットを入力する時は半角や漢数字は使わずに、全角を使ってください。

「検索質問文」に検索条件を文または句で入力します。 入力された文または句は構文解析器CaboChaによって解析され、 意味構造を自動的に構築してから検索を行ないます。


検索結果ページが表示されます。検索結果画面のサムネールをクリックすると資料が表示されます。

検索結果画面

(1)検索キーワードリスト

(2)キーワードの言い換え語(類語・関連語)
使い方は次項で紹介しています



(3)検索結果画面
技術戦略マップ4つの分類毎に結果を表示します


(3-1)導入シナリオ検索結果





(3-2)ロードマップ検索結果






(3-3)技術マップ検索結果






(3-4)その他検索結果




(4)入力履歴表示
これまでに入力した検索条件が表示されます
   
検索結果画面 詳細検索結果画面詳細

(5)検索結果情報
検索結果情報
入力した全てのキーワードリストに合致した文書、および少なくとも一つのキーワードリストに合致した文書の数を表示します。

(6)ページ移動ボタン
ページ移動ボタン
文書候補は10文書ずつグループにして提示されますが、そのグループを移動するためのボタンです。

(7)検索対象チェックボックス
チェックを外すことで、この文書を検索対象から外します。


もし目的の文章が上位に提示されない場合は、検索キーワードの言い換え語から、検索キーワードを追加・削除し、再検索します。

検索キーワードの言い換え語 (8)検索キーワード削除
チェックをはずすことで、この類義語リストを検索キーワードから削除します。

(9)検索キーワード追加
探している文書に含まれていそうな語を選び、再検索ボタンを押します。 CtrlキーやShiftキーで複数選択も可能です。

(10)新規類義語リスト追加
新しい検索キーワードを直接入力し、再検索ボタンを押すことで、そのキーワードが検索キーワードに追加され、そのキーワードの新しい類義語リストが出現します。

(11)新規類義語追加
入力した類義語を検索キーワードおよび、類義語リストに追加します。

Kamomeでは、検索とは候補を絞り込むことではなく、目的の文書をより上位に提示させることである、という考えのもと検索を行っています。よって、検索キーワードに類義語・関連語を追加して条件を厳しくし、 全てのキーワードリストに合致した文書が増加し、 少なくとも一つのキーワードリストに合致した文書がそれほど増加しないような検索結果を目指しています。


意味構造検索とは

近年、World Wide Web の普及によって膨大な数の 電子化された文書が閲覧可能になりましたが、 今度は必要な文書を探すことが難しくなってきました。 検索サービスのサイトで、キーワードをいくら入力してもたいていは何万件も候補があるといわれてしまい、 仕方なく最初の方に挙げられている数件を調べるというのが典型的な状況だと思います。 それで調べたかったことが分かることも多いのですが、 「何万件もある中から数件しか調べなくて本当に大丈夫なのか」 「もっとよいページがあるのではないか」 と心配になったことはありませんか?

検索候補をうまく絞り込めない最も大きな理由は、 指定できる検索の条件が粗すぎるからです。 「DVDビデオを変換してVHSビデオを作りたい」と思って、 検索サービスのサイトで「DVDビデオ」「変換」「VHSビデオ」「作る」などと入力しても、 望みの文書だけがでてくることは期待できないでしょう。 本当に欲しい文書の他に、 これらのキーワードをたまたま含んでいる文書を排除することはできないし、 なによりキーワードを並べるだけでは「DVDビデオを変換してVHSビデオを作る」のか、 「VHSビデオを変換してDVDビデオを作る」のかを区別することができません。 多くの検索サービスではこのような不備を補うために、 文書以外の情報(例えばその文書がどれだけ他の文書から参照されているか、 その人またはこれまでのユーザがどんな文書を参照したか、など)を使っています。 検索したいことが典型的なこと --- この例なら「VHSをDVDへ変換する」 --- ならうまくいくことも多いのですが、 そうでない場合はやはり文書の“内容”を詳しく調べたいことがあります。

このような問題に対処するための検索が意味構造検索です。 意味構造検索では検索条件として、単なるキーワードの羅列ではなく、 下図のようにそれらの間の係り受け関係も指定できます。

意味構造の例1 意味構造の例2
「DVDビデオを変換してVHSビデオを作る」 「VHSビデオを変換してDVDビデオを作る」

もちろん意味構造検索も万能の検索方法ではありません。 とくに探している文書についてユーザ自身があまりよくわからない時には、 係り受け関係まで指定できることは条件が細かすぎてかえって検索しづらいことがあります。 このことを緩和するために(そして素早く検索結果を計算するために)、 kamomeでは次のような工夫をしています。

  1. 文節そのものではなく内容語を単位として係り受けを指定する。
  2. 係り受けの方向や種類は考慮しない。

なお、 システムの名前 kamome は、産業技術総合研究所 サイバーアシスト研究センター (2001〜2004年) のそばを通る、ゆりかもめ線にちなんでいます。


意味構造について

前節で意味構造について「内容語の間の係り受け関係を指定したもの」という説明をしましたが、実はこれは正確ではありません。

一般に検索では指定したキーワードは完全に一致することが前提とされます。 つまりキーワードに「作る」という語を指定した場合、 たとえ目的の文書に「作成」や「(ひらがな書きの)つくる」という語が含まれていてもその文書は検索結果には含まれません。 これでは検索の条件として厳しすぎるので、 kamomeではキーワードを一つではなく複数指定できるようになっています。 つまり、「作る」だけでなく「作成」でも「つくる」でも一致したとみなす、 という指定ができるわけです。 以下の説明では、ユーザがもともと指定したかった“意味”や“内容”を概念とよび、 その具体例として複数指定する語を類義語とよびます。 例えば「作る」という概念を表現するために、「作る」「作成」「つくる」という複数の類義語を指定するということになります。

よって、意味構造をもう一度正確に説明しなおすと、 「kamomeにおける意味構造とは、概念を頂点、 概念間の(係り受け)関係を辺とするラベルなし無向グラフ」となります。 つまり先に掲げた例では「DVDビデオ」「変換」「VHSビデオ」「作る」などが頂点となっていましたが、 正確には下図のようになります(左側のみ掲載)。

意味構造の例3
「DVDビデオを変換してVHSビデオを作る」に対する意味構造

検索の条件をこのように指定することで、 目的の文書が「DVDビデオを変換してVHSビデオを作る」という文を含んでいる場合でも、 「DVDをコンバートしてビデオを作成する」という文を含んでいる場合でも見つけ出すことができるようになります。