固有名詞分類属性を利用した情報検索
スポンサーリンク
概要
- 論文の詳細を見る
インターネットが広く普及し大量のテキストデータへのアクセスが可能となった。テキストデータが爆発的に増大するにつれ, 高精度な情報検索技術への要求が高まっている。検索キーが多義語の場合, ユーザの意図に適合しない大量の検索結果を得る問題がある。これに対し, 検索精度を高めるために, 共起語を多義の絞り込みに用いる手法がよく知られている。また, 検索対象テキストを意味構造化し, 単語の役割を考慮してクエリとの照合を行い検索意図の多義を解消する研究がある。しかし, 検索キーが多義の場合, 多義を絞り込む制約情報をユーザが与えないと精度の改善は厳しい。従来法では, 例えばテニス選手の「グラフ」を検索する場合に, 単に「グラフ」という検索キーでは検索結果に多義によるゴミが発生するので, ユーザは「グラフ選手」や「グラフANDテニス」のように検索条件を増やすことになる。これとは別な視点から制約情報を与える方法も考えられる。例えば「グラフ:人名」のような与え方である。本稿では, 検索キーに多義を絞り込むための制約情報として分類属性を与えることによる高精度な検索方式を提案する。設定すべき分類属性として今回は, 固有名詞分類属性を取り上げた。固有名詞は文章の特徴になりやすく検索時の絞り込みの効果が期待できること, 固有名詞分類属性はユーザにとって比較的容易に付与できてシステム面でも実現できる見込みが高いことなどから固有名詞に着目した。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
-
福島 俊一
NECヒューマンメディア研究所
-
福島 俊一
Nec情報通信メディア研究本部インターネットシステム研究所
-
山田 洋志
Nec第二システム事業本部オープン共通システム開発部
-
竹元 義美
日本電気特許技術情報センター情報サービス事業部インフォメーションサービス部
-
山田 洋志
NECヒューマンメディア研究所
-
竹元 義美
NECヒューマンメディア研究所
関連論文
- 日本語新聞記事からの固有名詞情報抽出
- ペン校正支援システム
- Webページの重要度ファクタに関する一考察
- 口語的表現を含む日本語文の形態素解析の実現と評価
- 口語的表現を含む日本語文の形態素解析の実現と評価
- 口語的表現を含む日本語文の形態素解析
- 日本語文書校正支援システムSt.WORDS
- 冗長分散格納によるPCクラスタ上の動的負荷均衡化
- 校正支援システムSt.WORDSの文書検査機能
- 辞書およびパターンマッチルールの増強と品質強化に基づく日本語固有表現抽出
- Webページからのタイプ別情報抽出・分類方式
- Webページからのタイプ別情報抽出・分類方式
- 1N-3 日本語テキストからの固有表現抽出システムの開発と評価
- 2P-2 近接演算による数値情報検索の精度改善
- 1U-3 テキスト中の数値表現を用いた情報検索方式の評価
- 数値情報を用いたテキスト検索方式の提案と評価
- インターネット多角的検索システムOTROS : データベースを用いたクエリ展開方式の提案
- インターネット多角的検索システムOTROS : 数値情報の抽出と検索
- インターネット多角的検索システムOTROS : 全体の概要と構成
- 固有名詞分類属性を利用した情報検索
- 予測ペン入力インタフェースとその手書き操作削減効果
- 予測ペン入力インタフェースとその手書き操作削減効果
- ペンベース文書作成(2) : 予測ペン入力方式
- ペンベース文書作成(1) : 試作システム
- 入力文字列予測表示を導入した日本語文章の入力法
- 自然言語処理を用いたペン入力効率向上手法の提案
- 大語彙かな漢字変換 : 未登録語と区切り誤りの減少
- WWW情報検索技術と評価の問題(情報検索システムの力くらべ : テストコレクションによる評価)
- 4P-9 組合せ情報フィルタ方式の信頼度を用いた精度改良
- 文書タイプ分類による問題解決向きWWW検索システムの開発と評価
- インターネット多角的検索システムOTROS : 構造的特徴量によるタイプ分類と検索
- 日本語全文検索における文字組ベースのランキングの評価
- 文字ベース凝縮テキストによる全文検索方式の評価
- 大規模テキスト並列検索エンジンRetrievalExpress (2) : 構造化テキスト検索方式
- 大語彙辞書を用いたかな漢字変換についての考察
- 文書作成履歴を利用した校正支援機能
- FEP型校正支援システムの試作