単語統計情報と言語情報とを併用した新しい文書検索のモデル
スポンサーリンク
概要
- 論文の詳細を見る
近年、WWW上での情報検索システムに代表されるように、部分一致(partial match)モデルに基づく情報検索システムが実用化段階を迎えている。しかし、新聞検索・特許検索・文献検索など、比較的均一で大規模な情報に対する検索については、ランキングの適合率向上が必須である。 本稿では、部分一致モデルに基づく検索システムの適合率の向上を目的として、単語統計情報と言語情報とを併用した新しい検索モデルを提案する。我々の提案する検索モデルでは、文書/検索質問の特徴量の表現、およびそれらの照合過程に、人間の文書検索過程についての内省から得られる知見を反映させる。 また、我々は、新聞記事データを対象として、その検索モデルを実現する実験システムを構築した。実装においては、将来の実用化を意識し、索引作成速度/索引容量/検索速度の点で十分実用的なものになるように工夫した。本稿では、その実験システムの概要と、それを用いて行なった適合率の評価実験についても述べる。実験では、検索条件を注意深く入力することで、ランキングの上位において適合率が改善される可能性があることが確認された。
- 一般社団法人情報処理学会の論文
- 1996-11-21
著者
-
菅野 祐司
松下電器産業株式会社
-
稲葉 光昭
松下電器産業(株)マルチメディアシステム研究所
-
野本 昌子
松下電器産業株式会社
-
野本 昌子
松下電器産業(株)マルチメディアシステム研究所
-
野口 直彦
松下電器産業(株)マルチメディアシステム研究所
-
野口 直音
松下電器産業(株)マルチメディアシステム研究所
-
稲葉 光昭
松下電器産業(株)ネットワーク開発センター
-
菅野 祐司
松下電器産業(株)ネットワーク開発センター
関連論文
- 情報家電オントロジーの開発とマニュアルにおける利用例(情報提示・連携技術,テーマ:「テクニカルな知識流通・共有におけるドキュメント作成・管理技術,および応用」)
- 情報家電オントロジーの開発(言語資源・文書分析)
- DT-2-4 情報家電オントロジー構築と活用に向けた取組み(2) : 構成と記述ガイドライン(DT-2.身近なところで役に立ち始めたセマンティックWeb,チュートリアル講演,ソサイエティ企画)
- DT-2-3 情報家電オントロジー構築と活用に向けた取組み(1) : 機器接続事例の検索を例として(DT-2.身近なところで役に立ち始めたセマンティックWeb,チュートリアル講演,ソサイエティ企画)
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : ホームページ検索システムへの応用
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 大規模文書検索への応用
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 英語文書検索への拡張
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 関連キーワードライブラリの機能と特長
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : ランキングライブラリの機能と特長
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 辞書/索引ライブラリの機能と特長
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 概要
- 単語統計情報と言語情報とを併用した新しい文書検索のモデル
- 文書構造と共起表現を用いた文書ランキング手法 (第52回全国大会(平成8年前期 於:電通大)大会優秀賞受賞論文)
- 文書構造と共起表現を用いた文書ランキング手法
- 対応分析とベイジアンネットワークを用いた文書分類(テキストマイニング技術)
- 日本語処理基本システム(2) : 辞書検索系と構文解析系
- 日本語処理基本システム(1) : 全体構成
- 全文・構造検索両立型索引方式
- 極大単語索引と複合語辞書を用いた高精度な全文検索 : 知的検索ソフトウエアMEISTERにおける単語検索機能の改善と評価
- 日本語文書に対する新しい索引検索方式 : 試作・実験および評価
- 日本語文書に対する新しい索引検索方式 : 索引作成と検索の原理