日本語文書に対する新しい索引検索方式 : 索引作成と検索の原理
スポンサーリンク
概要
- 論文の詳細を見る
近年,実用化が進んでいる大規模な全文検索システムにおいては,単純な文字列枚索では高速化に限界があるため,文字成分表などのシグニチャファイル方式,あるいはn-gramによる転置ファイル方式などの高速化手法が提案されている.更に高速化を図るためには,n-gramではなく,検索文字列として意味のある通常の単語による転置ファイルを用いることが考えられるが,膠着語である日本語文書に対してその手法を適用しようとすると,形態素解析などの単語切り出しを行なわねばならず,その単語切り出しが完全に行なわれない限り,検索もれが避けられない.筆者らは,上の問題を解決する,検索もれのない単語索引検索方式を考案した.本方式では,単語による索引ファイルを構成するため,n-gramによる転置ファイルに比べて,原理的に高速化が可能であり,更に索引ファイルの容量も低減できる.本稿では,その単語索引作成方法と索引検索方法の原理について報告する.
- 一般社団法人情報処理学会の論文
- 1995-03-15
著者
-
菅野 祐司
松下電器産業株式会社
-
稲葉 光昭
松下電器産業(株)マルチメディアシステム研究所
-
野口 直彦
松下電器産業(株)マルチメディアシステム研究所
-
倉知 一晃
松下電器産業(株) マルチメディアシステム研究所
-
稲葉 光昭
松下電器産業(株)ネットワーク開発センター
-
菅野 祐司
松下電器産業(株)ネットワーク開発センター
関連論文
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : ホームページ検索システムへの応用
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 大規模文書検索への応用
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 英語文書検索への拡張
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 関連キーワードライブラリの機能と特長
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : ランキングライブラリの機能と特長
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 辞書/索引ライブラリの機能と特長
- 極大単語索引を用いた知的検索ソフトウェアMEISTER : 概要
- 単語統計情報と言語情報とを併用した新しい文書検索のモデル
- 文書構造と共起表現を用いた文書ランキング手法 (第52回全国大会(平成8年前期 於:電通大)大会優秀賞受賞論文)
- 文書構造と共起表現を用いた文書ランキング手法
- 対応分析とベイジアンネットワークを用いた文書分類(テキストマイニング技術)
- 日本語処理基本システム(2) : 辞書検索系と構文解析系
- 日本語処理基本システム(1) : 全体構成
- 全文・構造検索両立型索引方式
- 極大単語索引と複合語辞書を用いた高精度な全文検索 : 知的検索ソフトウエアMEISTERにおける単語検索機能の改善と評価
- 日本語文書に対する新しい索引検索方式 : 試作・実験および評価
- 日本語文書に対する新しい索引検索方式 : 索引作成と検索の原理