複合語マッチングによる情報検索
スポンサーリンク
概要
- 論文の詳細を見る
ネットワークの発展により, 一般ユーザが大規模データベースに対して検索を行う機会が増えている. 多くの場合ユーザが望む出力数は限られているので, 文書に対し綿密な重要度付与を行ってランクづけすることが必要である. 本発表では, 語が複合して意味のまとまりをつくることに着目し, 複合語を単位とした類似度計算を行うことによって柔軟なスコアリングを行う手法を提案する. 日本語は, 複合語が多く現れる言語である. 複合語は全体で一つの概念を表現しているので, 文書の特徴量を考える際には, 複合語を構成する個々の単語ではなく複合語自身を用いることが望ましいと考えられる. しかし, 文書をランキングするために広く用いられているベクトル空間モデルは, ベクトルの要素として単語の重みを用いている. 我々はこれを拡張し, 複合語の部分マッチに対するスコアを定義することにより, 擬似的に基本量を複合語に格上げし, より文書の特徴を的確に捉えることを試みた.
- 一般社団法人情報処理学会の論文
- 1997-03-12
著者
関連論文
- アーバンセンシング基盤に向けて(センシングネットワーク:目的指向編)
- 2P-8 ソーシャルブックマークにおけるスパムの検出(Webマイニング,学生セッション,データベースとメディア)
- シナリオ文書からの存在・行動マップの作成とその応用
- 複数マニュアルの自動ハイパーテキスト化における類似度計算手法について
- 自動ターム抽出における重み付け方法の比較
- 日本語マニュアルの内容検索システム
- 情報検索手法を利用した関連マニュアル群のハイパーテキスト化 (新しいシステムソフトウェア)
- 電子化マニュアルにおける自動ハイパーテキスト化手法
- シナリオを用いたドラマのシーン検索システム
- 3S-6 Webからのメタファ抽出方式(情報抽出,学生セッション,人工知能と認知科学)