文章中のキーワード評価値を用いたキーワードN次元空間における類似性検出
スポンサーリンク
概要
- 論文の詳細を見る
当社お客さま相談室での相談業務支援を目的とし、キーワードネットワークを用いた文書データの知的検索システムを開発し、実証試験中である。相談事例と回答事例をセットにした文書データ「受付票データベース」は、原子力、屋内配線等の10数個の分野毎にまとめられ、ユーザは、分野毎に新しい相談事例を随時追加する。文書蓄積量の増大に伴い、類似の文書が重複して含まれる可能性が生じ、データの洗練性や、検索効率低下の原因ともなる。これを未然に防ぐには文書登録時に既存のデータベースに類似の文書が存在しないことの確認が必要である。そこで、文書間の類似性を検出する等の文書分析機能が必要となってきた。本論文では、同じ様な内容を持つ文章かどうかという観点からの類似性検出に対し、文書中のキーワード評価値を用いる手法を開発し、評価を行なったので、それについて述べる。
- 一般社団法人情報処理学会の論文
- 1993-03-01