言葉の関連性による文書の類似検索 : ―小倉百人一首を分類・分析する―
スポンサーリンク
概要
- 論文の詳細を見る
類似検索や概念検索の基本的な手法は,語の出現頻度や文書を構成する単語間の相関関係を解析し,内容の類似性を判断して目的の文書を探し出す。「親近性尺度による単語の距離」,「近接的共起発生による単語の類似度」,「検索語に対する文書の重要度」,「検索文書の適合度と文書間の類似度」の四つの類似検索技術を「百人一首」に適用し,評価する。類似検索の手法は,同義語やシソーラスによる知的検索に近く,知識辞書や概念辞書の自動構築と精度向上が課題となる。また,文書検索における適合性や類似性は,検索者の検索目的や価値観により異なるため,検索結果の関連度や類似度の判断材料と判断理由の説明が重要となる。
- 独立行政法人 科学技術振興機構 研究基盤情報部の論文
著者
関連論文
- WordMiner : テキスト型データ解析ソフトウェアの概要と追加処理機能
- テキスト型データのマイニング : 定性調査におけるテキスト・マイニングをどう考えるか(非定型データ分析の可能性)
- WordMiner : テキスト型データ解析ソフトウェア : その設計指針と適用可能性
- テキスト・マイニングの概要
- テキスト型データ解析ソフトウェアWordMiner (テキストマイニング(Part2))
- テキスト型データ解析ソフトウェア-WordMiner-のご紹介(デモセッション)(日本計算機統計学会第16回大会報告)
- テキストマイニングの技術と適用性 (特集:テキストマイニング)
- テキスト型データ解析ソフトウェア-WordMiner-のご紹介(ソフトウェアデモンストレーション)
- 教育実践報告 内容分析を用いた臨地実習における学習達成の自己評価と指導者評価の分析
- 言葉の関連性による文書の類似検索 : ―小倉百人一首を分類・分析する―
- 情報の電子化技術−入門から応用まで : プレゼンテーション技術
- 情報の電子化技法−入門から応用まで : ディジタルコンテンツの作成技法−HTML−