特徴素の選択と集約によるDSAのためのデータ要約
スポンサーリンク
概要
- 論文の詳細を見る
情報検索において最も一般的なデータ表現である文書対用語頻度行列は, 統計的には分割表と呼ばれるデータ表現の一種であるとみなせる.分割表において行および列間の関連度を評価するための基本的な統計分析法として双対尺度法(DSA)がある.本論文では, 用語に対して分類階層があらかじめ与えられているものと仮定した上で, DSAを適用するための用語数削減の手法について検討する.具体的には, 用語選択と用語集約と呼ぶ2つのデータ要約手法を考え, 両者を比較するのための評価式を導出する.そして, 分類階層上で定義された各用語集合に対して選択と集約のいずれかを評価式から数値的に判断して適用するデータ要約手順を提案し, その有効性を実際の文書コーパスと専門用語辞書を用いて示す.
- 1998-11-30
論文 | ランダム
- International Workshop on Mathematical Fluid Dynamics
- デジタル絵本の制作
- 磁気と磁性体の清酒酵母におよぼす殺菌作用
- 子供の養育・しつけに関する家庭機能の現状と問題
- ダイズの低リノレン酸突然変異体M-5のリノレン含量の遺伝