特徴素の選択と集約によるDSAのためのデータ要約
スポンサーリンク
概要
- 論文の詳細を見る
情報検索において最も一般的なデータ表現である文書対用語頻度行列は, 統計的には分割表と呼ばれるデータ表現の一種であるとみなせる.分割表において行および列間の関連度を評価するための基本的な統計分析法として双対尺度法(DSA)がある.本論文では, 用語に対して分類階層があらかじめ与えられているものと仮定した上で, DSAを適用するための用語数削減の手法について検討する.具体的には, 用語選択と用語集約と呼ぶ2つのデータ要約手法を考え, 両者を比較するのための評価式を導出する.そして, 分類階層上で定義された各用語集合に対して選択と集約のいずれかを評価式から数値的に判断して適用するデータ要約手順を提案し, その有効性を実際の文書コーパスと専門用語辞書を用いて示す.
- 1998-11-30
論文 | ランダム
- 東海沖海底地震計(TKOBS)による観測結果
- 千島弧・東北日本弧会合部付近の浅発地震活動と重ね合せ発震機構--広域の験震デ-タの併合処理
- 小地震に対する空白域の形成と発生率およびb値の時間的変化--四国東部の浅発地震の例
- 地震動に及ぼす地形の影響の観測
- 四国地方におけるVp/Vsと地震活動との関連