特徴素の選択と集約によるDSAのためのデータ要約
スポンサーリンク
概要
- 論文の詳細を見る
情報検索において最も一般的なデータ表現である文書対用語頻度行列は, 統計的には分割表と呼ばれるデータ表現の一種であるとみなせる.分割表において行および列間の関連度を評価するための基本的な統計分析法として双対尺度法(DSA)がある.本論文では, 用語に対して分類階層があらかじめ与えられているものと仮定した上で, DSAを適用するための用語数削減の手法について検討する.具体的には, 用語選択と用語集約と呼ぶ2つのデータ要約手法を考え, 両者を比較するのための評価式を導出する.そして, 分類階層上で定義された各用語集合に対して選択と集約のいずれかを評価式から数値的に判断して適用するデータ要約手順を提案し, その有効性を実際の文書コーパスと専門用語辞書を用いて示す.
- 1998-11-30
論文 | ランダム
- 外国人看護師受け入れに関する研究--看護サービス利用者のニーズから見た看護の課題
- 瑞浪中継局におけるガードインターバル越えマルチパス等化器の野外実験(学生若手発表および一般)
- 地上デジタル放送の放送波中継のための合成-比較-選択に基づく最ゆう判定指向型アダプティブアレイ (地上デジタル放送ネットワーク技術 特集号)
- 地上デジタル放送の放送波中継のための合成-比較-選択に基づく最ゆう判定指向型アダプティブアレー(無線通信技術)
- 北茨城中継放送所における同一チャンネル干渉除去装置の長期野外実験(デジタル放送,デジタル設備,および一般)