名詞頻度を使った分類用辞書の構築と評価
スポンサーリンク
概要
- 論文の詳細を見る
本論文は, あらかじめ分野分類された文書群から名詞を抽出し, 分野内及び分野間の名詞の出現頻度をもとにしたTF法を使って分野関連語辞書を作り, 自動分類を行う.具体的事例として新聞における政治, 社会などの5分野の自動分類を取上げて検討した結果, 辞書の60%の次元削減で分類再現率及び精度は平均86%であり、しかも90%の次元削減でもあまり特性が劣化しないことを示す.またDF法, TF・IDF法及び分野頻度に着目したTF・ICF法などの主な次元削減手法との定量的な比較を行い, 著者らの提案手法が他方式と同等以上の次元消滅効果が得られることを明らかにする.更に, 分類対象の文書と辞書作成時期が6か月離れていても辞書が有効であること、及びクラスタ分析手法を使って, 辞書間の距離(非類似度係数)と分類誤り率の関係など, 本手法の適用限界を明らかにする.
- 2001-02-01
著者
関連論文
- Campus Mobile Netのトラヒック特性
- キャンパスモバイルネットのトラヒック特性 (新しい学校づくりと教育工学研究)
- キャンパスモバイルネットの特性評価
- 関連語辞書を利用した文書の自動分類における分類精度に関する一検討
- 異分野共起を用いたベクトル空間法による文書分類
- 異分野共起を用いた文書の自動分類法に関する一検討
- 個人関心度を加味した分散データベース検索の考察
- 関連語辞書を使った文書の自動分類に関する一提案
- あいまい検索機能を持ったデータベースシステムに関する一検討
- 名詞頻度を使った分類用辞書の構築と評価
- 動作スキーマによるヒューマンインタフェースの改良検討
- 電話転送における視点支援に関する一実験
- 視点に着目したヒューマンインタフェース向上の一提案
- グループウエアにおける視点支援の一考察
- 個人関心度を加味した情報検索に関する研究
- 個人の関心を利用した情報検索システム
- 文書の自動分類における分野関連語辞書の考察
- 文書自動分類のための分野関連語辞書の構成
- 文書自動分類のための分野関連語辞書の構成
- 分書自動分類における辞書間の距離と分類誤り率に関する一検討
- 分野関連語辞書を使った文書の自動分類方法
- 災害時における県域ネットワークの活用に関する一提案
- 分野分類における対象文書の内容と分類精度の関係に関する一検討
- 災害時における県域ネットワークの活用に関する一提案
- 大学の分散環境ネットワークの改善策に関する一検討
- 動作スキーマによるヒューマンインタフェースの改良検討
- 理科教育における教授支援システムに関する一検討
- 個人関心度を加味した情報検索システムの評価に関する一検討
- コンピュータ環境におけるファイル間の関連性に関する一検討
- メモリダイヤル登録操作におけるヒューマンインタフェースに関する一検討
- テキスト文書のキーワード抽出における不要語削除方法に関する検討
- 物理教育における教授支援システムに関する一検討
- コンピュータ環境におけるファイル管理に関する一提案
- テキスト文書におけるキーワード抽出方法に関する一検討