文書自動分類のための分野関連語辞書の構成
スポンサーリンク
概要
- 論文の詳細を見る
オフィスで取り扱う文書量の増大に伴い, 文書の自動分類に対する需要が増えている.本稿では, あらかじめ分野分類された文書群から名詞を抽出し, 分野内および分野間の出現確率を求めて分野関連語辞書を構築し, 自動分類を行う.具体的事例として新聞における政治, 社会などの5分野の自動分類を取上げて検討した結果, この辞書の容量は72〜82%の統計的な圧縮を行い1, 052〜3, 067語で済むこと, 分類の再現率および精度は約80%を確保できることを確認した.さらに, クラスター分析手法を使って, 辞書間の距離(非類似度係数)と分類誤り率の関係を明らかにしている.
- 一般社団法人情報処理学会の論文
- 2000-03-21
著者
関連論文
- Campus Mobile Netのトラヒック特性
- キャンパスモバイルネットのトラヒック特性 (新しい学校づくりと教育工学研究)
- キャンパスモバイルネットの特性評価
- 異分野共起を用いたベクトル空間法による文書分類
- 異分野共起を用いた文書の自動分類法に関する一検討
- 名詞頻度を使った分類用辞書の構築と評価
- 個人関心度を加味した情報検索に関する研究
- 個人の関心を利用した情報検索システム
- 文書の自動分類における分野関連語辞書の考察
- 文書自動分類のための分野関連語辞書の構成
- 文書自動分類のための分野関連語辞書の構成
- 分書自動分類における辞書間の距離と分類誤り率に関する一検討
- 分野関連語辞書を使った文書の自動分類方法
- 災害時における県域ネットワークの活用に関する一提案
- 分野分類における対象文書の内容と分類精度の関係に関する一検討
- 災害時における県域ネットワークの活用に関する一提案
- 大学の分散環境ネットワークの改善策に関する一検討
- 理科教育における教授支援システムに関する一検討