大量の文書データから自動抽出した名詞間共起関係による文書の自動分類
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,大量の文書データベースから自動抽出した名詞間共起関係を利用した文書の自動分類手法について述べる.朝日新聞一年分のデータから名詞を抽出し,同一記事内の名詞間共起に基づいて各名詞に対応する特徴ベクトルを自動的に生成し,この特徴ベクトルを用いて新聞の記事を自動的に分類する手法を開発した.この手法を用いた分類を人手による分類と比較したところ,特徴ベクトルの次元数を1024とした場合,人間にとって分類の易しい記事については本手法で90%以上正しく分類され,人間にとって分類の難しい記事についても本手法で70%程度の正解率が得られることが確認された.
- 一般社団法人情報処理学会の論文
- 1993-11-19
著者
-
上田 徹
シャープ(株)応用システム研究所
-
外川 文雄
シャープ(株)応用システム研究所内新機能シャープ研究室
-
湯浅 夏樹
シャープ(株)応用システム研究所
-
湯浅 夏樹
Rwcp 新機能シャープ研究室 シャープ(株)応用システム研究所内
-
外川 文雄
RWCP 新機能シャープ研究室 シャープ(株)応用システム研究所内
関連論文
- 仮想の人を介した対話型インタフェース
- 音のリズム抽出による表示タイミング制御
- SA-6-3 音のリズム抽出による表示タイミング制御(SA-6. メディア変換・統合技術とヒューマンコミュニケーション,シンポジウム)
- 繰り返しを利用した音声要約の有用性検討
- 大量文書データ中の単語間共起を利用した文書分類
- 大量の文書データから自動抽出した名詞間共起関係による文書の自動分類
- 9)Poly-Si TFT LCDにおける絵素微小化(〔情報入力研究会情報ディスプレイ研究会コンシューマエレクトロニクス研究会〕合同)
- Poly-Si TFT LCDにおける絵素微小化
- マルチモーダル対話データベースに基づく音声と身振りの認識系統合モデル
- 概念識別子の頻度分布を利用した文書分類
- 複数カメラによる顔の向きの識別