Support Vector Machineによるテキスト分類
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、Support Vector Machine(SVM)を用いたテキスト分類法を提案する。テキスト分類問題に対して学習手法を適用する場合、出現頻度の小さい単語まで考慮して学習を行なわないと、分類精度が落ちることが知られている.このため高い分類精度を実現するためには、高次元の単語ベクトルを用いなければならないが、過学習により分類精度が落ちてしまう危険性が生じる。SVMはKernel関数により非線形学習も可能であり、高次元の入力ベクトルを用いても過学習なしに最適解が得られる。SVMをテキスト分類に適用し、1.異なる次元の単語ベクトル、2.異なるKernel関数、3.異なる目的関数、の3点について比較実験を行なった。その結果、SVMがテキスト分類問題に対して有効であることが確認された。
- 1998-11-05
著者
-
平 博順
NTTコミュニケーション科学基礎研究所
-
春野 雅彦
ATR人間情報通信研究所
-
向内 隆文
日本電信電株式会社NTTサイバースペース研究所
-
向内 隆文
Nttコミュニケーション科学基礎研究所
-
春野 雅彦
Atr人間情報科学研究所
-
向内 隆文
日本電信電話株式会社NTTサイバーソリューション研究所
関連論文
- Support Vector Machineによるテキスト分類における属性選択
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- 高臨場感映像コミュニケーション (特集 フォトニクスポリマー)
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- EU Advanced Course in Computational Neuroscience 1999の報告
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- MoPaCo:単眼カメラを用いた運動視差映像コミュニケーションシステム(複合現実感,仮想都市)
- 「納得感」のある研究を目指して(編集委員今年の抱負2011)
- 決定木を用いた日本語係受け解析
- 6 バイオ自然言語処理のための機械学習技術(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 質問応答システムの比較と評価
- AAAI-99参加報告
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出, マイニング)(言語理解とコミュニケーション)
- 機械翻訳辞書構築支援ツ-ル (特集論文 日英機械翻訳技術)
- 汎用的な意味解析技術への挑戦 (特集 ポータルサービスを支える自然言語処理技術)
- TD-3-3 SVMのテキスト分類への応用(TD-3. 天下無敵のサポートベクトルマシン?)
- 生物医学文献からの遺伝子機能フレーズの抽出
- 生物医学質問応答システム(bio-QA)の提案
- 生物医学質問応答システム(bio-QA)の提案
- トランスダクティブ・ブースティング法によるテキスト分類
- テキスト分類 : 学習理論の「見本市」(情報論的学習理論とその応用)
- トランスダクティブ・ブースティング法によるテキスト分類
- DFD技術を用いたリアルタイム実写3D映像の表示(発光型/非発光型ディスプレイ合同研究会)
- 線形行列アンサンブルを用いた擬似ランダム符号化
- 独立な乱数系列生成問題について
- 機械学習の手法による自然言語処理
- 機械学習の手法による自然言語処理
- 5 対訳テキストから辞書を自動生成 (フィールドを広げる自然言語処理)
- Support Vector Machineによるテキスト分類
- DFD技術を用いたリアルタイム実写3D映像の表示
- 第4回情報論的学習理論ワークショップ
- DFD技術を用いたリアルタイム実写3D映像の表示(発光型/非発光型ディスプレイ,テーマ:ディスプレイに関する技術全般:LCD(バックライトを含む),PDP,有機/無機EL,CRT,FED,VFD,LEDなどのディスプレイに関するデバイス,部品,材料及び応用技術)
- 機械学習の手法による自然言語処理
- 阿部重夫, パターン認識のためのサポートベクトルマシン入門, pp.204, 森北出版, 2011
- DFD技術を用いたリアルタイム実写3D映像の表示
- 高橋誠, かけ算には順序があるのか(岩波科学ライブラリ), pp.128, 岩波書店, 2011
- 特集「ポスト経験主義の言語処理」にあたって
- 柔軟な端末-クラウド間連携を可能にする分散リソース活用手法の検討(LOD,メタデータ,ライフログ活用技術,オフィスインフォメーションシステム,ライフインテリジェンス,一般)
- 少ない要素で「理解」する(編集委員今年の抱負2013)
- 2-2 実写映像と距離情報による正面顔映像のリアルタイム生成に関する検討(第2部門 情報ディスプレイ,マルチメディアストレージ,コンシューマエレクトロニクス,情報センシング)
- タイトル無し
- 画像検索を用いた語義別画像付き辞書の構築