最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,与えられたトピック集合の中から文書が該当するトピックを全て選びだす多重トピック文書の自動分類にたいして,最大マージンラベリング法と呼ぶ新しい学習手法を提案する.文書多重ラベリングにおいては,トピックの任意の組合せ(ラベル)を独立したクラスとみなした多クラス分類学習を行うことにより,より精度の高いラベリングが実現できると期待される.しかし文書分類に代表される多重ラベリングの実問題においては,ラベルあたりのサンプル数の減少にともなう過学習が問題となり,こうした試みは実際にはなされてこなかった.提案手法では,各ラベルを高次元空間に埋め込んだ後にその空間でのマージンを最大化することにより,過学習を押え精度の良い多重ラベリングを実現する.実際に,Web文書の文書多重ラベリングを対象として,Parametric Mixture Model[1],BoosTexter[2],SVM[3],最近傍法といった様々な種類の従来手法との比較実験をおこない,提案手法がより高精度なラベリングをより少ない訓練データで実現できることを実証した.
- 2004-09-16
著者
-
前田 英作
NTTコミュニケーション科学基礎研究所知能情報研究部
-
前田 英作
日本電信電話株式会社NTTコミュニケーション科学基礎研究所人間情報研究部
-
賀沢 秀人
NTTコミュニケーション科学基礎研究所
-
平 博順
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
平 博順
NTTコミュニケーション科学基礎研究所
-
泉谷 知範
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
-
泉谷 知範
NTTコミュニケーション科学基礎研究所
-
前田 英作
NTTヒューマンインタフェース研究所
-
前田 英作
Nttコミュニケーション科学基礎研究所
-
賀沢 秀人
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
前田 英作
Ntt
-
泉谷 知範
Ntt コミュニケーション科学基礎研
関連論文
- Support Vector Machineによるテキスト分類における属性選択
- SVM (Support Vector Machine)を用いた大腸癌の組織分化度における遺伝子発現プロファイル解析
- パーティクルフィルタとこう配法の組合せによる頭部姿勢と表情の同時推定(メディア処理,画像の認識・理解論文)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3)
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活動と自然言語処理」その他一般)
- 最大マージン原理にもとづく多重トピック文書の自動分類(フィルタリング、文書分類)(テーマ:「Webマイニングによる情報活用と自然言語処理」その他一般)
- DSIUシステム : Decision Support for Internet Users : ネット情報を使ってホットなものをあなたに (近未来チャレンジ)
- カーネル法 : 基礎と応用(手,顔,身体表現の認識,理解)
- 単一言語コーパスにおける文の自動対応付け手法(自然言語)
- 階層非循環有向グラフカーネル(情報論的学習理論論文)
- SVMを用いた学習型質問応答システムSAIQA-II(自然言語)
- 単語属性N-gramと統計的機械学習による質問タイプ同定(自然言語)(「インタラクション:理論,技術,応用,評価」)
- 言語パターンに着目した複数文書要約(要約)
- 言語パターンに着目した複数文書要約(言語理解とコミュニケーション)
- 言語パターンに着目した複数文書要約
- 素性選択機能をもったString Kernelの提案(パタン発見)(セマンティックウェブと自然言語処理その他一般)
- 素性選択機能をもった String Kernel の提案
- 階層構造を利用したテキスト間類似度の効率的計算法
- LE-10 統計的機械学習を用いた質問タイプ同定(E. 自然言語・文書)
- SAIQA : 大量文書に基づく質問応答システム
- SAIQA : 大量文書に基づく質問応答システム
- 最大マージン原理に基づく多重ラベリング学習(自然言語処理)
- 文書要約の自動評価手法の提案と評価(セグメンテーション・要約)
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出,マイニング)
- 1M-4 テキスト構造の持つ意味に着目した推論規則獲得法
- 環境変動にロバストな物体有無判定法
- ネット情報を使った意思決定支援DSIUでの知識獲得技術(近未来チャレンジ特集)
- 第6回 : インターネットと知識推論
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 保有知識の確信度に基づく対話型映像認識理解システムの質問生成戦略(テーマセッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- 「納得感」のある研究を目指して(編集委員今年の抱負2011)
- カーネル非線形部分空間法によるパターン認識 (パターン認識のための学習 : 基礎と応用)
- 文書要約における抽出単位と評価法についての考察(要約)
- 対話データの統計量を用いたPOMDPによる対話制御(対話,第11回音声言語シンポジウム)
- 対話データの統計量を用いたPOMDPによる対話制御
- まつしゅるーむの世界 : 環境知能の実現
- まっしゅるーむの世界--知能統合の実現に向けて (特集 コミュニケーション環境の未来に向けた研究最前線)
- 環境知能の実現に向けた分野横断型研究の試み : 新しい「環境」における新しい「知」へ(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- 環境知能の実現に向けた分野横断型研究の試み : 新しい「環境」における新しい「知」へ(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 環境知能の実現に向けた分野横断型研究の試み : 新しい「環境」における新しい「知」へ(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 妖精・妖怪の復権 : 新しい「環境知能」像の提案(優秀論文賞,情報処理学会創立45周年記念「50年後の情報科学技術をめざして」記念論文)
- R&Dホットコーナー 「環境知能」の実現に向けて
- 変動輝度テンプレートによる頭部姿勢と表情の同時推定
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 表情認識のための変動輝度テンプレートとその頭部姿勢変動に対する頑健性の一検討(テーマ関連セッション3,顔・ジェスチャの認識・理解)
- 2)両眼像融合に関する検討(〔情報ディスプレイ研究会視聴覚技術研究会画像通信システム研究会〕合同)
- 両眼像融合に関する検討 : 情報ディスプレイ視聴覚技術画像通信システム(視覚と画質特集)
- 両眼像融合に関する一検討
- 環境知能のすすめ(オーガナイズドセッション,アンビエント環境知能)
- 環境知能のすすめ(オーガナイズドセッション,アンビエント環境知能)
- 環境知能のすすめ(オーガナイズドセッション)
- カーネル法 : 基礎と応用(手,顔,身体表現の認識,理解)
- カーネル法 : 基礎と応用
- 連載を終えて(これからの情報処理学会)
- LH-003 変動輝度テンプレートを用いた頭部姿勢変動に頑健な確率的表情認識手法(画像認識・メディア理解)
- 阿部圭一(著), 明文術 伝わる日本語の書きかた, NTT出版(株), 189p., 1,890円(税込), ISBN4-7571-0196-1
- 6 バイオ自然言語処理のための機械学習技術(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 0 編集にあたって(ポストゲノム時代に高まるバイオ自然言語処理への期待 : バイオ自然言語処理最新事情)
- 音声インタラクティブODQAの構築とその評価
- 質問応答システムの比較と評価
- E-6 固有表現を利用した大量文書の時系列ブラウジング法(要約・情報検索,E.自然言語・文書)
- AAAI-99参加報告
- 生物医学文献からの遺伝子機能フレーズの抽出(抽出, マイニング)(言語理解とコミュニケーション)
- 汎用的な意味解析技術への挑戦 (特集 ポータルサービスを支える自然言語処理技術)
- TD-3-3 SVMのテキスト分類への応用(TD-3. 天下無敵のサポートベクトルマシン?)
- 生物医学文献からの遺伝子機能フレーズの抽出
- 生物医学質問応答システム(bio-QA)の提案
- 生物医学質問応答システム(bio-QA)の提案
- トランスダクティブ・ブースティング法によるテキスト分類
- テキスト分類 : 学習理論の「見本市」(情報論的学習理論とその応用)
- トランスダクティブ・ブースティング法によるテキスト分類
- 正規化主成分特徴量を利用した物体抽出法とその定量的評価
- Support Vector Machineを用いた重要文抽出法(自然言語)
- 機械学習による複数文書からの重要文抽出
- LE-11 機械学習を用いた複数文書要約(E. 自然言語・文書)
- SVMに基づく固有表現抽出の高速化
- アクション継続長制御を利用するPOMDP対話制御
- Support Vector Machineによるテキスト分類
- 文書要約における抽出単位と評価法についての考察(言語理解とコミュニケーション)
- 対話型映像認識理解における動的学習戦略に関する取り組み(テーマセッション,PRMUのフロンティア・グランドチャレンジ)
- POMDPによるTrigram対話制御(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- POMDPによるTrigram対話制御(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- TD-3-2 なぜSVMを使うのか? : ユーザーから見た利点(TD-3. 天下無敵のサポートベクトルマシン?)
- 順位づけ学習問題 : 順位つきサンプルを用いた順序関係推定
- 順位づけ学習問題 : 順位つきサンプルを用いた順序関係推定
- 画像の認識・理解論文特集の発行にあたって(画像の認識・理解論文)
- 日本語語義曖昧性解消のための訓練データの自動拡張
- 阿部重夫, パターン認識のためのサポートベクトルマシン入門, pp.204, 森北出版, 2011
- 擬人化エージェントとの音声対話時におけるユーザの非言語動作からの難/易及び興味/退屈の推定(ユーザ状態推定,人とエージェントのインタラクション論文)
- 対話行為タイプ列Trigramによる行動予測確率に基づくPOMDP対話制御(対話生成,人とエージェントのインタラクション論文)
- アクティブ探索法の探索効率と探索精度に関する一考察
- アクティブ探索法の探索効率と探索精度に関する一考察
- 高橋誠, かけ算には順序があるのか(岩波科学ライブラリ), pp.128, 岩波書店, 2011
- 人ロボット共生におけるコミュニケーション戦略の生成
- 特集「ポスト経験主義の言語処理」にあたって
- 少ない要素で「理解」する(編集委員今年の抱負2013)
- ノンパラメトリックベイズアプローチに基づく音響イベント検出(テーマセッション,自然言語とパターン認識の境界)
- ノンパラメトリックベイズアプローチに基づく音響イベント検出(テーマセッション,自然言語とパターン認識の境界)
- D-12-98 視体積交差法を用いた複数カメラからの人数推定に関する検討(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス))
- 画像検索を用いた語義別画像付き辞書の構築