最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
スポンサーリンク
概要
- 論文の詳細を見る
Webページのリンク情報など,本文の他に付加情報を含むテキストデータの分類問題のために,付加情報を同時に用いて高精度な多クラス分類器を設計する手法を提案する.この問題に対して,従来の確率的アプローチでは,生成,識別の各アプローチと,生成,識別アプローチのハイブリッドに基づく分類器が提案されてきた.従来のハイブリッド分類器が2クラス問題を対象とするのに対して,提案法では多クラス問題を直接扱うハイブリッド分類器を与える.具体的には,データに含まれる構成要素ごとに設計した生成モデルを最大エントロピー原理に基づいて結合することで分類器を構築する.文書やWebページに含まれるテキスト,リンクの各構成要素の生成モデルとして,ナイーブベイズモデルを用いる.3つの実データを用いた分類実験により,付加情報をテキスト分類に用いる効果を確認するとともに,生成,識別アプローチでの分類精度の差が小さいほど提案法による分類精度が両アプローチを大きく上回ることを確認した.
- 社団法人情報処理学会の論文
- 2006-10-15
著者
-
斉藤 和巳
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
上田 修功
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
斉藤 和巳
静岡県立大学経営情報学部
-
斉藤 和巳
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
藤野 昭典
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
藤野 昭典
NTTコミュニケーション科学基礎研究所
-
斉藤 和巳
現在 静岡県立大学経営情報学部経営情報学科
-
上田 修功
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
上田 修功
日本電信電話株式会社
関連論文
- 購買行動解析のためのトピック追跡モデル(人工知能,データマイニング)
- ユーザの嗜好の時系列性と先行性に着目した協調フィルタリング(コンテンツ技術,Web情報システム)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 購買順序を考慮した協調フィルタリング(「自動化:推論,発見,学習,データマイニング」及び一般)
- LF_005 契約期間を延ばすためのリコメンデーション法(F分野:人工知能・ゲーム)
- 最近のベイズ理論の進展と応用[IV] : 変分ベイズ法
- ベイズ階層言語モデルによる教師なし形態素解析(言語モデル・ウェブ解析)
- 人間関係の重なりを持つコミュニティ構造の抽出(ネットワークが創発する知能)
- トラックバックネットワークに基づくSEOコミュニティの分析(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- グラフ索引構造を用いた高速類似探索(人工知能,認知科学)
- ノンパラメトリックベイズ入門(オーガナイズドセッション,コンピュータビジョンとパターン認識のための学習理論)
- ノンパラメトリックベイズ入門(オーガナイズドセッション2)
- 一括予測型協調フィルタリング
- ディリクレ混合過程モデルに基づく半教師有り学習(一般セッション,データ工学とメディア理解との融合)
- ノンパラメトリックベイズモデルによるグラフクラスタリング(一般セッション,データ工学とメディア理解との融合)
- 一括予測型協調フィルタリング(Session 1)
- ディリクレ過程混合モデルに基づく共クラスタリング (「プリファレンスモデリングと推薦システム」及び一般)
- 周辺評点分布に基づく協調フィルタリング手法における予測アルゴリズムについて(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 周辺評点分布に基づく協調フィルタリング手法における予測アルゴリズムについて
- 周辺評点分布に基づく協調フィルタリング手法(「自動化:推論,発見,学習,データマイニング」及び一般)
- 分布が変化するデータにおけるモデル学習法(データマイニング)
- 購買順序を効率的に用いた協調フィルタリング
- 契約期間を延ばすためのレコメンド法
- 契約期間を延ばすためのレコメンド法(セッション1)
- 内容と関連するタグの教師なし抽出(「Webインテリジェンス」及び一般)
- ベイズ的基準を用いた状態共有型HMM構造の選択
- 変分ベイズ法の音響モデル適応への応用
- ベイズ的アプローチに基づく状態共有型HMM構造の学習
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法(Session 1)
- テキスト自動分類のための半教師あり学習技術 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 半教師あり学習に基づく異種情報データの分類(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 半教師あり学習のための生成・識別ハイブリッド分類器の設計法
- 最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
- LI-009 生成・識別ハイブリッドモデルに基づく半教師あり学習(I分野:画像認識・メディア理解)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 文書の構成要素モデルのアンサンブル学習に基づくテキスト分類(一般)
- LF-014 文書分類体系間の対応関係の自動抽出(F. 人工知能)
- LD-001 交差確認法に基づく適合性フィードバック(D. データベース)
- 確率モデルを用いた文書分類体系間の構造マッチング(複数文書の処理)
- コーパスからのキーワード自動抽出(抽出)
- 多重トピックテキストの確率モデル : テキストモデル研究の最前線(2)
- 多重トピックテキストの確率モデル : テキストモデル研究の最前線(1)
- 指向性アタッチメントとコミュニティをもつ成長ネットワークモデル(バイオサイバネテッィクス,ニューロコンピューティング)
- 非線形施設配置問題における貪欲法の遅延評価による高速化--複数施設が確率的に貢献する場合
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 適合フィードバックにおける単語選択法(検索・多義性解消)
- 効率的な類似検索のためのピボット学習法
- ラベルありデータの選択バイアスに頑健な半教師あり学習
- LA-002 固体酸化物燃料電池における破壊ダイナミクスの可視化法(モデル・アルゴリズム・プログラミング)
- ベクトル表現可能な機械抽出トピックの定量的評価法
- ベクトル表現可能な機械抽出トピックの定量的評価法(セッション3)
- 自己組織化マップによる教師情報を用いた可視化アーキテクチャの提案 : 時系列医療データの可視化を例に(「ネットワークデータマイニング」「センサデータマイニング」)
- 自己組織化マップによる教師情報を用いた可視化アーキテクチャの提案 : 時系列医療データの可視化を例に(「ネットワークデータマイニング」「センサデータマイニング」)
- 複雑ネットワーク情報空間の没入型インタラクティブ可視化システム
- 複雑ネットワーク情報空間の没入型インタラクティブ可視化システム
- 動作認識のための状態遷移モデル : HMMの高度化と非HMM手法の成長(「時系列データの認識 : HMMを越えて」)
- 知能コンピューティングのための統計的機械学習の最新動向について
- 第2回マシンインテリジェンスに関する国際ワークショップ(International Workshop on Machine Intelligence 1993)の報告
- LF-015 高次元データに対して頑健な文書クラスタリング手法(F. 人工知能)
- 関連アブストラクト検索ツール : RAST
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- 4層パーセプトロンを用いた質的条件付き重回帰(バイオサイバネティックス,ニューロコンピューティング)
- 社会ネットワーク上の情報伝搬における強影響力ノード抽出の効率化(データマイニング)
- 重み双方向クラスタリング学習法 : 最適な共有重み構造をもつニューラルネットを求めて(バイオサイバネティックス, ニューロコンピューティング)
- 5A-6 情報伝播モデルに基づく複雑ネットワーク可視化システム(数理モデルとデータマイニング,一般セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 確率モデルに基づく文書ストリームからのホットトピック抽出の一検討(「自動化:推論,発見,学習,データマイニング」及び一般)
- D-8-7 LTモデルに基づいた情報拡散における強影響ノード群のコミュニティ分析(D-8. 人工知能と知識処理,一般セッション)
- RF-008 単一拡散系列からの期待影響度曲線の推定(F分野:人工知能・ゲーム,査読付き論文)
- RF-006 一様採用付きVoter Modelの提案(F分野:人工知能・ゲーム,査読付き論文)
- 6N-7 拡散データからのモデル推定による期待影響度の予測(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 4N-3 時間遅れパラメータ付きSISモデルの期待影響度分析(数理モデルとシミュレーション,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- F-056 ネットワーク構造による類似探索性能の分析法の提案(F分野:人工知能・ゲーム,一般論文)
- RF-007 オブジェクト集合に依存したRNGの特性分析(F分野:人工知能・ゲーム,査読付き論文)
- ベイズ的基準を用いた状態共有型HMM構造の選択
- ベイズ的基準を用いた状態共有型HMM構造の選択
- ベイズ的アプローチに基づく状態共有型HMM構造の学習
- ディリクレ混合過程モデルに基づく半教師有り学習(一般セッション,データ工学とメディア理解との融合)
- ノンパラメトリックベイズモデルによるグラフクラスタリング(一般セッション,データ工学とメディア理解との融合)
- 多値読みとり図面の画質改善手法の検討
- 時間依存関係データ分析のための動的無限関係モデル
- 時間変化に対応する無限関係モデルの提案
- トピックモデルに基づく文書群の可視化
- 購買順序を効率的に用いた協調フィルタリング
- 購買順序を効率的に用いた協調フィルタリング
- パラメトリック埋め込み法を用いた分類器の視覚的解析(知識処理,インタラクションの理解とデザイン)
- D-032 最大エントロピー法に基づく推薦システムでのユーザ行動のモデル化(D分野:データベース)
- ノンパラメトリックベイズに基づく複数対象時系列のクラスタリングとトラッキング(人工知能,認知科学)
- D-040 ネットワーク索引構造を用いた類似探索と可視化(データベース,一般論文)
- ノンパラメトリックベイズモデル
- アンサンブル学習(CVにおけるパターン認識・学習理論の新展開)
- 準教師有り学習の理論とアルゴリズム(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 準教師有り学習の理論とアルゴリズム(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- ベイズ学習のアルゴリズム : 高次元積分の近似手法(統計モデルと学習の数理)
- アンサンブル学習 : 識別器の識別性能向上法および情報統合の数理(オーガナイズドセッション(1))(CVのためのパターン認識・学習理論の新展開)
- 多重トピックを表現するテキストモデルの一考察(テキスト分類・トピック解析)
- 多重トピックテキストの確率モデル : パラメトリック混合モデル(バイオサイバネティックス,ニューロコンピューティング)
- Latent Dirichlet Allocationを用いた潜在的構造変化検知(ベイズ統計モデル,統計推理,データベース,一般)