分類の評価や特異文書の検出のための文書群の構造可視化(複数文書の処理)
スポンサーリンク
概要
- 論文の詳細を見る
カテゴリー分類された文書群に対し、カテゴリー問の関係の理解、分類の評価、および特異文書の検出を目的とした、大規模文書群にも適用可能な効率的な可視化手法を提案する。特異文書とは、既存のどのカテゴリーにも属さないと考えられる文書を意味する。提案法では、カテゴリー情報とコンテンツ情報から文書生成モデルを学習する。そして、各カテゴリーに属する確率と、どのカテゴリーにも属さない確率を推定し、事後確率ベクトルを求める。次いで、事後確率ベクトル値をできるだけ保存するように2次元または3次元のユークリッド空間に埋め込むことにより、分類文書群を可視化する。提案法は計算コストの面でも効率的である。カテゴリー分類されたウェブページを用いて提案法の有効性を示す。
- 2004-05-13
著者
-
岩田 具治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
斉藤 和巳
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
上田 修功
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
関連論文
- 購買行動解析のためのトピック追跡モデル(人工知能,データマイニング)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 購買順序を考慮した協調フィルタリング(「自動化:推論,発見,学習,データマイニング」及び一般)
- LF_005 契約期間を延ばすためのリコメンデーション法(F分野:人工知能・ゲーム)
- 人間関係の重なりを持つコミュニティ構造の抽出(ネットワークが創発する知能)
- トラックバックネットワークに基づくSEOコミュニティの分析(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- グラフ索引構造を用いた高速類似探索(人工知能,認知科学)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦 (ライフインテリジェンスとオフィス情報システム)
- 分布が変化するデータにおけるモデル学習法(データマイニング)
- 購買順序を効率的に用いた協調フィルタリング
- 契約期間を延ばすためのレコメンド法
- 契約期間を延ばすためのレコメンド法(セッション1)
- 内容と関連するタグの教師なし抽出(「Webインテリジェンス」及び一般)
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法(Session 1)
- テキスト自動分類のための半教師あり学習技術 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 半教師あり学習に基づく異種情報データの分類(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 半教師あり学習のための生成・識別ハイブリッド分類器の設計法
- 最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
- LI-009 生成・識別ハイブリッドモデルに基づく半教師あり学習(I分野:画像認識・メディア理解)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 文書の構成要素モデルのアンサンブル学習に基づくテキスト分類(一般)
- LF-014 文書分類体系間の対応関係の自動抽出(F. 人工知能)
- LD-001 交差確認法に基づく適合性フィードバック(D. データベース)
- 確率モデルを用いた文書分類体系間の構造マッチング(複数文書の処理)
- コーパスからのキーワード自動抽出(抽出)
- 多重トピックテキストの確率モデル : テキストモデル研究の最前線(2)
- 混合モデルを用いた異常値の可視化
- 多項分布に基づく自己組織化マップの特性評価
- 教師情報を導入したSOM学習モデル
- 多重トピックテキストの確率モデル : テキストモデル研究の最前線(1)
- 指向性アタッチメントとコミュニティをもつ成長ネットワークモデル(バイオサイバネテッィクス,ニューロコンピューティング)
- K-004 学習者の視点に基づく協調学習履歴の構造化(K分野:教育工学・福祉工学・マルチメディア応用)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- QAコミュニティにおける複数情報源を用いた効果的な質問推薦
- 複雑ネットワーク情報空間の没入型インタラクティブ可視化システム
- 複雑ネットワーク情報空間の没入型インタラクティブ可視化システム
- 4層パーセプトロンを用いた質的条件付き重回帰(バイオサイバネティックス,ニューロコンピューティング)
- 重み双方向クラスタリング学習法 : 最適な共有重み構造をもつニューラルネットを求めて(バイオサイバネティックス, ニューロコンピューティング)
- 多層パーセプトロンを用いた区分的多項式回帰(一般)(ニューロインフォーマティックスとは何か)
- ニューラルネットを用いたテキストの特徴語抽出
- 多層パーセプトロンを用いた区分的多項式回帰
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦(不均質なライフログからのデータマイニング及び一般)
- 5A-6 情報伝播モデルに基づく複雑ネットワーク可視化システム(数理モデルとデータマイニング,一般セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 確率モデルに基づく文書ストリームからのホットトピック抽出の一検討(「自動化:推論,発見,学習,データマイニング」及び一般)
- D-8-7 LTモデルに基づいた情報拡散における強影響ノード群のコミュニティ分析(D-8. 人工知能と知識処理,一般セッション)
- RF-008 単一拡散系列からの期待影響度曲線の推定(F分野:人工知能・ゲーム,査読付き論文)
- RF-006 一様採用付きVoter Modelの提案(F分野:人工知能・ゲーム,査読付き論文)
- 6N-7 拡散データからのモデル推定による期待影響度の予測(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 4N-3 時間遅れパラメータ付きSISモデルの期待影響度分析(数理モデルとシミュレーション,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 文書ストリームからのホットトピック抽出を目的としたSR法の拡張
- 成長ネットワークにおける情報伝搬モデルを用いたリンク予測
- 文書ストリームからのホットトピック抽出を目的としたSR法の拡張
- 成長ネットワークにおける情報伝搬モデルを用いたリンク予測
- H-021 ファッション雑誌を用いたコーディネート推薦システム(H分野:画像認識・メディア理解,一般論文)
- F-056 ネットワーク構造による類似探索性能の分析法の提案(F分野:人工知能・ゲーム,一般論文)
- RF-007 オブジェクト集合に依存したRNGの特性分析(F分野:人工知能・ゲーム,査読付き論文)
- F-014 社会ネットワーク上での情報拡散データの分析(人工知能・ゲーム,一般論文)
- F-013 SISモデルの影響度とコミュニティ構造の関係分析(人工知能・ゲーム,一般論文)
- F-012 社会ネットワークの構造と情報拡散モデルの関係分析(人工知能・ゲーム,一般論文)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識(言語モデル・システム,第10回音声言語シンポジウム)
- 文書トピックに関する認知科学的実験 (特集:「アクティブマイニング」および一般) -- (セッション3 Webマイニング)
- コミュニティーをもつ成長ネットワークモデル
- 時間依存関係データ分析のための動的無限関係モデル
- IJCAI-09
- 時間変化に対応する無限関係モデルの提案
- 推薦システム研究を振り返る(平成20年度論文賞の受賞論文紹介)
- トピックモデルに基づく文書群の可視化
- 購買順序を効率的に用いた協調フィルタリング
- 購買順序を効率的に用いた協調フィルタリング
- パラメトリック埋め込み法を用いた分類器の視覚的解析(知識処理,インタラクションの理解とデザイン)
- D-032 最大エントロピー法に基づく推薦システムでのユーザ行動のモデル化(D分野:データベース)
- D-040 ネットワーク索引構造を用いた類似探索と可視化(データベース,一般論文)
- パラメトリック埋め込み法によるクラス構造の可視化(データマイニング・データウェアハウス)
- パラメトリック埋め込み法によるWeb検索結果のトピック可視化 (特集:「アクティブマイニング」および一般) -- (セッション3 Webマイニング)
- LF-013 事後確率構造の可視化(F. 人工知能)
- 多重トピックを表現するテキストモデルの一考察(テキスト分類・トピック解析)
- 分類の評価や特異文書の検出のための文書群の構造可視化(複数文書の処理)
- 多重トピックテキストの確率モデル : パラメトリック混合モデル(バイオサイバネティックス,ニューロコンピューティング)
- 類似テキスト検索のための多重トピックテキストモデル
- 金融データからのニューラルネットを用いた知識発見
- 機械学習に基づく英語穴埋め問題の自動生成 (特集 NTT R&Dのオープンイノベーションをリードする大学連携)
- 写真共有サイトにおけるジオタグ情報を利用したトラベルルート推薦
- 機械学習 : ニューラルネットを中心に
- ボンガルド問題と概念学習アルゴリズム
- 情報拡散モデルに基づくソーシャルネットワーク上でのノードの期待影響度曲線推定法(人工知能,データマイニング)
- ソーシャルメディアを用いた個人向け旅行プランの自動生成(デジタルドキュメント,ライフログ活用技術,オフィス情報システム,一般)
- 機能性に基づくコミュニティ抽出法の比較
- 大規模Webクリックデータのためのイベント予測
- 予測尤度最大化に基づく誤分類サンプルの検出(ポスターセッション,第14回情報論的学習理論ワークショップ)
- フォロー類似度によるTwitter高次数ユーザの関係分析(第3回集合知シンポジウム)
- ネットワーク機能コミュニティ抽出法
- 社会ネットワークの構造的特徴量と情報拡散モデルにおける期待影響度の関係について (Web情報処理)
- マイクロブログ,ウェブログ,レビューサイトのネットワーク構造比較 (Web情報処理)
- 行動範囲と興味の同時推定モデルによる地域情報推薦
- 予測尤度最大化に基づく誤分類サンプルの検出
- ユーザの潜在特徴を考慮したソーシャルネットワーク上の情報拡散モデル