ベクトル表現可能な機械抽出トピックの定量的評価法
スポンサーリンク
概要
- 論文の詳細を見る
大規模文書群からのトピック自動抽出は文書群全体像の把握や文書分類などに有用であるとして,研究が行われている.しかし,ここで機械抽出トピックの評価は重要な課題であるが,人手によってトピック分類された文書群が得られたとしても,トピック表現の多様性によりトピック間の対応付けが困難となるため,単純に機械抽出トピックと比較評価できない.そこで本稿では,潜在的意味解析などによるベクトル表現可能なトピック抽出法を対象として,人手によってトピック分類された文書群を用いて抽出トピックの解釈可能度を定量的に評価することを試みた.日本語および英語の新聞記事などからLSAやPCAおよびSpherical k-means法によって抽出したトピック群で,提案評価法の妥当性を検証した.
- 一般社団法人情報処理学会の論文
- 2007-03-15
著者
-
福井 健一
名古屋大学大学院情報科学研究科
-
斉藤 和巳
静岡県立大学経営情報学部
-
福井 健一
大阪大学産業科学研究所
-
沼尾 正行
大阪大学産業科学研究所
-
木村 昌弘
龍谷大学理工学部
-
斉藤 和巳
NTTコミュニケーション科学基礎研究所
-
斉藤 和己
静岡県大 経営情報
-
斉藤 和巳
現在 静岡県立大学経営情報学部経営情報学科
関連論文
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 顧客生涯価値を高めるためのリコメンデーション法(一般セッション,データ工学とメディア理解との融合)
- 固体酸化物燃料電池における損傷過程の可視化
- 複数の交通情報を効率的に利用する最適な交通情報提供手法の構築
- 狭窄管内脈動流の数値シミュレーション(流体工学,流体機械)
- 固体酸化物燃料電池の損傷評価支援のための視覚的データマイニング (人工知能と知識処理)
- トラックバックネットワークに基づくSEOコミュニティの分析(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- グラフ索引構造を用いた高速類似探索(人工知能,認知科学)
- マルチユーザに対応したファイルネットワークの構築と時系列インターフェースへの適用(「社会システムにおける知能」および一般)
- マルチユーザに対応したファイルネットワークの構築と時系列インターフェースへの適用(一般,「社会システムにおける知能」および一般)
- 端末におけるソフトウェア更新のための高速プログラム圧縮方式(コンシューマ機器および一般)
- 契約期間を延ばすためのレコメンド法
- 契約期間を延ばすためのレコメンド法(セッション1)
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法(Session 1)
- テキスト自動分類のための半教師あり学習技術 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 半教師あり学習に基づく異種情報データの分類(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 半教師あり学習のための生成・識別ハイブリッド分類器の設計法
- 最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
- LI-009 生成・識別ハイブリッドモデルに基づく半教師あり学習(I分野:画像認識・メディア理解)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 非線形施設配置問題における貪欲法の遅延評価による高速化--複数施設が確率的に貢献する場合
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 効率的な類似検索のためのピボット学習法
- キーグラフとSOMを用いた稀な重要事象の抽出-燃料電池の損傷評価を例に-
- 燃料電池における損傷パターン抽出
- 近傍ネットワークの成長分析から見る損傷過程 (「機械学習とその応用」および一般発表)
- LF-005 フェロモンを介したエージェント協調モデルによるセンサー隣接関係構築法の提案(人工知能・ゲーム)
- LA-002 固体酸化物燃料電池における破壊ダイナミクスの可視化法(モデル・アルゴリズム・プログラミング)
- ベクトル表現可能な機械抽出トピックの定量的評価法
- An architectural framework for ambient empathic support (「機械学習とその応用」および一般発表)
- Ant Colony Optimization によるセンサー隣接関係抽出法の提案 (テーマ:知能・適応と社会,ネットワーク) -- (ネットワーク・WWW)
- F_034 CONCORによるリンク解析を反映したTF・IDFによるWeb文書の要約(F分野:人工知能・ゲーム)
- CONCORによるリンク解析を用いたWeb文書からの重要語抽出
- ベクトル表現可能な機械抽出トピックの定量的評価法(セッション3)
- センサネットワークによる識別子を用いない人物別行動抽出 (第23回センシングフォーラム 資料--センシング技術の新たな展開と融合) -- (セッション1B3 ネットワークセンシングシステム)
- 時系列センサデータからのセンサ隣接関係の可視化(「ネットワークデータマイニング」「センサデータマイニング」)
- 自己組織化マップによる教師情報を用いた可視化アーキテクチャの提案 : 時系列医療データの可視化を例に(「ネットワークデータマイニング」「センサデータマイニング」)
- 時系列センサデータからのセンサ隣接関係の可視化(「ネットワークデータマイニング」「センサデータマイニング」)
- 自己組織化マップによる教師情報を用いた可視化アーキテクチャの提案 : 時系列医療データの可視化を例に(「ネットワークデータマイニング」「センサデータマイニング」)
- 複雑ネットワーク情報空間の没入型インタラクティブ可視化システム
- 複雑ネットワーク情報空間の没入型インタラクティブ可視化システム
- カーネルSOMによる損傷評価のための隣接性を考慮した分類性能評価
- 固体酸化物燃料電池の損傷評価支援のための視覚的データマイニング(特集テーマ「グリーンAI」,「グリーンAI」及び一般)
- 第2回マシンインテリジェンスに関する国際ワークショップ(International Workshop on Machine Intelligence 1993)の報告
- 4層パーセプトロンを用いた質的条件付き重回帰(バイオサイバネティックス,ニューロコンピューティング)
- 社会ネットワーク上の情報伝搬における強影響力ノード抽出の効率化(データマイニング)
- 重み双方向クラスタリング学習法 : 最適な共有重み構造をもつニューラルネットを求めて(バイオサイバネティックス, ニューロコンピューティング)
- キーグラフとSOMを用いた稀な重要事象の抽出 : 燃料電池の損傷評価を例に
- カーネルSOMによる損傷評価のための隣接性を考慮した分類性能評価
- 時系列シーケンスからの時間間隔情報を含んだ頻出シーケンスの抽出 (知識ベースシステム研究会(第91回)学習およびその応用)
- 5A-6 情報伝播モデルに基づく複雑ネットワーク可視化システム(数理モデルとデータマイニング,一般セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- D-8-7 LTモデルに基づいた情報拡散における強影響ノード群のコミュニティ分析(D-8. 人工知能と知識処理,一般セッション)
- RF-008 単一拡散系列からの期待影響度曲線の推定(F分野:人工知能・ゲーム,査読付き論文)
- RF-006 一様採用付きVoter Modelの提案(F分野:人工知能・ゲーム,査読付き論文)
- 6N-7 拡散データからのモデル推定による期待影響度の予測(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 4N-3 時間遅れパラメータ付きSISモデルの期待影響度分析(数理モデルとシミュレーション,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 文書ストリームからのホットトピック抽出を目的としたSR法の拡張
- 成長ネットワークにおける情報伝搬モデルを用いたリンク予測
- 文書ストリームからのホットトピック抽出を目的としたSR法の拡張
- 成長ネットワークにおける情報伝搬モデルを用いたリンク予測
- F-056 ネットワーク構造による類似探索性能の分析法の提案(F分野:人工知能・ゲーム,一般論文)
- RF-007 オブジェクト集合に依存したRNGの特性分析(F分野:人工知能・ゲーム,査読付き論文)
- 非線形施設配置問題における貪欲法の遅延評価による高速化 : 複数施設が確率的に貢献する場合
- 非線形施設配置問題における貪欲法の遅延評価による高速化-複数施設が確率的に貢献する場合-
- 6N-9 ネットワーク構造の違いによるK-メディアン探索方法の特性評価(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 6N-8 次数不変のネットワーク張り替えでの中心性の頑健性評価(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 遅延評価導入による局所改善クラスタリング法の高速化
- 遅延評価導入による局所改善クラスタリング法の高速化
- F-026 可視化による大学ウェブサイトのユーザビリティ分析(人工知能・ゲーム,一般論文)
- PMM型主成分分析を用いた文書ストリームの主要潜在トピック抽出(実用)
- F-051 SR法を利用した文書ストリームのホットトピック抽出(人工知能・ゲーム,一般論文)
- F-049 ブログ空間における情報伝搬パターンの分析(人工知能・ゲーム,一般論文)
- F-024 情報拡散モデルに基づいた社会ネットワークのリンク予測(人工知能・ゲーム,一般論文)
- 時間情報に基づいた政治ブログ群のトピック分析 (「Web情報処理」および一般発表)
- 社会ネットワーク上の情報拡散における強影響ノード群のコミュニティ分析 (「Web情報処理」および一般発表)
- ニューラルネットを用いたテキストの特徴語抽出
- F-014 社会ネットワーク上での情報拡散データの分析(人工知能・ゲーム,一般論文)
- F-013 SISモデルの影響度とコミュニティ構造の関係分析(人工知能・ゲーム,一般論文)
- F-012 社会ネットワークの構造と情報拡散モデルの関係分析(人工知能・ゲーム,一般論文)
- 文書トピックに関する認知科学的実験 (特集:「アクティブマイニング」および一般) -- (セッション3 Webマイニング)
- D-032 最大エントロピー法に基づく推薦システムでのユーザ行動のモデル化(D分野:データベース)
- D-040 ネットワーク索引構造を用いた類似探索と可視化(データベース,一般論文)
- パラメトリック埋め込み法によるクラス構造の可視化(データマイニング・データウェアハウス)
- パラメトリック埋め込み法によるWeb検索結果のトピック可視化 (特集:「アクティブマイニング」および一般) -- (セッション3 Webマイニング)
- ネットワーク科学最前線--世界の"つながり"を知る科学と思考(17)ネットワークの可視化技術--大規模情報からの意味情報の抽出
- 情報拡散モデルに基づくソーシャルネットワーク上でのノードの期待影響度曲線推定法(人工知能,データマイニング)
- 大域的クラスタ妥当性指標に基づく距離学習
- 事象間の共起関係を考慮したクラスタリングによる燃料電池の損傷パターン抽出(ポスターセッション,第14回情報論的学習理論ワークショップ)
- 社会ネットワークの構造的特徴量と情報拡散モデルにおける期待影響度の関係について (Web情報処理)
- 燃料電池における損傷パターン抽出のための共起クラスタマイニング
- IOS-01 Application Oriented Principles of Machine Learning and Data Mining(Organized Sessions in the 26th Annual Conference of the Japanese Society for Artificial Intelligence,The 26th Annual Conference of the Japanese Society for Artificia
- 事象間の共起関係を考慮したクラスタリングによる燃料電池の損傷パターン抽出
- 大域的クラスタ妥当性指標に基づく距離学習における適応度景観の可視化
- 株価変動の類似性に関する分析(一般セッション 金融)
- データマイニング・オントロジー工学による燃料電池の信頼性診断・知識管理基盤技術(グリーンAI)
- 完全固体電池開発のための人工知能技術の必要性(グリーンAI)
- Wagstaff, K. L. : Machine learning that matters (機械学習を取り巻く諸問題 ), Proc. 29th, Int. Conf. Machine Learning (ICML), pp.529-536 (2012)
- 進化的距離学習を用いた顔画像クラスタリング(人体・動作の認識と理解,福祉と共生,国際会議報告)
- 進化的距離学習を用いた顔画像クラスタリング(人体・動作の認識と理解,福祉と共生,国際会議報告)