類似テキスト検索のための多重トピックテキストモデル
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,確率モデルに基づく新たなテキスト検索法を提案する.テキスト検索ではテキスト間の類似度の定義が重要となる.従来法ではテキストの単語頻度ベクトルに基づいた類似度が用いられている為,テキストの内容を十分反映した検索が困難である.提案法では,あるトピック体系で分類されたテキスト群を用いて学習した確率モデルで,テキストのトピック度ベクトルを推定し,トピック度ベクトル空間で類似度が定義される.それゆえ,従来法に比べより内容的に類似したテキスト検索が可能となる.トピック度ベクトルの推定アルゴリズムは単純,かつ解の大域的最適性が理論保証される.また,検索結果に対する妥当な定量的評価基準を新たに導入し,実際のwebページを用いた検索評価実験を通して提案法の従来法に対する顕著な優位性を示す.
- 2003-11-15
著者
関連論文
- Innovatorの発見によるリコメンデーションのパーソナライズ手法の提案(「自動化:推論,発見,学習,データマイニング」及び一般)
- LF_005 契約期間を延ばすためのリコメンデーション法(F分野:人工知能・ゲーム)
- ベイズ階層言語モデルによる教師なし形態素解析(言語モデル・ウェブ解析)
- 関連アブストラクト検索ツール:RAST (ニューロコンピューティング)
- 人間関係の重なりを持つコミュニティ構造の抽出(ネットワークが創発する知能)
- トラックバックネットワークに基づくSEOコミュニティの分析(事例分析,ネットワーク生態学〜生命現象から社会文化現象の新しいパースペクティブ〜)
- 隠れマルコフモデルにおけるクラスラベル無しデータの利用
- ラベル有りラベル無し混在データを用いた時系列データ認識手法の検討
- ディリクレ過程混合モデルに基づく離散データの共クラスタリング
- 一括予測型協調フィルタリング(Session 1)
- 内容と関連するタグの教師なし抽出(「Webインテリジェンス」及び一般)
- 混合モデルを用いた異常値の可視化
- 多項分布に基づく自己組織化マップの特性評価
- 教師情報を導入したSOM学習モデル
- 効率的な類似検索のためのピボット学習法
- LA-002 固体酸化物燃料電池における破壊ダイナミクスの可視化法(モデル・アルゴリズム・プログラミング)
- ベクトル表現可能な機械抽出トピックの定量的評価法
- ベクトル表現可能な機械抽出トピックの定量的評価法(セッション3)
- 自己組織化マップによる教師情報を用いた可視化アーキテクチャの提案 : 時系列医療データの可視化を例に(「ネットワークデータマイニング」「センサデータマイニング」)
- 自己組織化マップによる教師情報を用いた可視化アーキテクチャの提案 : 時系列医療データの可視化を例に(「ネットワークデータマイニング」「センサデータマイニング」)
- 第2回マシンインテリジェンスに関する国際ワークショップ(International Workshop on Machine Intelligence 1993)の報告
- ラベリングの変動に対する多重ラベルテキスト分類器の評価
- 誤り訂正符号を用いた多重カテゴリ分類
- 誤り訂正符号を用いた多重カテゴリ分類
- 関連アブストラクト検索ツール : RAST
- 確率的混合部分空間法 : 混合因子分析を用いたパターン認識法
- 混合モデルのための併合分割操作付きEMアルゴリズム
- 確率的混合部分空間法 : 混合因子分析によるパターン認識法
- 併合・分割操作付きEMアルゴリズムとその混合分布推定への応用
- アンサンブル学習における汎化誤差解析
- 確定的アニーリング : もうひとつのアニーリング
- 最小分類誤り基準に基づく識別関数のアンサンブル学習
- 確定的アニーリングEMアルゴリズム
- Webのトピックダイナミックスモデル
- クロスエントロピー最小化に基づくネットワークデータの埋め込み(知識処理)
- 社会ネットワーク上の情報伝搬における強影響力ノード抽出の効率化(データマイニング)
- ニューラルネットを用いたテキストの特徴語抽出(一般)(ニューロインフォーマティックスとは何か)
- 多層パーセプトロンを用いた区分的多項式回帰(一般)(ニューロインフォーマティックスとは何か)
- ニューラルネットを用いたテキストの特徴語抽出
- 多層パーセプトロンを用いた区分的多項式回帰
- 線形変数変換に不変な自乗値ペナルティ項の構成法(知識処理)
- 交差検証誤差最小化による重要重みの発見
- NC2000-44 質的条件付き数法則発見法 : RF6.2アルゴリズム
- 法則発見法RF6.2の生化学データへの適用と評価 (テーマ:「データマイニング--共通データからの知識発見」および一般)
- 質的条件付き数法則発見法のVQと決定木を用いた高速化 (小特集 「発見科学」及び一般演題)
- 線形変数変換に不変な自乗値ペナルティ項の構成法 (小特集 「発見科学」及び一般演題)
- 交差検証誤差最小化による重要重みの発見
- 2次学習アルゴリズムBPQによるリカレントネットワーク学習とガウス混合分布推定
- 2次学習アルゴリズムBPQの分類問題への適用法とその評価
- MDL 原理に基づく新正則化法
- ニュ-ラルネット法則発見法の大規模デ-タへの適用性
- 自乗値ペナルティ項を用いた2次学習アルゴリズム
- LD-005 Relative Innovatorの発見によるパーソナライズ手法の提案(データベース)
- 隠れマルコフモデルの最良パラメータ推定
- 3層ニューラルネットにおける2階導関数を用いた学習アルゴリズムの高速化
- 確率モデルに基づく文書ストリームからのホットトピック抽出の一検討(「自動化:推論,発見,学習,データマイニング」及び一般)
- F-056 ネットワーク構造による類似探索性能の分析法の提案(F分野:人工知能・ゲーム,一般論文)
- RF-007 オブジェクト集合に依存したRNGの特性分析(F分野:人工知能・ゲーム,査読付き論文)
- F-026 可視化による大学ウェブサイトのユーザビリティ分析(人工知能・ゲーム,一般論文)
- 混合回帰モデルのためのSMEMアルゴリズム
- モジュール競合学習を用いた適応的クラスタリング
- モジュール競合学習による適応的クラスタリング
- モジュール構造を用いた特徴コラムの自己組織化モデル
- ディリクレ過程混合モデルに基づく離散データの共クラスタリング
- ディリクレ過程混合モデルに基づく離散データの共クラスタリング
- コネクショニストアプローチによる数法則の発見
- HMEの構成的学習アルゴリズム
- 準ニュートン法に基づくElmanネットワークの学習アルゴリズム
- クロスエントロピーに基づくネットワークデータの埋め込み
- 11)手書き図面の画質改善手法(〔画像通信システム研究会(第75回)画像処理・画像応用研究会(第79回)〕合同)
- ブログ空間の主要トピック抽出 (特集 「Web Intelligence」および一般)
- コミュニティーをもつ成長ネットワークモデル
- 時間依存関係データ分析のための動的無限関係モデル
- 時間変化に対応する無限関係モデルの提案
- パラメトリック埋め込み法を用いた分類器の視覚的解析(知識処理,インタラクションの理解とデザイン)
- 複数対象トラッキングにおける,適応的なパラメータ推定手法(一般セッション,データ工学とメディア理解との融合)
- 複数対象トラッキングにおける,適応的なパラメータ推定手法(一般セッション,データ工学とメディア理解との融合)
- ノンパラメトリックベイズモデル
- 多重トピックを表現するテキストモデルの一考察(テキスト分類・トピック解析)
- 多重トピックテキストの確率モデル : パラメトリック混合モデル(バイオサイバネティックス,ニューロコンピューティング)
- 類似テキスト検索のための多重トピックテキストモデル
- 類似テキスト検索のための多重トピックテキストモデル
- A-4 金融データからのニューラルネットを用いた知識発見(日本統計学会第68回大会記録 : 金融工学と統計分析 (1))
- 金融データからのニューラルネットを用いた知識発見
- 機械学習 : ニューラルネットを中心に
- ボンガルド問題と概念学習アルゴリズム
- 機能性に基づくコミュニティ抽出法の比較
- ニュ-ラルネットを用いた法則発見
- 自乗値ペナルティ項を用いた2次学習アルゴリズム
- 自乗値ペナルティ項を用いた2次学習アルゴリズム
- 適応概念学習アルゴリズム:RF4
- ベイズ推定に基づくタスク順序付け
- フォロー類似度によるTwitter高次数ユーザの関係分析(第3回集合知シンポジウム)
- ネットワーク機能コミュニティ抽出法
- マイクロブログ,ウェブログ,レビューサイトのネットワーク構造比較 (Web情報処理)
- パラメトリック混合モデル(PMM)による多重トピック抽出 (特集 Webサイエンス)
- ニューラルネットによるデータマイニング
- ニューラルネットによるデータマイニング(データ・テキストマイニング)
- 法則発見法RF6.2によるWebダイナミクスの解析 (小特集 使えるAI基礎技術)