効率的な類似検索のためのピボット学習法
スポンサーリンク
概要
- 論文の詳細を見る
与えられたクエリから類似したオブジェクトを同定する類似検索は,情報検索,パターン認識などの広い分野での重要な技術であり,多くのアプリケーションが存在する.効率的な類似検索を行う1つのアプローチとして,我々は,クエリとデータ群の各オブジェクトとの間で行われる類似計算の回数を減らすことに焦点を当て,特にピボットの集合に注目する.本論文では,ピボットの集合をデータから選択する従来手法とは異なり,データが存在しうる距離空間から機械学習アプローチにより学習する新たな手法を提案する.2種類の人工データ,2種類の実データを使用した実験により,提案手法が代表的な従来手法と比較して,類似計算の平均的な実行回数を減らすことで高速化が可能であることを示す.
- 2009-08-15
著者
-
上田 修功
NTTコミュニケーション科学基礎研究所
-
上田 修功
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
斉藤 和巳
静岡県立大学経営情報学部
-
斉藤 和巳
静岡県立大学
-
木村 学
奈良先端科学技術大学院大学
-
上田 修功
日本電信電話株式会社 Nttコミュニケーション科学基礎研究所
-
斉藤 和巳
静岡県大
関連論文
- 購買行動解析のためのトピック追跡モデル(人工知能,データマイニング)
- ユーザの嗜好の時系列性と先行性に着目した協調フィルタリング(コンテンツ技術,Web情報システム)
- Innovatorの発見によるリコメンデーションのパーソナライズ手法の提案(「自動化:推論,発見,学習,データマイニング」及び一般)
- 購買順序を考慮した協調フィルタリング(「自動化:推論,発見,学習,データマイニング」及び一般)
- 最近のベイズ理論の進展と応用[IV] : 変分ベイズ法
- ベイズ階層言語モデルによる教師なし形態素解析(言語モデル・ウェブ解析)
- 関連アブストラクト検索ツール:RAST (ニューロコンピューティング)
- グラフ索引構造を用いた高速類似探索(人工知能,認知科学)
- 隠れマルコフモデルにおけるクラスラベル無しデータの利用
- ラベル有りラベル無し混在データを用いた時系列データ認識手法の検討
- ノンパラメトリックベイズ入門(オーガナイズドセッション,コンピュータビジョンとパターン認識のための学習理論)
- ノンパラメトリックベイズ入門(オーガナイズドセッション2)
- ディリクレ過程混合モデルに基づく離散データの共クラスタリング
- 一括予測型協調フィルタリング
- ディリクレ混合過程モデルに基づく半教師有り学習(一般セッション,データ工学とメディア理解との融合)
- ノンパラメトリックベイズモデルによるグラフクラスタリング(一般セッション,データ工学とメディア理解との融合)
- 一括予測型協調フィルタリング(Session 1)
- ディリクレ過程混合モデルに基づく共クラスタリング (「プリファレンスモデリングと推薦システム」及び一般)
- 周辺評点分布に基づく協調フィルタリング手法における予測アルゴリズムについて(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 周辺評点分布に基づく協調フィルタリング手法における予測アルゴリズムについて
- 周辺評点分布に基づく協調フィルタリング手法(「自動化:推論,発見,学習,データマイニング」及び一般)
- 分布が変化するデータにおけるモデル学習法(データマイニング)
- 購買順序を効率的に用いた協調フィルタリング
- 内容と関連するタグの教師なし抽出(「Webインテリジェンス」及び一般)
- ベイズ的基準を用いた状態共有型HMM構造の選択
- 変分ベイズ法の音響モデル適応への応用
- ベイズ的アプローチに基づく状態共有型HMM構造の学習
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法(Session 1)
- 半教師あり学習に基づく異種情報データの分類(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 半教師あり学習のための生成・識別ハイブリッド分類器の設計法
- 最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
- LI-009 生成・識別ハイブリッドモデルに基づく半教師あり学習(I分野:画像認識・メディア理解)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 文書の構成要素モデルのアンサンブル学習に基づくテキスト分類(一般)
- LF-014 文書分類体系間の対応関係の自動抽出(F. 人工知能)
- LD-001 交差確認法に基づく適合性フィードバック(D. データベース)
- 確率モデルを用いた文書分類体系間の構造マッチング(複数文書の処理)
- コーパスからのキーワード自動抽出(抽出)
- 多重トピックテキストの確率モデル : テキストモデル研究の最前線(2)
- 多重トピックテキストの確率モデル : テキストモデル研究の最前線(1)
- 指向性アタッチメントとコミュニティをもつ成長ネットワークモデル(バイオサイバネテッィクス,ニューロコンピューティング)
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 適合フィードバックにおける単語選択法(検索・多義性解消)
- 効率的な類似検索のためのピボット学習法
- ラベルありデータの選択バイアスに頑健な半教師あり学習
- 動作認識のための状態遷移モデル : HMMの高度化と非HMM手法の成長(「時系列データの認識 : HMMを越えて」)
- 知能コンピューティングのための統計的機械学習の最新動向について
- LF-015 高次元データに対して頑健な文書クラスタリング手法(F. 人工知能)
- ラベリングの変動に対する多重ラベルテキスト分類器の評価
- 誤り訂正符号を用いた多重カテゴリ分類
- 誤り訂正符号を用いた多重カテゴリ分類
- 関連アブストラクト検索ツール : RAST
- 確率的混合部分空間法 : 混合因子分析を用いたパターン認識法
- 混合モデルのための併合分割操作付きEMアルゴリズム
- 確率的混合部分空間法 : 混合因子分析によるパターン認識法
- 併合・分割操作付きEMアルゴリズムとその混合分布推定への応用
- アンサンブル学習における汎化誤差解析
- 確定的アニーリング : もうひとつのアニーリング
- 最小分類誤り基準に基づく識別関数のアンサンブル学習
- 確定的アニーリングEMアルゴリズム
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- Webのトピックダイナミックスモデル
- クロスエントロピー最小化に基づくネットワークデータの埋め込み(知識処理)
- LD-005 Relative Innovatorの発見によるパーソナライズ手法の提案(データベース)
- 隠れマルコフモデルの最良パラメータ推定
- 確率モデルに基づく文書ストリームからのホットトピック抽出の一検討(「自動化:推論,発見,学習,データマイニング」及び一般)
- F-056 ネットワーク構造による類似探索性能の分析法の提案(F分野:人工知能・ゲーム,一般論文)
- RF-007 オブジェクト集合に依存したRNGの特性分析(F分野:人工知能・ゲーム,査読付き論文)
- ベイズ的基準を用いた状態共有型HMM構造の選択
- ベイズ的基準を用いた状態共有型HMM構造の選択
- ベイズ的アプローチに基づく状態共有型HMM構造の学習
- 混合回帰モデルのためのSMEMアルゴリズム
- モジュール競合学習を用いた適応的クラスタリング
- モジュール競合学習による適応的クラスタリング
- モジュール構造を用いた特徴コラムの自己組織化モデル
- ディリクレ過程混合モデルに基づく離散データの共クラスタリング
- ディリクレ過程混合モデルに基づく離散データの共クラスタリング
- ディリクレ混合過程モデルに基づく半教師有り学習(一般セッション,データ工学とメディア理解との融合)
- ノンパラメトリックベイズモデルによるグラフクラスタリング(一般セッション,データ工学とメディア理解との融合)
- クロスエントロピーに基づくネットワークデータの埋め込み
- 11)手書き図面の画質改善手法(〔画像通信システム研究会(第75回)画像処理・画像応用研究会(第79回)〕合同)
- 多値読みとり図面の画質改善手法の検討
- コミュニティーをもつ成長ネットワークモデル
- 時間依存関係データ分析のための動的無限関係モデル
- 時間変化に対応する無限関係モデルの提案
- トピックモデルに基づく文書群の可視化
- 購買順序を効率的に用いた協調フィルタリング
- 購買順序を効率的に用いた協調フィルタリング
- 複数対象トラッキングにおける,適応的なパラメータ推定手法(一般セッション,データ工学とメディア理解との融合)
- 複数対象トラッキングにおける,適応的なパラメータ推定手法(一般セッション,データ工学とメディア理解との融合)
- ノンパラメトリックベイズに基づく複数対象時系列のクラスタリングとトラッキング(人工知能,認知科学)
- D-040 ネットワーク索引構造を用いた類似探索と可視化(データベース,一般論文)
- ノンパラメトリックベイズモデル
- アンサンブル学習(CVにおけるパターン認識・学習理論の新展開)
- 準教師有り学習の理論とアルゴリズム(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 類似テキスト検索のための多重トピックテキストモデル
- A-4 金融データからのニューラルネットを用いた知識発見(日本統計学会第68回大会記録 : 金融工学と統計分析 (1))
- 金融データからのニューラルネットを用いた知識発見