適合性分布が異なる情報源を用いたランキング学習
スポンサーリンク
概要
- 論文の詳細を見る
情報検索において,機械学習の枠組みでランキング関数の最適化を行うランキング学習が重要な課題である.従来のランキング学習手法では人手による適合性評価,もしくはクリックログから得られる訓練データを利用してきた.我々は,これらの複数情報源を適切に利用し,より高精度なランキング学習を達成することを目標とする.我々は複数情報源から得られる訓練データは,適合性分布が異なると考えた.そのため,訓練データの適合性分布が同一であることを仮定している従来の教師あり学習に基づくランキング学習手法では,複数情報源を用いたランキング学習の実現が困難だと考えられる.そこで我々は,分布が異なる訓練データを用いて転移学習の枠組みに着目し,転移学習をランキング学習に適用することによって適合性分布が異なる複数の情報源を用いたランキング学習の実現を試みる.本稿では,転移学習の枠組みに基づくランキング学習手法 TRankBoost を提案し,商用モバイルウェブ検索エンジンの実データを用いた評価実験によって有効性を検証した.評価実験により,TRankBoost によって,従来手法である RankingSVM,RankBoost と比べて NDCG@5,10 の値で上回る精度のランキングを実現することを示した.
- 2010-09-28
著者
-
宮原 伸二
Nttサイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社NTTサイバーソリューション研究所
-
数原 良彦
日本電信電話株式会社NTTサイバーソリューション研究所
-
植松 幸生
Nttコミュニケーションズ株式会社先端ipアーキテクチャセンタ
-
片岡 良治
日本電信電話株式会社サイバーソリューション研究所
-
藤野 昭典
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
金田 有二
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
宮原 伸二
日本電信電話株式会社NTTサイバーソリューション研究所
-
金田 有二
NTTレゾナント株式会社
-
藤野 昭典
NTTコミュニケーション科学基礎研究所
-
植松 幸生
Nttコミュニケーションズ先端ipアーキテクチャセンタ
-
片岡 良治
Nttサイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社NTTサイバースペース研究所
-
片岡 良治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
数原 良彦
日本電信電話株式会社 NTT サービスエボリューション研究所
-
片岡 良治
日本電信電話株式会社 NTTサイバーソリューション研究所
関連論文
- モバイル端末を考慮したロケーションアウェア情報検索(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- ユーザの興味を捉える検索/レコメンド技術の研究開発(マルチメディアとWeb検索,Webとデータベースに関する技術報告)
- ソーシャルブックマークにおけるタグ付与行動に基づくスパマー判別
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- ソーシャルブックマークユーザのタグ付与行動に基づくスパマー判別手法(ウェブ情報とデータベースに関して(ポスター講演))
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 楕円体問合せのための空間変換を用いた類似探索アルゴリズム
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法(Session 1)
- テキスト自動分類のための半教師あり学習技術 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 半教師あり学習に基づく異種情報データの分類(テーマセッション(4),パターン認識・メディア理解のための学習理論とその応用)
- 半教師あり学習のための生成・識別ハイブリッド分類器の設計法
- 最大エントロピー原理に基づく付加情報の効果的な利用によるテキスト分類(情報検索)
- LI-009 生成・識別ハイブリッドモデルに基づく半教師あり学習(I分野:画像認識・メディア理解)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 文書の構成要素モデルのアンサンブル学習に基づくテキスト分類(一般)
- LD-001 交差確認法に基づく適合性フィードバック(D. データベース)
- コーパスからのキーワード自動抽出(抽出)
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- F値最大化学習に基づく文書の多重ラベリング(機械学習)
- 高次元特徴空間に適した半教師あり条件付確率場の検証(機械学習)
- ラベルあり・なしデータの最適な結合に基づくパターン分類(学習理論とパターン認識メディア理解, 学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
- 適合フィードバックにおける単語選択法(検索・多義性解消)
- ネット上の会話からの話題即時抽出技術の評価について(Webからの知識発見とネット応用)
- ネット上の会話からの話題即時抽出技術の評価について(Webからの知識発見とネット応用)
- 無声子音における舌・唇と喉頭の調音運動の時間関係の分析
- 無声子音における調音・声門運動のタイミングの分布 - 促音の有無による比較 -
- ラベルありデータの選択バイアスに頑健な半教師あり学習
- 同義語情報を用いた確率的単語アライメントモデル
- 適合性分布が異なる情報源を用いたランキング学習
- 概念ベースに基づくWeb検索のクエリタイプ判定手法とその評価
- 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用
- レアクエリを対象とした非クリック分析によるクエリ推薦方式の提案
- 迅速なアプリケーション開発のためのWeb APIデータべースシステム(一般,NGN,VoIP,FMC,自律分散ネットワーク,ソフトウェアエージェント,Webサービス,Web2.0及び一般)
- 評判検索におけるクエリ依存型の評価極性付与(意見・評判情報処理)
- ブログ記事からの意見文検索(意見・評判情報処理)
- 評判検索におけるクエリ依存型の評価極性付与
- マップ散策型コンテンツガイド「AssociaGuide」(マルチメディア処理)
- 散策型コンテンツガイドシステムAssociaGuide(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 散策型コンテンツガイドシステムAssociaGuide
- 散策型コンテンツガイドシステムAssociaGuide
- 散策型コンテンツガイドシステム「AssociaGuide」 : システムおよび「ブロードバンド番組ガイド」試行サービス実験概要(放送,インタネット,モバイルマルチメディアおよび一般)
- 無声子音発声時の舌・喉頭運動における発声の強さの影響(聴覚,音声,言語とその障害)
- 無声子音の発話運動における発声の強さの影響の分析
- 音声生成における発話協調動作機構
- 促音が先行する無声子音の調音・声門運動タイミングの分析
- 口蓋形摂動に対する調音補償動作の分析
- 無声子音の生成における声門運動の時間パタンの分析
- 無声子音生成における調音器官と声門の運動タイミングの分析
- 磁気センサシステムおよびフォトグロットグラフを用いた調音器官と声門の運動観測
- A-15-10 ユーザビュー適用型コンテンツガイドシステムの提案
- D-006 ラベル指向情報検索における分類ラベル統合方式の検討(D.データベース)
- 分類情報と言語情報の統合利用に基づくコンテンツ空間の可視化
- D-41 メタデータを用いたコンテンツ空間の可視化手法 : 概念空間の2次元非線型投影による逐次登録型コンテンツマップの実現(データマイニング,D.データベース)
- D-8-8 メタデータを用いたコンテンツ空間の可視化手法
- D-8-7 散策型映像ポータルシステムAssociaGuideの提案
- 散策型コンテンツガイドシステム--AssociaGuide (特集論文2 ハイパーコンテンツサービス技術)
- D-035 クエリログから抽出した関連語集合を用いたウェブページ検索(D分野:データベース,一般論文)
- ユーザのにぎわい感を利用した興味喚起型コンテンツガイド方式について
- K-096 利用者にぎわい情報可視化システム : World Wide Navi(K.ヒューマンコミュニケーション&インタラクション)
- 文書情報統合のためのテキスト表現モデルの提案と主題グラフを用いた実現
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数のWeb Wrapperによる高精度な情報抽出(セッション4:Web応用)
- 複数の Web Wrapper による高精度な情報抽出
- ブログ記事要約における重要文位置の調査
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案
- E-011 記事群の冗長度を削減するためのRSSニュースリーダ(E分野:自然言語)
- Blogのタグ間類似度のスコアリング
- コミュニティ抽出のためのクエリ共起語のクラスタリングに関する一考察(オフィスインフォメーションシステム及び一般)
- D-10-9 耐障害性を備えた全文検索エンジンの実装(D-10. ディペンダブルコンピューティング,一般セッション)
- 単語・意味属性間共起に基づくコーパス概念ベースの生成方式
- 数10万件のコンテンツを対象とするにぎわい情報を用いたナビゲーションインタフェース
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- E-038 文書構造を考慮した近接度スコアを用いた文書検索結果ランキング方式(E分野:自然言語・音声・音楽,一般論文)
- 検索結果のアクセス分析に基づく情報要求ベースのランキング(ウェブ情報とデータベースに関して(ポスター講演))
- 局所構造を考慮したブログネットワークの分析(ウェブ情報とデータベースに関して(ポスター講演))
- 単語間の階層関係に基づくテキスト分類方式(一般セッション,センシング技術とその応用)
- 単語・意味属性間共起に基づく単語間の階層関係の抽出(言語理解とオントロジーシンポジウム)
- XMLベースのコンテンツガイドシステム実現について
- 経験強化を考慮したQ-Learningの提案とその応用
- How-to型質問応答の実現に向けた質問回答文書の特徴分析(言い換え・質問応答)
- How-to型質問応答の実現に向けた質問回答文書の特徴分析(言い換え・質問応答)
- 複数のWeb Wrapperによる高精度な情報抽出
- 求める情報へユーザを導くナビゲーション型の情報検索技術 (特集 次世代ポータル技術)
- D-004 親ページ分類を用いたWEB画像の実用的な検索方法(D.データベース)
- 固有表現を用いたニュース記事分類手法の提案(クラスタリング, 夏のデータベースワークショップDBWS2005)
- 固有表現を用いたニュース記事分類手法の提案(クラスタリング, 夏のデータベースワークショップ2005)
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案(セッション4 : 情報検索)
- 特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案(セッション4 : 情報検索)
- 単語・意味属性間共起に基づく概念ベースの拡張方式
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- インスタント質問文検索システムの提案(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- ウェブ検索サービスにおけるユーザが感じる推薦情報品質とITリテラシーとの関係(サービス品質,クラウド,SDN(Software-Defined Network),コンテンツ配信,一般)
- 不均衡データにおける偽陽性率を考慮したスパム判別器のオンライン学習
- 地域特有の話題発見を支援するスマートフォン向けマップ型検索システム : 発見探地図エリアダス(地理情報システム,データ工学と情報マネジメント論文)
- D-007 偽陽性率に着目したオンライン学習を用いたスパム判別(Web,D分野:データベース)
- 画像検索でのユーザ行動を利用した大規模画像アノテーション(一般物体認識,文字・文書,映像,医用画像,画像の認識・理解論文)