適合性分布が異なる情報源を用いたランキング学習
スポンサーリンク
概要
- 論文の詳細を見る
情報検索において,機械学習の枠組みでランキング関数の最適化を行うランキング学習が重要な課題である.従来のランキング学習手法では人手による適合性評価,もしくはクリックログから得られる訓練データを利用してきた.我々は,これらの複数情報源を適切に利用し,より高精度なランキング学習を達成することを目標とする.我々は複数情報源から得られる訓練データは,適合性分布が異なると考えた.そのため,訓練データの適合性分布が同一であることを仮定している従来の教師あり学習に基づくランキング学習手法では,複数情報源を用いたランキング学習の実現が困難だと考えられる.そこで我々は,分布が異なる訓練データを用いて転移学習の枠組みに着目し,転移学習をランキング学習に適用することによって適合性分布が異なる複数の情報源を用いたランキング学習の実現を試みる.本稿では,転移学習の枠組みに基づくランキング学習手法 TRankBoost を提案し,商用モバイルウェブ検索エンジンの実データを用いた評価実験によって有効性を検証した.評価実験により,TRankBoost によって,従来手法である RankingSVM,RankBoost と比べて NDCG@5,10 の値で上回る精度のランキングを実現することを示した.
- 2010-09-28
著者
-
宮原 伸二
Nttサイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社NTTサイバーソリューション研究所
-
数原 良彦
日本電信電話株式会社NTTサイバーソリューション研究所
-
植松 幸生
Nttコミュニケーションズ株式会社先端ipアーキテクチャセンタ
-
片岡 良治
日本電信電話株式会社サイバーソリューション研究所
-
藤野 昭典
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
金田 有二
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
宮原 伸二
日本電信電話株式会社NTTサイバーソリューション研究所
-
金田 有二
NTTレゾナント株式会社
-
藤野 昭典
NTTコミュニケーション科学基礎研究所
-
植松 幸生
Nttコミュニケーションズ先端ipアーキテクチャセンタ
-
片岡 良治
Nttサイバーソリューション研究所
-
片岡 良治
日本電信電話株式会社NTTサイバースペース研究所
-
片岡 良治
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
数原 良彦
日本電信電話株式会社 NTT サービスエボリューション研究所
-
片岡 良治
日本電信電話株式会社 NTTサイバーソリューション研究所
関連論文
- モバイル端末を考慮したロケーションアウェア情報検索(ポスターセッション,iDBフォーラム2008(招待講演・ポスター英語ディスカッション))
- ユーザの興味を捉える検索/レコメンド技術の研究開発(マルチメディアとWeb検索,Webとデータベースに関する技術報告)
- ソーシャルブックマークにおけるタグ付与行動に基づくスパマー判別
- 目的指向型ブログ検索システムBLOGRANGERの提案およびユーザ評価
- グラフ分析を利用した文書集合からの話題構造マイニング(テキストマイニング,データ工学論文)
- ポータルサービスを支えるナビゲーション技術(オフィスインフォメーションシステム及び一般)
- ソーシャルブックマークユーザのタグ付与行動に基づくスパマー判別手法(ウェブ情報とデータベースに関して(ポスター講演))
- マルチファセット型ブログ検索システムBLOGRANGERの開発(オフィスインフォメーションシステム及び一般)
- 楕円体問合せのための空間変換を用いた類似探索アルゴリズム
- 複数の構成要素データを扱う多クラス分類器の半教師あり学習法