ウェブ検索クエリログとクリックスルーログを用いた同義語獲得
スポンサーリンク
概要
- 論文の詳細を見る
近年のウェブ検索エンジンの多くはクエリ拡張機能やクエリ書き換えを備えている.これらの機能の実現にはシソーラスや同義語辞書を用いるが,人手での辞書作成はコストがかかる.そのため,ウェブ検索ログやクリックスルーログを用いた同義語獲得の研究が行われている.これまでに提案された手法では,生成モデルである Noisy Channel Model によって同義語獲得をモデル化しており,柔軟な素性設計が行えなかったため,クエリと同義語候補の表層の編集距離を素性として追加する等が難しかった.我々は,この問題に対処すべく,同義語獲得に識別モデルを用いた手法を提案する.クエリ書き換えのための同義語辞書では, 1 つのクエリに対してより適切と考えられる 1 つの同義語を登録する.そのため同義語獲得手法には,同義語候補が複数ある場合には最適な候補を 1 位に提示することが求められる.そこで提案手法では,クエリと同義語候補の表層に基づく素性を利用した ListNet を用いて 1 位正解率を直接最大化する.また,従来の識別モデルでは,有効な組合せ素性の追加等,素性エンジニアリングを行う必要があったが,我々は ListNet に隠れ層を導入することで,素性エンジニアリングなしに有効な組合せ素性の生成と重み付けを可能とした.これにより, Noisy Channel Model を用いた従来の手法に比べ,より高い精度で同義語を獲得することができた.
- 2013-01-23
著者
関連論文
- Espresso 型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析 : 語義曖昧性解消における評価
- 検索ログを用いた意味知識獲得のためのブートストラップ手法(言語理解のためのコーパスからの知識獲得)
- 名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
- ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得
- ハブを作らないグラフ構築法を用いた半教師あり語義曖昧性解消
- 検索クエリログとクリックスルーログを用いた略語の展開候補獲得
- ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得
- E-007 YCAT : Webベースのコーパスアノテーションツール(E分野:自然言語・音声・音楽)
- 半教師あり語義曖昧性解消のためのグラフスパース化
- 半教師あり語義曖昧性解消のためのグラフスパース化
- 半教師あり語義曖昧性解消のためのグラフスパース化
- Graph-Theoretic Approaches to Minimally-Supervised Natural Language Learning(Natural Language Processing,Doctorial Theses on Aritifical Intelligence)
- NAISTテキストコーパス : 述語項構造と共参照関係のアノテーション(解析・対話)
- 述語項構造と照応関係のアノテーション : NAISTテキストコーパス構築の経験から
- 名詞句の語彙統語パターンを用いた事態性名詞の項構造解析
- 文脈情報と格構造の類似度を用いた日本語文間述語項構造解析
- 文脈情報と格構造の類似度を用いた日本語文間述語項構造解析
- 機械学習による近代文語文への濁点の自動付与
- 機械学習による近代文語文への濁点の自動付与
- 奥村学, 自然言語処理の基礎, 164pp., コロナ社, 2010
- 日本語教育のための誤り訂正ローマ字かな変換
- 台湾植民地期の言語政策--安藤正次と二語併用の台湾
- 大規模英語学習者コーパスを用いた英作文の文法誤り訂正の課題分析
- 大規模英語学習者コーパスを用いた英作文の文法誤り訂正の課題分析
- ウェブ検索クエリログとクリックスルーログを用いた同義語獲得
- ノーベル賞と人工知能研究(編集委員今年の抱負2013)
- 統計的機械学習を用いた歴史的資料への濁点付与の自動化
- 英語スペリング訂正と品詞タグ付けの結合学習
- ノーベル賞と人工知能研究