トピックと属性を用いたブートストラップ法に基づく語彙獲得
スポンサーリンク
概要
- 論文の詳細を見る
本稿ではコーパスからの語彙獲得を行う際に,トピック情報と属性情報を用いる手法を提案する.語彙が用いられている文書のトピックをトピックモデルを用いて推定し,新たな語彙獲得の際の素性として用いる.また,語彙が共通して持つ属性を文書中から選択し,それを語彙選択の制約条件として用いる.提案手法を用いることでセマンティックドリフトを軽減し,語彙の獲得精度が向上したことを示す.
- 2010-11-11
著者
-
今村 賢治
Ntt サイバースペース研
-
貞光 九月
NTTサイバースペース研究所
-
齋藤 邦子
NTTサイバースペース研究所
-
今村 賢治
NTTサイバースペース研究所
-
菊井 玄一郎
NTTサイバースペース研究所
-
菊井 玄一郎
日本電信電話株式会社nttサイバースペース研究所
-
齋藤 邦子
日本電信電話株式会社NTTサイバースペース研究所
-
今村 賢治
日本電信電話株式会社 Nttサイバースペース研究所
-
今村 賢治
日本電信電話株式会社, NTTメディアインテリジェンス研究所
関連論文
- タグ信頼度に基づく半自動自己更新型固有表現抽出
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与 (言語理解とコミュニケーション)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- トピックと属性を用いたブートストラップ法に基づく語彙獲得
- 特徴的部分文字列と共起情報を用いた固有表現の詳細ラベル付与
- 2000-DBS-122-47 構造化文書をランキング可能な全文検索システム
- DE2000-69 構造化文書をランキング可能な全文検索システム
- コミュニケーション効率に基づく課題遂行型音声対話の評価(Session-3 コミュニケーション・対話,第8回音声言語シンポジウム)
- コミュニケーション効率に基づく課題遂行型音声対話の評価
- ターム間の意味的関連性に基づくタームリストの翻訳多義解消
- 順序保存ダイジェスト法によるWebページ間の部分複製検出
- 文脈的素性を用いた固有表現間の関係性判定
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- リッチアノテーション : 固有表現に焦点をあてた知識抽出の試み(情報抽出(テーマセッション2))
- 3D-7 地理的距離と有名度を用いた地名の曖昧性解消(自然言語処理,一般セッション,人工知能と認知科学)
- テキストからの知識抽出による新しいWeb情報アクセスに向けて (特集 ポータルサービスを支える自然言語処理技術)
- テキストからの知識抽出の基盤となる日本語基本解析技術 (特集 ポータルサービスを支える自然言語処理技術)
- 3次元仮想環境における教示対話生成システム
- 協調的対話機構と3次元仮想学習環境の統合
- 音声制御ブラウザ VCWeb の英日シームレス化
- タグ信頼度に基づく半自動自己更新型固有表現抽出
- 言語の壁を越えて文書を検索する : クロスランゲージ情報検索(マルチリンガル情報アクセス)
- トピック情報を用いたブートストラップ法に基づく語彙獲得
- トピック情報を用いたブートストラップ法に基づく語彙獲得
- 異なる体系を接続するための識別モデルを用いた形態素変換法(自然言語処理)
- 語彙と文脈情報を用いた反義の詳細クラス分類
- 小規模誤りデータからの日本語学習者作文の助詞誤り訂正
- 異なる体系を接続するための識別モデルを用いた形態素変換法