名詞の類似表現拡張に基づくオープンドメイン音声質問応答システム用言語モデルの構築
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,オープンドメイン音声質問応答システム「一休」で用いる音声認識 言語モデル構築手法を提案する.「一休」は,幅広いトピックの比較的短い質問文をスマートフォン経由でユーザから受け取り,大規 模なWWWコーパスから答えを探して出力する.オープンドメインの質問を正確に音声認識することを可能にする言語モデルの構 築が課題となる.既存のドメインアダプテーションの手法と,名詞の分布類似度に基づくシードコーパスの拡張を組み合わせることで,低コストで高性能の言語モデルを作成した.500文のシードコーパスと6億文のWWWコーパスから41万語を網羅する言語モデルを作成した.WWWコーパスからランダムに抽出した文によって構築したベースライン言語モデルを単語誤り率で3.25%改善した.
- 2014-07-15
著者
-
鳥澤 健太郎
情報通信研究機構
-
風間 淳一
情報通信研究機構
-
松田 繁樹
情報通信研究機構
-
大竹 清敬
情報通信研究機構
-
翠 輝久
情報通信研究機構
-
デサーガ ステイン
情報通信研究機構
-
翠 輝久
情報通信研究機構ユニバーサルコミュニケーション研究所音声コミュニケーション研究室
-
ヴァルガ イシュトヴァーン
情報通信研究機構ユニバーサルコミュニケーション研究所情報分析研究室
-
鳥澤 健太郎
情報通信研究機構ユニバーサルコミュニケーション研究所情報分析研究室
-
大竹 清敬
情報通信研究機構ユニバーサルコミュニケーション研究所情報分析研究室
関連論文
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 京都観光案内タスクにおける観光地情報を推薦する音声対話システムの構築と実験
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- WWWからの大規模動詞含意知識の獲得
- QAシステムのための音声入力インターフェース
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 情報爆発と音声アプリケーションの可能性 - 言語処理研究者の考察 -
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- 相談型対話のモデル化と対話戦略の最適化
- QAシステムのための音声入力インターフェース (音声)
- QAシステムのための音声入力インターフェース (言語理解とコミュニケーション)
- 音声対話システム構築のための発話行為・意味内容タグの設計
- 日英単言語Webコーパスからの対訳treebank自動獲得
- 概念辞書によるシステマティックなイノベーション支援に向けて (データによる分析と評価)
- 属性語の Web 文書からの自動発見と人手評価のための基準
- 日英単言語 Web コーパスからの対訳 treebank 自動獲得
- ユーザの意図を察する音声対話システム
- 単語分布類似度を用いた類推による単語間の意味的関係獲得法
- 意志決定を支援する音声対話システムの構築と評価
- 音声対話型観光案内システムにおける誤応答リカバリー効果の評価
- 分布類似度とWikipediaから獲得した構造情報を利用した上位下位関係獲得
- 大規模分布類似度計算のためのベイズ手法を用いた新しい類似尺度
- ユーザの相づち・うなずきを喚起する音声対話システム(対話生成,人とエージェントのインタラクション論文)
- 日本語ユーザ発話を用いた英語音声対話システム用統計的言語理解部の準教師つき学習
- Wikipedia を利用した上位下位関係の詳細化
- 観光案内への音声対話システムの活用
- 音声対話による観光案内システムの開発と多言語化 : 音声対話システムAssisTraの研究開発から得られた知見と課題(音声対話システムの実用化に向けて)
- 意味的極性と単語クラスを用いたWhy型質問応答の改善
- 音声対話システムログデータの翻訳結果の選択による統計的言語理解部の言語間移植コストの削減(音声,聴覚)
- 音声対話による意思決定支援システムの実験的評価(音声,聴覚,システム開発論文)
- 名詞の類似表現拡張に基づくオープンドメイン音声質問応答システム用言語モデルの構築
- 音声対話による観光案内システムの開発と多言語化 : 音声対話システムAssisTraの研究開発から得られた知見と課題
- カーネル写像を用いた最小分類誤り学習法(人体・動作の認識と理解,福祉と共生,国際会議報告)
- 最小分類誤り基準に基づく多クラスサポートベクターマシン(人体・動作の認識と理解,福祉と共生,国際会議報告)
- カーネル写像を用いた最小分類誤り学習法(人体・動作の認識と理解,福祉と共生,国際会議報告)
- クラス共通損失関数平滑度の自動設定法を伴う最小分類誤り学習法(人体・動作の認識と理解,福祉と共生,国際会議報告)