単語断片の候補選択が可能な音声入力インタフェースの実装と評価(話者照合・音声認識,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
大語彙の単語入力タスクを音声を用いて遂行する際、認識精度が低い話者や環境での誤認識による入力効率低下の問題を解決するため、複数の認識候補の出力と単語断片の利用を併用したマルチモーダルインタフェースを提案する。提案するシステムでは、入力音声に対するASR (Automatic Speech Recognition)システムの出力結果から複数の単語候補を画面に表示し、ユーザへGUI (Graphical User Interface)で選択させる。また、認識精度の低下によって正解の認識候補が候補リストの下位に位置する際、単語断片で認識結果を絞り込み、より効率良く単語入力を行わせるアプローチとその実現法について紹介する。本稿では、この音声入力インタフェースシステムに対するシミュレーション実験の評価結果と、実際の被験者を対象としたオンラインシステムでの被験者実験の結果を示す。語彙サイズ約42,000単語の施設名入力タスクに対して実験を行った結果、提案するインタフェースシステムは認識結果のN-best仮説だけを提示するシステムと比べ、入力効率を改善できることが確認できた。また、シミュレーション実験の結果では認識精度や候補リストの長さの変化に対して頑健性を持つことを示しており、実際のユーザに対する実験では、シミュレーション実験より入力効率の改善は少ないものの、インタフェースシステムの設計段階における改良により更なる性能の向上が期待できる。
- 2011-12-12
著者
関連論文
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- 認識信頼度と対話履歴を用いた音声言語理解手法(音声,聴覚)
- 複数の車内機器操作と雑談を扱えるマルチタスク音声対話システムのユーザビリティの向上
- 複数の車内機器操作と雑談を扱えるマルチタスク音声対話システムのユーザビリティの向上
- 文脈情報と応答内容を用いた単語生起確率の動的生成手法に関する検討(セッション3 : 理解るインタフェース : 音声対話)
- SIG-SLP/SIG-NL合同セッションここまでできるぞ音声/言語処理技術 : 音声編
- ここまでできるぞ音声/言語処理技術 : 音声編
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(プロジェクト紹介(2))(第5回音声言語シンポジウム)
- 擬人化音声対話エージェント基本ソフトウェアの開発プロジェクト報告(第5回音声言語シンポジウム : プロジェクト紹介(2))