孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 高頻度単語と短い単語(基本単語)を併用した音声認識を用いた組織名入力インタフェースを提案する.これは, まず音声で組織名を入力し, 音声認識の結果得られた複数の単語・基本単語候補から, ペンタッチで選択, 入力するマルチモーダルインタフェースである.組織名といった語彙サイズが大きく, 常に新しい組織名が生み出されるため, すべてを登録することが難しく, また音声認識が難しいタスクに対し, 単語認識と連続基本単語認識を併用するもので, 認識対象のカバー率と認識性能, 入力効率の両方の向上を図った.そして, その認識結果から単語・基本単語系列候補, 基本単語候補をタッチパネルに表示し, ペンタッチにより簡単に選択して入力が可能な組織名入力インタフェースを考案した.この高頻度単語と基本単語を併用した音声認識をオフラインの認識実験により評価したところ, それぞれ単独での音声認識結果より良い結果が得られた.さらにこの認識結果に基づいてインタフェースを用いた場合の入力可能な割合をシミュレーションすると, 約92%で入力が可能となることが分かった.また, このインタフェースを実装してオンラインで被験者実験を行ったところ, 音声認識性能の低下で1回の発声では83.3%の入力可能率となったが, 2回まで音声入力を許すことで93.3%となった.
- 社団法人電子情報通信学会の論文
- 2005-12-15
著者
-
中川 聖一
豊橋技術科学大学
-
北岡 教英
豊橋技術科学大学
-
北岡 教英
名古屋大学大学院情報科学研究科
-
北岡 教英
名古屋大学大学院情報科学研究科メディア科学専攻
-
押川 洋徳
豊橋技術科学大学情報工学系
-
押川 洋徳
豊橋技術科学大学
関連論文
- 長時間分析に基づく位相情報を用いた音声認識の検討 (音声)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 1987年音響・音声・信号処理国際会議(ICASSP 87)
- 文字コードに依存しない情報検索の実現
- 中間言語を用いたインドネシア語-日本語対訳辞書の拡充
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法
- ニュース番組における字幕生成のための文内短縮による要約
- 3W-5 ニュース音声の認識結果を用いた要約による字幕生成
- 連続出力分布型HMMによる日本語音韻認識