隠れマルコフ網と一般化LR構文解析を統合した連続音声認識
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,音素コンテキスト依存LRパーザにより,逐次状態分割法(Successive State Splitting:SSS)で自動生成された隠れマルコフ網(HMnet)を駆動するSSS-LR連続音声認識法の認識性能を評価する.話者適応方式は,ベクトル場平滑化手法(Vector Field Smoothing:VFS)を用いた.まず,語いが1035語のタスクで文節認識実験を行った結果,特定話者に対し第1位で93.2%,3名の話者に対し89.7%という高い認識率を達成し,FuzzyVQに基づく離散HMMや混合連続分布HMMと比較して,認識誤り率がほぼ半減した.次に語いを1649語および3702語に拡張した大語いタスクで評価した結果,男女各2名の計4名の話者に対し,それぞれ第1位の文節認識率で90.2%,87.2%という良好な結果を得た.また,ビーム幅を狭めて処理量を削減しても高い認識率が維持できることを確認した.以上のことから,SSS-LR連続音声認識法は高性能であるばかりでなく,高速化をも達成した方式である.
- 社団法人電子情報通信学会の論文
- 1994-01-25
著者
-
永井 明人
ATR自動翻訳電話研究所
-
嵯峨山 茂樹
ATR自動翻訳電話研究所
-
嵯峨山 茂樹
Atr Interpreting Telephony Research Laboratories
-
シンガー ハラルド
ATR Interpreting Telephony Research Laboratories
-
永井 明人
(株)ATR自動翻訳電話研究所
-
鷹見 淳一
(株)ATR自動翻訳電話研究所
-
嵯峨山 茂樹
(株)ATR自動翻訳電話研究所
-
シンガー ハラルド
(株)ATR自動翻訳電話研究所
-
永井 明人
三菱電機・情報総研
関連論文
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- ピッチ周波数依存音素モデルによるHMM音声認識
- 隠れマルコフ網と一般化LR構文解析を統合した連続音声認識
- 混合連続分布HMM移動ベクトル場平滑化話者適用方式
- ATR音声言語翻訳実験システムASURA
- HMMを用いた形態素解析
- ニューラルファジィ学習法による音声認識の性能向上
- 3)ピッチとスペクトルの相関を用いたHMM音素認識(視聴覚技術研究会)
- 数理統計モデルによる音声認識の現状と将来 (<特集>音声)
- ピッチとスペクトルの相関を用いたHMM音素認識
- 隠れマルコフモデルによる言語モデル自動獲得の検討
- 話者混合逐次状態分割法による不特定話者音声認識と話者適応
- D-5-8 単語の連想関係に基づく概念検索方式の評価(D-5. 言語理解とコミュニケーション, 情報・システム1)
- 隠れマルコフ網で表現した音素コンテキスト依存モデルのための話者適応
- 全音素エルゴディック HMM を用いた教師なし話者適応
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 逐次状態分割法による隠れマルコフ網の自動生成
- 隠れマルコフ網のための話者適応法
- 双方向網探索によるHMM文節音声認識系の評価
- 対話文脈を利用した概念素に基づく音声理解
- 概念素に基づく音声理解への統計的言語制約の導入
- 音声対話における話題推定に基づいた情報提供手法
- 概念素理解方式による音声理解への統計的言語制約の導入
- 対話システムのための概念素理解方式による対話音声理解
- 対話システムのための概念素理解方式による一般的文意理解
- ユーザの行動目的の推定による協調的な音声対話制御
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- 日英音声翻訳システムATR-MATRIXにおける音声認識用音響・言語モデル
- MCE/GPDを用いた自然発話音声認識における不特定話者音響モデルの改善
- クライアント・サーバ型 ATR-MATRIX
- 4E-7 ATR-MATRIX:日英双方向音声翻訳システム
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 大規模な日本語音声データによる音響モデルの分析
- D-5-7 情報検索のタスク評価手法に関する一考察(D-5. 言語理解とコミュニケーション)
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- インターネット情報監視システムの試作
- SCALAR QUANTIZATION OF CEPSTRAL PARAMETERS FOR LOW BANDWIDTH CLIENT-SERVER SPEECH RECOGNITION SYSTEMS
- D-5-1 インタネット全文検索と関連文書検索を用いたポータル構築支援
- 母音および無音のHMMを用いた音声始端検出法
- 音響モデルの構造決定のための統一的な枠組 : 最尤推定による逐次状態分割法と質問に基づく決定木生成法
- PARALLEL JAPANESE/ENGLISH SPEECH RECOGNITION IN ATRSPREC
- DISTANCE-RELATED UNIT ASSOCIATION MAXIMUM ENTROPY LANGUAGE MODELING
- 日英音声翻訳システム「ATR-MATRIX」における音声認識部分の構造と制御方法
- ユーザの行動目標に基づく対話管理手法
- 複数音素にまたがる誤認識特性を用いた音素候補系列追加モデル
- E-16 単語共起照合に基づくクレーム抽出方式の改良(情報抽出,E.自然言語・文書)
- 概念依存関係を用いた概念素理解方式の音声理解性能の評価
- 概念素理解方式における不要語・未知語を考慮した文意探索手法
- 概念依存関係による概念素統合に基づいた音声理解
- 概念素理解方式の一般化とタスク知識の適用手法
- 概念素に基づく意味理解における言語知識の詳細化
- 概念素に基づく意味理解の文の表現性の拡張
- 概念素に基づく意味理解における音声認識への統合手法
- 概念素探索法における概念素仮説からの文意統合方式