複数音素にまたがる誤認識特性を用いた音素候補系列追加モデル
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,学習データから抽出された誤認識特性を利用して,音響モデルを改良したりビーム幅を大きくしてもなお残る誤認識を救済する音素候補系列追加モデルを提案する.このモデルには次の特徴がある.(1)前後のコンテキストを考慮しながら誤認識を抽出するために,抽出される誤認識は音素ではなく,HMMの状態として表現する.(2)音素という単位に拘束されずに誤認識部分を正確に抽出するため,音素HMMの各状態のマッチング区間が正しい区間と一致しているかどうかを考慮しながら,一つの誤認識部分に含まれるHMMラベル数に制限を与えずに抽出する.上記音素候補系列追加モデルを用いて,実際の認識結果の状態系列を入力して正解音素系列を探索するシステムを構築し,本モデルを評価した.その結果,本モデルを用いることで,音響モデル単独では得られない正解音素系列が探索でき,探索後の音素認識率を向上させることを確認した.
- 社団法人電子情報通信学会の論文
- 1996-12-25
著者
-
シンガー ハラルド
(株)ATR自動翻訳電話研究所
-
匂坂 芳典
(株)ATR音声翻訳研究所
-
脇田 由実
松下電器先端技術研究所
-
シンガー ハラルド
ATR音声翻訳通信研究所
-
脇田 由実
(株)ATR音声翻訳通信研究所
関連論文
- 隠れマルコフ網と一般化LR構文解析を統合した連続音声認識
- 局所的な句構造によるポーズ挿入規則化の検討
- 統計的手法を用いた音声パワーの分析と制御
- 音素環境依存LRテーブル作成法とその連続音声認識システムへの応用
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- 日英音声翻訳システムATR-MATRIXにおける音声認識用音響・言語モデル
- MCE/GPDを用いた自然発話音声認識における不特定話者音響モデルの改善
- クライアント・サーバ型 ATR-MATRIX
- 4E-7 ATR-MATRIX:日英双方向音声翻訳システム
- 音素対ごとに特化した特徴量を用いた音素認識法の検討
- 音素履歴木を用いたフレーム同期型SSS-LR文音声認識
- 意味的類似性を用いた音声認識正解部分の特定法と正解部分のみ翻訳する音声翻訳手法
- 意味的類似性を用いた後処理的な音声認識正解部分特定法と音声翻訳手法への導入
- 意味的類似性を用いた音声認識正解部分の特定法と音声翻訳手法への応用 (言語・音声理解と対話処理研究会(第17回))
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- 大規模な日本語音声データによる音響モデルの分析
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 双方向リカレントニューラルネットワークを用いた音素境界推定とその応用
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- ACOUSTIC MODELS FOR SPEECH RECOGNITION : A SURVEY
- SCALAR QUANTIZATION OF CEPSTRAL PARAMETERS FOR LOW BANDWIDTH CLIENT-SERVER SPEECH RECOGNITION SYSTEMS
- 複数音素にわたるHMMの誤認識特性を用いた語彙候補の追加
- 単語bi-gramを用いた連続音声認識への状態系列の誤認識特性の利用
- 話者適応が誤認識特性に及ぼす影響について
- 母音および無音のHMMを用いた音声始端検出法
- 音響モデルの構造決定のための統一的な枠組 : 最尤推定による逐次状態分割法と質問に基づく決定木生成法
- PARALLEL JAPANESE/ENGLISH SPEECH RECOGNITION IN ATRSPREC
- DISTANCE-RELATED UNIT ASSOCIATION MAXIMUM ENTROPY LANGUAGE MODELING
- 日英音声翻訳システム「ATR-MATRIX」における音声認識部分の構造と制御方法
- 単語の依存関係を用いた単語クラスの自動決定法
- 複数音素にまたがる誤認識特性を用いた音素候補系列追加モデル
- ML-SSSに基づく自然発話音声のための音響モデル作成
- 尤度最大基準に基づく逐次状態分割法
- F_0生成モデルを用いたテンプレートに基づく連続音声の句境界検出
- F_0生成モデルに基づくアクセントテンプレートの連続整合による句境界検出
- 韻律モデルを用いたF_Oクラスタリングに基づくアクセント句境界検出
- 韻律モデルを用いたF_0クラスタリングに基づくアクセント句境界検出
- 仮説数による誤認識箇所推定尺度の評価
- 品詞N-gramと単語N-gramの融合言語モデル
- 接続の方向性を考慮した多重クラスN-gram言語モデル
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル
- 接続の方向性を考慮した多重クラス複合N-gram言語モデル