発音ネットワークに基づく発音辞書の自動生成
スポンサーリンク
概要
- 論文の詳細を見る
自然発話音声では, 読上げ発声では起こらないような, 大きな発声変形を生じることがある. このような発声を音声認識しようとした場合, 標準的な読みが付与された発音辞書を用いても, 正しい認識結果は得られない. つまり, 標準的な発音系列と実際に発声される発音系列のミスマッチを緩和する機構が必要である. 本論文では, まず, 発声内容を標準的な辞書表記に基づいて書き起こした音素系列を標準発音系列とし, この発声を音素認識した結果の音素系列を修正発音系列とみなす. 次に, これらの対応関係を発音ネットワークとして構築し, この発音ネットワークを利用して発音辞書を自動的に生成する方法について述べる. 本手法は, (1)学習データ中の発声数が少ない語いに対しても信頼性の高い発音記号列が得られる, (2)任意の認識対象語いの追加に対して, 発音辞書を生成することができるなどの特徴をもつ. 自然発話音声認識実験から, この発音ネットワークに基づいて自動生成した発音辞書は, 認識性能, 認識時間の両面において, 従来の標準発音列に基づいた辞書よりも優れていることがわかった.
- 社団法人電子情報通信学会の論文
- 1997-10-25
著者
-
匂坂 芳典
(株)エイ・ティ・アール音声翻訳通信研究所
-
深田 俊明
Atr Interpreting Telecommunications Research Laboratories
-
深田 俊明
(株)エイ・ティ・アール音声翻訳通信研究所
関連論文
- クラスに依存した語彙の確率的記述に基づく階層型言語モデル
- ニューラルネットワークと言語統計量に基づく発音辞書の自動生成
- 話者正規化を用いた不特定話者音響モデルの学習
- 韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
- 統計的手法を用いた基本周波数制御規則の自動抽出
- リカレントニューラルネットワークを用いたセグメント境界推定
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 話者正規化スペクトルサブバンドパラメータを用いた雑音下での音声認識
- 日本語音声コーパスを対象としたJRTkによる音声認識
- 3次元ビタビ探索に基づく話者正規化手法
- 双方向リカレントニューラルネットワークを用いた音素境界推定とその応用
- スペクトルサブバンドセントロイドを用いた雑音下での連続音声認識
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- スペクトルサブバンドセントロイドを用いた雑音下での音声認識
- 発音ネットワークに基づく発音辞書の自動生成
- 音素境界推定ネットワークを利用した音声の自動セグメンテーション
- 自由発話音声認識における音響分析の比較
- リカレントニューラルネットワークを用いた音素境界推定と音声認識への応用
- ACOUSTIC MODELS FOR SPEECH RECOGNITION : A SURVEY
- 発音ネットワークに基づく発音辞書の自動生成
- 統計処理による入力文から中間表現への変換を用いた音声言語理解
- 品詞および可変長形態素列の複合N-gramを用いた日本語形態素解析
- 最大事後確率推定によるN-gram言語モデルのタスク適応
- 品詞および可変長単語列の複合N-gramの自動生成
- 中間言語表現の生成を目的とした統計的音声理解方式(音声情報処理 : 現状と将来技術論文特集)