Hidden Markov モデルによる日本語有声破裂音の認識
スポンサーリンク
概要
- 論文の詳細を見る
日本語の有声破裂音 /b//d//g/ を認識対象として、音韻を単位とする HMM (Hidden Markov Model) による音声認識手法の基礎検討を行った。まず /b//d//g/ を表現するために必要なモデルの状態数を調べた。実験結果としたループを持つ状態が3個以上必要と判明した。また、音韻が語頭・語中で著しく異なって発声される場合、モデルを別にした方が良いことが分かった。このとき /b//d//g/ の平均認識率は男性話者3名に対し93.7%であった。更にモデルの状態ごとに継続時間長の制御を行った場合、認識率が94.2%に改善された。また、特徴量としてスペクトルとパワーのほかにスペクトルの動的特徴を加え、これらを別々にベクトル量子化することにより、男性3名に対する /b//d//g/ の平均認識率は96.3%に改善された。次に学習データ数が少ない場合の HMM の出力確率の平滑化手法の検討を行った。実験結果として、学習データ数が少ない場合には学習・認識時の両方にファジィVQを行う平滑化が最も効果的であり、/b//d//g/ の認識率が75.1%から88.6%に改善された。
- 社団法人日本音響学会の論文
- 1989-10-01
著者
関連論文
- カーナビゲーション向け音声認識の新たな展開 (特集 次世代の車づくりに貢献する先進技術)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
- HMM-LR音声認識システムの性能評価
- HMM音韻認識と拡張LR構文解析法を用いた連続音声認識
- SL-TRANSにおける文節音声認識 : HMM音韻認識とLR構文解析法による文節音声認識
- Hidden Markov モデルによる日本語有声破裂音の認識
- 音声情報の認識と理解 (認識と理解) -- (応用分野から見た認識と理解)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- 音声認識技術の変遷
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- タスクの例文を用いた自由発話音声認識のための言語モデルの構築
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- D-14-7 符号化データを用いた音声認識方式の検討
- D-14-4 連続音声認識における音節継続時間情報を用いた演算量削減(D-14.音声・聴覚,一般講演)
- D-14-6 統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減(D-14.音声・聴覚,一般講演)
- 音声認識技術
- 音声認識技術とその応用 (特集 IT時代のヒューマンインタフェース技術)
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 単語リジェクト方式のキーワードスポッティングによる評価
- D-14-7 必須形態素の検証によるテキスト検索の改善(D-14.音声,一般セッション)
- 文節スポッティングにおける未知語検出方式の改良
- 自由発話音声における音韻の変形傾向を考慮した音響モデル構成法の検討
- 文節スポッティングにおける未知語処理方式の検討
- 意味主導型音声理解システムのための文節スポッティングの改良
- ベクトル量子化話者適応のHMM音韻認識への適用
- 音声検索技術とその応用 (特集 ヒューマンインタフェースを支える先端技術 : 新たな価値創造に向けて)
- 音声と騒音の密度比推定を用いた音声区間検出法(音声入力・区間検出,認識,理解,対話,一般)
- 音声と騒音の密度比推定を用いた音声区間検出法