番号案内を対象とした大語い連続音声認識アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
大語いの連続音声を対象とした音声認識アルゴリズムを提案する.本アルゴリズムは一般化予測LRパーザと音韻HMMを使ったHMM-LRアルゴリズムを基本としている.認識性能の向上と処理時間を減らすためここでは以下の3種類手法を併用する.(1)ビームサーチにおいて精密なゆう度を求めるために前向きのゆう度と後ろ向きのゆう度を利用する.(2)HMMのトレリス計算を削減して効率的な探索を行うために,整合窓を使って予測された意韻が存在しそうな音声区間のみを音韻照合に利用する.(3)効率的に探索を行うために無声化母音や表記の揺らぎを正規化し,同じ音韻系列をLRパーザのスタックと状態をチェックしてマージを行う.このアルゴリズムを7万人以上の加入者を含む電話番号案内タスクに適用して,連続単語発声の認識実験を行った.特定話者音声認識において85%の文認識率を達成した.更に,不特定話者音声認識においても,71%の文認識率を達成した.また,自由発声の特定話者音声認識においては59%の文理解率を達成した.
- 社団法人電子情報通信学会の論文
- 1994-02-25
著者
-
南 泰浩
NTTヒューマンインタフェース研究所
-
松岡 達雄
Nttマルチメディアビジネス開発部
-
松岡 達雄
Ntt
-
南 泰浩
Ntt
-
松岡 達雄
NTTヒューマンインタフェース研究所
-
鹿野 清宏
NTTヒューマンインタフェース研究所
-
山田 智一
NTTヒューマンインタフェース研究所
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科
関連論文
- 最尤推定法を用いたHMM適応化法
- 1991年音響・音声・信号処理国際会議(ICASSP91)報告
- 8)話者認識技術の実用化に向けて(マルチメディア情報処理研究会)
- 話者認識技術の実用化に向けて
- ゆう度最大化による雑音とひずみへのHMM適応化法
- 自由発声中の連続数字音声認識
- 連続音声認識のためのネットワーク構造を用いた効率的探索手法
- パワーの分散を考慮した拡張HMM合成法
- 雑音と歪みを含んだ音声へのHMM適応化手法の評価
- HMM合成に基づく尤度最大化適応法
- 尤度最大化原理によるHMM適応化法
- 音韻ラベルを用いない HMM 評価法とそれを用いた連続音声認識用 HMM の評価
- 番号案内を対象とした大語い連続音声認識アルゴリズム
- フレーム間相関を利用した音韻 HMM による音声認識
- 電話番号案内を対象としたマルチモーダル対話システムの作成と音声入力の評価
- 音声認識の言語処理技術 (音声認識の最新技術)
- 音声認識の音響処理技術 (音声認識の最新技術)
- 実対話音声を用いた有限状態トフンスデューサ型認識デコーダの評価
- 大語彙連続音声認識におけるビームサーチ性能向上のための言語モデル同期化法
- 有限状態変換器で定義される任意の音声認識タスクのための時間同期ビタービデコーダ
- 任意乗スペクトル減算法におけるミュージカルノイズ発生量の数理解析(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- VQコードのBigramで制約した音韻HMMによる音声認識
- 学習用テキストからの認識探索空間作成能力の評価
- 音節連鎖統計情報のタスク適応化
- Top-Down音韻認識とBottom-Up音韻認識を融合した音声認識
- Top-down音韻認識とBottom-up音韻認識を融合した音声認識 (音声認識)
- 音声認識エンジンREXの開発
- 音声認識における仮名・漢字文字連鎖確率に基づく統計的言語モデルの利用
- オーディオオブジェクト個別操作法とそのイヤホン漏洩雑音低減への応用(立体音響,一般)
- N-bestに基づく話者適応化法の検討
- N-bestに基づく教師なし話者適応化法
- 連続数字音声認識における音響モデル学習法の検討
- 連続数字音声における音響モデル学習法の検討
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 大語彙連続音声確認のためのコンパクトな可変長n-gramモデル
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- 効率的な仮説のマージ機能を持つLRパーザ制御による音声認識
- 音声認識合成による応用構築の容易な電話対話システム
- N-best候補を用いた話題抽出の検討
- ニュース音声を対象とした連続音声認識に基づく話題抽出
- ニュース音声を対象とした大語彙連続音声認識と話題抽出
- ニュース音声を対象とした大語彙連続音声認識
- 高次n-gramを用いた大語彙連続音声認識の検討
- 新聞記事データベースを用いた大語い連続音声認識
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 統計的翻訳言語モデルを用いた音声理解
- 単語trigramを用いた大語彙連続音声認識
- 統計的翻訳言語モデルを用いた音声理解
- 単語trigramを用いた大語彙連続音声認識
- 音声理解のための言語モデル自動獲得
- 新聞記事読み上げタスクを用いた大語彙連続音声認識における音響モデルの検討
- 新聞読み上げタスクを用いた大語彙連続音声認識における言語モデルの検討
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 新聞記事を用いた大語彙連続音声認識の検討
- 音声研究会報告 : 解説と展望
- 音声認識合成による応用構築の容易な電話音声対話システム
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- Delayed Arc EvaluationによるLRパーザ制御に基づくViterbiサーチ
- 音声認識機能を持つ住所入力システム
- 音声入力機能を持つ住所入力システム
- 音声認識機能を持つ住所入力システム
- 音声認識における新しい高速化
- HMM-LR方式音声認識サーバを用いたマルチモーダル入力
- 語彙制約なし音声認識における音節継続時間長制御の効果
- クライアント・サーバ構成のHMM-LR連続音声認識システムとその応用
- 実時間音声認識における高精度探索方式--音素環境依存モデルを用いたHMM-LR音声認識方式の高速化 (インタラクティブな音声インタフェ-スの実現を目指して)
- 多次元尺度法を用いた統計的音響モデルの可視化手法(音声,聴覚)
- 新聞記事を用いた大語彙連続音声認識の検討
- 音声理解のための言語モデル自動獲得の検討
- マルコフモデルによる文仮説の再編成
- IVTTA94会議報告
- 不特定話者認識
- 大語彙連続音勢認識研究用日本語コーパス : JNAS
- 大語彙連続音声認識のための読み上げ文コーパスの構築
- 大語彙連続音声認識のための読み上げ文の選択
- 大語彙連続音声認識研究のためのテキストデータ処理
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- 大語彙連続音声認識研究のためのテキストデータ整備
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 初期語彙発達の急増期における統計的性質と特徴量抽出(言語と学習・場の供創・意味の創発)