不特定話者認識
スポンサーリンク
概要
- 論文の詳細を見る
電話網におけるサービスなどに音声認識を適用する場合には不特定多数のユーザに対して高い認識精度が得られなければならない。不特定話者音声認識では、話者による音声のスペクトル特徴の変動をいかに吸収して高い認識精度を達成するかが重要な問題である。本稿では、話者による変動に対応して不特定話者音声認識で高い認識精度を得るための手法についてHMMにもとづく方法を中心に述べる。話者による変動に対処する方法には、話者によらず音韻性を表現する特徴パラメータを用いる方法、モデルを話者クラスタに分けて蓄えておき入力音声の話者にもっとも適合するクラスタのモデルにより認識を行なう方法、音韻ごとの特徴パラメータの分布に重なりをなくしその分離をよくするようにモデルを学習する方法、認識対象とする話者の少量の音声を用いてモデルパラメータをその話者に適応化する方法などがある。
- 社団法人電子情報通信学会の論文
- 1994-05-19
著者
関連論文
- 1991年音響・音声・信号処理国際会議(ICASSP91)報告
- 自由発声中の連続数字音声認識
- 音韻ラベルを用いない HMM 評価法とそれを用いた連続音声認識用 HMM の評価
- 番号案内を対象とした大語い連続音声認識アルゴリズム
- フレーム間相関を利用した音韻 HMM による音声認識
- 音声認識の言語処理技術 (音声認識の最新技術)
- 音声認識の音響処理技術 (音声認識の最新技術)
- VQコードのBigramで制約した音韻HMMによる音声認識
- N-bestに基づく話者適応化法の検討
- N-bestに基づく教師なし話者適応化法
- 連続数字音声認識における音響モデル学習法の検討
- 連続数字音声における音響モデル学習法の検討
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- N-best候補を用いた話題抽出の検討
- ニュース音声を対象とした連続音声認識に基づく話題抽出
- ニュース音声を対象とした大語彙連続音声認識と話題抽出
- ニュース音声を対象とした大語彙連続音声認識
- 高次n-gramを用いた大語彙連続音声認識の検討
- 新聞記事データベースを用いた大語い連続音声認識
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 統計的翻訳言語モデルを用いた音声理解
- 単語trigramを用いた大語彙連続音声認識
- 統計的翻訳言語モデルを用いた音声理解
- 単語trigramを用いた大語彙連続音声認識
- 音声理解のための言語モデル自動獲得
- 新聞記事読み上げタスクを用いた大語彙連続音声認識における音響モデルの検討
- 新聞読み上げタスクを用いた大語彙連続音声認識における言語モデルの検討
- テキストコーパスを用いた音声理解のための言語モデル自動獲得
- 新聞記事を用いた大語彙連続音声認識の検討
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 新聞記事を用いた大語彙連続音声認識の検討
- 音声理解のための言語モデル自動獲得の検討
- マルコフモデルによる文仮説の再編成
- IVTTA94会議報告
- 不特定話者認識
- 大語彙連続音勢認識研究用日本語コーパス : JNAS
- 大語彙連続音声認識のための読み上げ文コーパスの構築
- 大語彙連続音声認識のための読み上げ文の選択
- 大語彙連続音声認識研究のためのテキストデータ処理
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- パネル討論「統計的言語処理/音声言語処理における大規模言語データベースの利用」
- 大語彙連続音声認識研究のためのテキストデータ整備
- テキストコーパスを用いた音声理解のための言語モデル自動獲得