音声認識のためのスペクトル内挿を用いた話者適応化
スポンサーリンク
概要
- 論文の詳細を見る
連続分布型HMMに基づく音声認識のための教師あり話者適応化の手法を提案する.使用者の負担を軽くするために適応化用単語の発声数を少なくすると,その中に現れない半音節(認識単位)の割合が増える.本手法では,適応化用データに含まれる半音節のHMMパラメータを補正した後で,適応化用データには含まれていない半音節のHMMパラメータをパラメータ空間における内挿(スペクトル内挿)により補正する.更に,適応化用データセットに依存した偏ったパラメータが推定されるのを避けるため,多数話者の多数音声データに基づく補正を行う.5,000単語大語い音声認識をシミュレートした類似100単語認識実験を行い,提案手法を評価した.不特定話者HMMによる認識率81.2%のところ,50単語を適応化に用いたとき,85.2%まで認識率が上昇し,本手法の有効性が確かめられた.
- 社団法人電子情報通信学会の論文
- 1994-02-25
著者
-
篠田 浩一
Necマルチメディア研究所
-
渡辺 隆夫
日本電気(株)中央研究所
-
磯 健一
Necメディア情報研究所
-
渡辺 隆夫
日本電気株式会社 C&C 情報研究所
-
篠田 浩一
日本電気株式会社
-
磯 健一
日本電気株式会社情報メディア研究所
関連論文
- C&Cの夢,自動通訳の実現に向けて : 受賞業績 携帯端末など組込み機器向け多言語自動音声翻訳システムの実用化技術の開発(平成20年度喜安記念業績賞紹介)
- 携帯端末向け大語彙連続音声認識システム(音声,聴覚)
- 大語彙姓離散発声電話音声認識の検討
- コンパクトなディクテーションの開発
- D-14-6 コンパクト日本語ディクテーションの開発
- 音声による文章入力のための言語モデル適用法の検討
- F-9 大語彙音声認識を用いたPDA向け音声UIの試作(音声・音声言語情報処理,F.音声・音楽)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 木構造辞書とネットワーク文法を用いたコンパクト大語彙連続音声認識エンジン
- ビームサーチを用いた大語彙音声認識方式の検討
- LE-1 自由文通訳と例文選択型通訳を統合した自動通訳システム(E. 自然言語・文書)
- PDAで動作する旅行会話向け日英双方向音声翻訳システム
- 自動通訳システムINTERTALKERにおける日本語音声合成
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 音声認識・合成ソフトウェアを利用した音声I/Fを持つ電子メールシステムの試作
- 音声認識/合成ソフトウェアのAPI開発
- 階層的Eigen Voice法による話者適応化(音声,聴覚)
- 階層的主成分分析を用いた木構造話者適応
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- HMMの変分ベイズ学習によるテキスト文書の話題分割法(認識・理解・対話)
- 概念表現を用いた自動通訳システムINTERTALKER
- 音声認識のためのスペクトルの調波構造の利用
- SNRの変動を考慮したスペクトルサブトラクションの検討
- 種々の電話機による音声認識性能の評価
- 環境変動を考慮した電話音声認識方式の種々の電話機による評価
- 雑音環境を考慮した自律型話者適応化
- 雑音環境の変動を考慮した話者適応化
- 音声認識のための高速環境適応
- 高速環境適応におけるコンパクト化の検討
- 雑音環境の変動に強い音声認識 (音声/オ-ディオ信号処理) -- (音声認識)
- 音声認識のための高速環境適応
- パソコン向け音声認識ソフトウェア
- 自動通訳システムINTERTALKERにおける音声認識
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 話し言葉認識に向けた基本技術と応用(抽出と解析)
- 半音節単位に基づく単語認識のためのワードスポッティング
- 半音節を用いたワードスポッティングによる単語認識
- バンドルサーチ法を用いた連続音声認識の高速化
- 日英双方向自動通訳システムINTERTALKER
- 自動通訳システム (音声ヒューマンインタフェース特集)
- 連続音声認識からの概念表現の作成
- MDL基準を用いたHMMサイズの削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識のためのMDL基準を用いた効果的なガウス数削減
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化(論文賞贈呈)
- 音声認識における自律的なモデル複雑度制御を用いた話者適応化
- 情報量基準を用いた音声認識単位の自動生成
- 記述長最小原理を用いた話者適応化
- パソコン向けソフトウェア連続音声認識システム
- パソコンソフト連続音声認識
- 木構造化された確率分布を用いた話者適応化
- 大語彙音声入力装置の開発
- 音声認識のためのスペクトル内挿を用いた話者適応化
- 音素記号と特徴ベクトルの同時出力確率を用いた音声認識
- 音声インターフェースを用いたWeb新聞へのアクセス
- 音声インターフェースを用いたWeb新聞へのアクセス
- 半音節を単位とするHMMを用いた不特定話者音声認識
- 音声入力パソコンネットワーク旅客機空席案内試作システム
- 音声インタフェースを用いたパソコンネットフライト空席案内
- 音声認識におけるパタンマッチングの手法
- 音節認識を用いたゆう度補正による未知発話のリジェクション
- 音声認識システムの構築における諸問題とその解決
- 3-2 連続音声認識(3.基礎技術)(最近の音声処理技術)
- 音声入力を用いたパソコンネット旅客機空席案内システム
- パソコン音声認識ソフトウエアを用いた音声ダイヤラの試作
- ニュ-ラル予測モデルを用いた不特定話者音声認識 (ニュ-ロコンピュ-ティング論文)