ベクトル量子化話者適応のHMM音韻認識への適用
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、筆者らがすでに提案した話者適応化アルゴリズムをHMM音韻認識に適用する。HMMに適用する際には、動的特徴を考慮したセパレートベクトル量子化、ファジィベクトル量子化、ファジィヒストグラム、ファジィマッピングを用いる。更に、HMMとの効率的な整合のために、対応づけヒストグラムを標準話者のファジィ級関数としてファジィHMMを計算する話者適応アルゴリズムを用いる。音韻バランス216単語、重要語5,240単語を用いて有声破裂音/b,d,g/及び全音韻の音韻認識実験を男女計3名の話者について行った結果、次の事柄が確かめられた。(1)動的特徴を考慮したセパレートベクトル量子化を用いることにより有声破裂音の認識率が6.4%改善できる、(2)ファジィベクトル量子化を用いることにより有声破裂音の認識率が3.4%改善できる、(3)ファジィヒストグラムを用いることにより話者適応化の学習に必要な単語数を100単語から25単語に削減しても認識率の低下を0.4%に抑えられる。また、有声破裂音の認識率は、男性間で83.1%、男女間で76.5%で、従来法[M.Feng et al. ICASSP 88]との比較では11.7%の認識率の改善となること、全音韻の認識では、男性間で75.6%、男女間で71.8%で、上位3位までの累積認識率では、男性間、男女間いずれの場合にも約91%を達成できることが分かった。
- 社団法人日本音響学会の論文
- 1989-12-01
著者
関連論文
- カーナビゲーション向け音声認識の新たな展開 (特集 次世代の車づくりに貢献する先進技術)
- D-14-16 音素脱落を許す単語モデルを用いた日本人英語の認識
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- 多対多最小パターンアライメントアルゴリズムの提案と自動読み付与による評価
- 統計的声質変換に基づく食道音声強調における声質制御
- 音声翻訳システムのための声質変換法と日中英語間における評価
- EA2010-30 反復型スペクトル減算法におけるミュージカルノイズ発生量の数理解析
- EA2010-29 オーディオオブジェクト定位情報に基づく楽曲サムネイル自動生成手法
- 未知語認識のための仮名・漢字単位の構築手法と性能評価
- HMM音声合成における系列内変動モデリング手法の評価
- 異なる収録機器に対応した肉伝導音声変換のための音響特性自動補正
- 1対多固有声変換に基づく無喉頭音声の音質及び話者性の改善
- 任意乗スペクトル減算法におけるミュージカルノイズ発生量の数理解析(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 拡散音場理論に基づく残響環境下音声認識(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- HMM-LR音声認識システムの性能評価
- Hidden Markov モデルによる日本語有声破裂音の認識
- Mathematical metric of musical noise in Wiener filtering (音声)
- D-14-12 車室内で発生する規則性非定常騒音下での音声認識
- 音声認識技術の変遷
- D-14-10 N-gram言語モデルを用いた音声対話システムにおける冗長語処理の検討
- タスクの例文を用いた自由発話音声認識のための言語モデルの構築
- SD-3-3 N-gramモデルを用いた音声対話システムのための音声認識の検討
- D-14-20 音声対話システムにおける少量テキストを用いた言語モデルのタスク適応に関する検討
- 自由発話音声認識のためのトライ音節モデルの検討
- 音声対話システムにおける教師なし話者適応の検討
- 音声対話システムにおける湧き出し誤りのリジェクト方式の検討
- 認識結果の信頼度を考慮した教師無し話者適応方式の検討
- D-14-7 符号化データを用いた音声認識方式の検討
- ニューラルネットを用いた音声処理
- ニューラルネットワークの音声情報処理への応用
- D-14-4 連続音声認識における音節継続時間情報を用いた演算量削減(D-14.音声・聴覚,一般講演)
- D-14-6 統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減(D-14.音声・聴覚,一般講演)
- 音声認識技術
- 音声認識技術とその応用 (特集 IT時代のヒューマンインタフェース技術)
- ピッチパタンの統計モデルに基づく句境界情報を利用した文節スポッティング
- 単語リジェクト方式のキーワードスポッティングによる評価
- Mathematical metric of speech distortion in various types of BSSA (音声)
- Unsupervised parameter identification of MMSE STSA estimator (音声)
- Unsupervised parameter identification of MMSE STSA estimator (信号処理)
- Unsupervised parameter identification of MMSE STSA estimator (応用音響)
- Mathematical metric of speech distortion in various types of BSSA (信号処理)
- Mathematical metric of speech distortion in various types of BSSA (応用音響)
- A-4-4 ICAにおける確率統計モデルを用いたパーミュテーション解決法(A-4.信号処理,一般セッション)
- 統計的機械翻訳の手法を用いた音声情報案内システムのための応答文生成手法の検討
- D-14-7 必須形態素の検証によるテキスト検索の改善(D-14.音声,一般セッション)
- 音声理解研究の動向 (<小特集>音声情報処理の最近の動向)
- 教師音として抽出対象信号情報を用いた非負値行列因子分解による目的楽器音信号の抽出 (応用音響)
- 非線形処理におけるミュージカルノイズ発生量と音声認識率の関係(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 様々なウィーナフィルタにおけるミュージカルノイズ発生量の数理解析(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 波面合成法を用いたディスプレイ前方での音像深度制御
- 文節スポッティングにおける未知語検出方式の改良
- 自由発話音声における音韻の変形傾向を考慮した音響モデル構成法の検討
- 文節スポッティングにおける未知語処理方式の検討
- 意味主導型音声理解システムのための文節スポッティングの改良
- ベクトル量子化話者適応のHMM音韻認識への適用
- 様々なブラインド空間的サブトラクションアレーにおける音声歪み量の数理尺度(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 一般化平均二乗誤差最小化短時間振幅スペクトル推定法におけるパラメータのブラインド推定(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 様々なブラインド空間的サブトラクションアレーにおける音声歪み量の数理尺度(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 一般化平均二乗誤差最小化短時間振幅スペクトル推定法におけるパラメータのブラインド推定(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 様々なブラインド空間的サブトラクションアレーにおける音声歪み量の数理尺度(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 一般化平均二乗誤差最小化短時間振幅スペクトル推定法におけるパラメータのブラインド推定(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 教師音として抽出対象信号情報を用いた非負値行列因子分解による目的楽器音信号の抽出(音場計測・解析,アクティブ・コントロール,一般)
- 音声検索技術とその応用 (特集 ヒューマンインタフェースを支える先端技術 : 新たな価値創造に向けて)
- 音声情報案内システムにおけるBag-of-Wordsを特徴量とした無効入力の棄却
- 携帯端末用の音声情報案内システム開発に向けたネットワークサービスの検討
- 招待講演 音声強調処理における高次統計量の利用 (応用音響)
- 招待講演 音声強調処理における高次統計量の利用 (信号処理)
- 招待講演 音声強調処理における高次統計量の利用 (音声)
- Iterative Blind Spatial Subtraction Array for Musical-Noise-Free Speech Enhancement in Diffuse Noise (応用音響)
- D-9-36 多様な利用環境における音声情報案内サービスソフトウェアの開発(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 実環境におけるミュージカルノイズフリー雑音抑圧の評価(音響・超音波サブソサイエティ合同研究会)
- ポスタ会議発表音声アーカイブ構築を目的としたブラインド音声抽出の評価(音響・超音波サブソサイエティ合同研究会)
- 独立成分分析におけるパーミュテーション問題の確率統計モデルを用いた解決法
- 混合音に対する一次音源の分離方位推定と波面合成法についての複数受聴位置における音像方位提示能の検討(音響・超音波サブソサイエティ合同研究会)
- 拡散性雑音におけるミュージカルノイズ音声強調のための反復型ブラインド空間的サブトラクションアレー
- 音声強調処理における高次統計量の利用(一般,音声・音響信号処理,音声及び一般)
- 音声強調処理における高次統計量の利用(一般,音声・音響信号処理,音声及び一般)
- 音声強調処理における高次統計量の利用(一般,音声・音響信号処理,音声及び一般)
- 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術(音声対話システムの実用化に向けて)
- 音声と騒音の密度比推定を用いた音声区間検出法(音声入力・区間検出,認識,理解,対話,一般)
- 音声と騒音の密度比推定を用いた音声区間検出法