音声認識における音声強調手法及びモデル適応化手法の検討
スポンサーリンク
概要
- 論文の詳細を見る
本報告では、音声認識における音声強調手法とモデル適応化手法について比較検討を行う。加法性雑音に対する音声強調手法として、スペクトル減算法、連続スペクトル減算法、最小平均二乗誤差推定法を比較したところ、連続スペクトル減算法が最も良い性能を示した。また、乗法性歪みに対する音声強調手法である、ケプストラム平均正規化法のバリエーションについて評価を行い、音声/非音声で別個に話者毎の平均ケプストラムを求める方法が最も良いことが明らかになった。さらに、モデル適応化手法として、HMM合成の近似解法について述べた後、音声強調手法とモデル適応化手法の比較を行い、その優劣はタスクにより異なることを例を挙げて示す。
- 社団法人電子情報通信学会の論文
- 1996-06-13
著者
-
庄境 誠
旭化成株式会社新事業本部
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
庄境 誠
奈良先端科学技術大学院大学
-
庄境 誠
旭化成
-
中村 哲
奈良先端科学技術大学院大学情報科学研究科
-
鹿野 清宏
奈良先端科学技術大学院大学
-
中村 哲
奈良先端科学技術大学院大学
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- 音声認識実用化技術の展開(総合報告)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- Mathematical metric of amount of musical noise in recursive spectral subtraction (応用音響)
- 並列ICAによる雑音推定に基づくリアルタイムブラインド音源抽出マイクロホンの開発(音声,聴覚)
- 空間的スペクトルサブトラクションを用いたハンズフリー音声認識
- 括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
- ICAによる雑音推定を用いた平均二乗誤差最小化短時間振幅スペクトル推定法に基づく両耳補聴器 (応用音響)
- NAMセグメントを用いた個人認証法における未知話者データに対する頑健性の評価(聴覚・音声/一般)
- 音声分析・変換・合成方法STRAIGHTの音声符号化への適用について
- 実環境向け音声対話ロボット「キタちゃん」の開発
- 外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
- HMMに基づく音声合成における強調音声の生成(合成)
- 音響特性補正の導入による肉伝導音声変換の収録環境適応(認識)
- 肉伝導音声変換のための音響特性補正法
- 話者適応に基づく複数話者の非可聴つぶやき認識における話者正規化学習の有効性(音声認識技術)
- 4L-4 微弱振動子とNAMマイクを用いた発話障害者補助(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 喉頭摘出者データを用いた人工音声変換システムの評価
- 喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討(聴覚・音声/一般)
- 肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム(肢体不自由・コミュニケーション補助,情報福祉論文)
- 喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換(視覚障害/聴覚障害,一般)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- チャネル毎スペクトル減算と適応アレー信号処理の統合手法におけるミュージカルノイズ制御
- 音声対話システムにおけるWeb検索タスクの発話分析とWeb検索のための大規模単語コーパスの検討(言語モデル)
- 3Q-3 NAMマイクによる心音の収録とその明瞭化(音声の分析・合成,学生セッション,人工知能と認知科学)
- Mathematical metric of musical noise in arbitrary exponent domain SS (音声)
- Mathematical metric of musical noise in arbitrary exponent domain SS (信号処理)
- Mathematical metric of musical noise in arbitrary exponent domain SS (応用音響)
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (信号処理)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (応用音響)
- 平均二乗誤差最小化短時間振幅スペクトル推定に基づくブラインド信号抽出
- 多点制御波面合成法とWave Field Synthesisによる合成波面の比較検討
- スペクトル減算法におけるミュージカルノイズ発生量と対数カートシス比の関連(音響信号処理/一般)
- 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
- モデル統合に基づく高速EM学習法(音響モデル)(第5回音声言語シンポジウム)
- モデル統合に基づく高速EM学習法
- 十分統計量を用いた教師なし話者適応および環境適応(音声言語情報処理とその応用)
- MLLRを用いた音響モデルの教師なし環境雑音適応アルゴリズム
- 十分統計量に基づく教師なし環境話者適応におけるスペクトルサブトラクションの効果
- 十分統計量を用いた教師なし話者・環境適応の評価
- 高齢者音響モデルによる大語彙連続音声認識
- 十分統計量と話者距離を用いた音韻モデルの教師なし学習法
- スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
- 十分統計量を用いた音韻モデルの教師なし学習における話者選択法の検討
- 高齢者音声の認識
- 充足統計量と話者距離を用いた教師なし話者適応学習法
- 環境雑音適応アルゴリズムの大語彙連続音声認識による評価
- 高齢者向け音響モデルによる大語彙連続音声認識の評価
- 充足統計量と話者距離を用いた音韻モデルの教師なし学習
- 実対話音声を用いた有限状態トフンスデューサ型認識デコーダの評価
- 相補的バックオフを用いた言語モデル融合ツールの構築
- Webからの音声認識用言語モデル自動生成ツールの開発
- 3 使い勝手の良い音声インタフェースの実現(音声認識技術の実用化への取り組み)
- MOSAICブラウザーを用いた音声対話システム
- 多対多最小パターンアライメントアルゴリズムの提案と自動読み付与による評価
- 統計的声質変換に基づく食道音声強調における声質制御
- 音声翻訳システムのための声質変換法と日中英語間における評価
- EA2010-30 反復型スペクトル減算法におけるミュージカルノイズ発生量の数理解析
- SuperHマイコンへの搭載を目的とした連続音声認識ソフトウェアJuliusの計算量削減
- チャネル毎スペクトル減算と適応アレー信号処理の統合手法におけるミュージカルノイズ制御
- チャネル毎スペクトル減算と適応アレー信号処理の統合手法におけるミュージカルノイズ制御
- チャネル毎スペクトル減算と適応アレー信号処理の統合手法におけるミュージカルノイズ制御
- EA2010-29 オーディオオブジェクト定位情報に基づく楽曲サムネイル自動生成手法
- スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
- 参照話者を用いた多対多固有声変換法
- STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法(音声,聴覚)
- Google N-gram を用いた音声認識のタスク汎用性評価の試み
- 3L-1 音声情報案内システム「たけまるくん」の運用(リーディングプロジェクト e-society:自然な音声対話処理技術(1),一般セッション,リーディングプロジェクト e-society)
- 音声HMI技術・製品の品質の計測,評価,保証
- 第5回SLPデベロッパーズフォーラムイベント企画の趣旨について〜コーディネータの立場から〜
- 人間の多様な振る舞いを考慮した音声UIの必要性
- 音声認識実用化技術の展開
- 浴室向け音声コントローラの開発(応用システム)
- 浴室向け音声コントローラに用いる音響モデルの開発(応用システム)
- 鉄道分野における音声・音響センサの応用
- 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 複数音声コーパスの俯瞰的分析(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- コーパス, モデリング, ベンチマークのあるべき姿(パネルディスカッション「音声認識技術の実用化」)
- 赤外線センサにHMMを適用した物体の認識手法(位置情報とセンサ応用)
- 赤外線センサにHMMを適用した物体の認識手法(位置情報とセンサ応用)
- 特許から見た音声認識ビジネスの動向 : 平成14年度特許庁特許出願技術動向調査分析に見る音声認識の特許動向(音声認識のビジネス動向)
- 特許から見た音声認識ビジネスの動向 : 平成14年度特許庁特許出願技術動向調査分析に見る音声認識の特許動向
- 多数音声コーパスより作成された音響空間地図の作成と音響モデルライブラリの構築
- COSMOS法を用いた効率的な音声コーパスの構築
- 2次元可視化手法に基づいた音響空間分割による音響モデルライブラリの開発
- 多次元尺度構成法による音響空間の2次元可視化(音声・音響処理)
- 多次元尺度構成法による音響空間の2次元可視化(音声・音響処理)
- 多次元尺度法を用いた統計的音響モデルの可視化手法(音声,聴覚)
- 2. 実環境で雑音と音声を聞き分ける(見分ける,聞き分ける)
- 音声認識における音声強調手法及びモデル適応化手法の検討
- 鉄道分野における音響センサの可能性
- 自動車運転行動中発話の分析(音声認識実用化に向けて)
- 音声言語情報処理技術デベロッパーズフォーラムの開催にあたり(特別企画「音声認識デベロッパーズフォーラム」)
- 音響認識の鉄道分野応用の検討
- これからの音声 〜技術の実用的利活用〜