マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
スポンサーリンク
概要
- 論文の詳細を見る
音声をスペクトル領域でいくつかの部分帯域に分割したとき, 各部分帯域の話者認識に対する貢献度は, その中に含まれる個人性情報や音韻情報の量によって異なる.このように部分帯域によって異なる情報を利用するためには, 各部分帯域毎に話者モデル作成や尤度計算を行う部分帯域モデルが有効である.しかし, 実環境では通常, 音声に様々な雑音が混入するため, 雑音を考慮した部分帯域モデルを作成する必要がある.本稿では, 各部分帯域に対して, 種々のSNRを持つ雑音付加音声で学習した複数のGMMを用意することにより, 雑音に対する頑健性を高めた部分帯域モデル(マルチSNR部分帯域モデル)を提案する.いくつかの雑音環境下でのテキスト独立型話者識別実験により, このモデルは従来の部分帯域モデルや全帯域モデルよりも高い識別性能を持つことが明らかになった.また, 尤度再結合重みの最適化を行うことにより, 識別性能が改善されることが確認された.
- 社団法人電子情報通信学会の論文
- 2000-09-22
著者
-
尾関 和彦
電気通信大学電気通信学部情報通信工学科
-
尾関 和彦
電気通信大学情報工学専攻
-
吉田 健一
電通大
-
吉田 健一
電気通信大学大学院電気通信学研究科
-
高木 一幸
電気通信大学情報通信工学科
-
高木 一幸
電気通信大学情報工学専攻
-
高木 一幸
電気通信大学
関連論文
- 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
- 単独発声母音を用いた話者照合における特徴量変換
- 言い換えを利用したリスピーク方式によるスポーツ中継のリアルタイム字幕制作(音声,聴覚)
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 生字幕放送のための音声認識 : システムの概要とリスピークの効果
- 連続音声認識における動的特徴量の高精度な計算法
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- マルチSNR・マルチバンド法を用いた話者識別における様々な学習雑音に対する性能評価
- マルチSNR部分帯域モデルを用いた話者識別システムの耐雑音性能改善
- マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
- フレーム単位で最適 SNR 部分帯域モデルを選択する話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- 部分帯域HMMを用いた雑音環境下における話者識別
- 部分帯域HMMを用いたテキスト独立型話者識別
- 日本語連続音声認識におけるスコア関数の比較
- 雑音低減のための複素周波数領域における参照再構成法(第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法
- 話し言葉コーパスの係り受け解析を目的とした韻律の分析
- [若手研究者育成レクチャーシリーズ]韻律と統語構造
- 韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用
- 日本語読み上げ文の係り受け解析における複数ポーズ情報の利用
- 文節間係り受け整合度と文節重要度を用いて自動簡約した日本語文の主観評価
- 韻律を利用した係り受け解析におけるポーズ・基本周波数情報の結合法の検討
- 日本語読み上げ文の係り受け解析における韻律的特徴量の有効性
- 係り受け解析におけるポーズ・ピッチの利用法の検討
- 文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 誤認識関数を最小化する標準パターン学習アルゴリズム
- 音響尤度補正による雑音環境下の音声認識の改善
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 真の認識率の事後確率に基づく認識システムの性能比較
- 決定木による日本語長文の短文分割
- 分類木を用いた日本語文の自動文節分割
- 文節間係り受け距離の統計的性質を用いた日本語文の係り受け解析
- 文節間係り受け距離の統計的性質とその係り受け解析への応用
- アフィン変換を用いた音声特徴量の正規化
- 選択学習による音響モデルの適応化 (音声認識による字幕サービス 特集号)
- 文節重要度と係り受け整合度に基づいた文簡約実験
- 雑音重畳音声の認識における連語言語モデルの比較
- 1994年音声言語処理国際会議
- 間投詞・非流暢発話と休止による対話音声区分化の検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- 韻律情報を利用した係り受け解析
- 韻律情報を利用した係り受け解析
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 11-2 番組音声とリスピーク音声の自動認識を利用したニュース字幕制作実験(第11部門 放送現業)
- 10-2 番組音声とリスピーク音声の認識を併用した生字幕制作の検討(第10部門 放送現業)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討