マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,実環境下での話者識別において,様々な背景雑音への頑健性を期待できるモデルとして,マルチSNR部分帯域モデルを提案する。提案モデルは,各部分帯域ごとに異なるSNR(マルチSNR)の白色雑音重畳音声で学習したモデルで構成される。性能評価のため,クリーン部分帯域モデル,クリーン全帯域モデル,マルチSNR全帯域モデルの3モデルを比較対象として,様々な雑音環境及びSNR下においてテキスト独立型話者識別実験を行った。その結果,提案モデルは,低SNRで複雑な雑音環境において,他のモデルよりも高い頑健性を示した。また,識別性能改善法として短時間ブロック単位での尤度計算を導入し,その有効性を確認した。
- 社団法人日本音響学会の論文
- 2002-12-25
著者
-
尾関 和彦
電気通信大学電気通信学部情報通信工学科
-
尾関 和彦
電気通信大学情報工学専攻
-
吉田 健一
電通大
-
吉田 健一
電気通信大学大学院電気通信学研究科
-
高木 一幸
電気通信大学情報通信工学科
-
高木 一幸
電気通信大学情報工学専攻
-
高木 一幸
電気通信大学
関連論文
- 母音による話者認識における特徴量変換(「感性情報処理の基礎と応用」及びヒューマン情報処理一般)
- 帯域フィルタ出力の時間変化特徴量を利用した音声認識(音声,聴覚)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(第8回音声言語シンポジウム)
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- D-14-8 累積音素尤度によるオンライン発話検出と男女音声認識(D-14.音声・聴覚,一般講演)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 法科学的話者照合のための標準化・正規化クロスVQ歪みの利用
- 単独発声母音を用いた話者照合における特徴量変換
- 言い換えを利用したリスピーク方式によるスポーツ中継のリアルタイム字幕制作(音声,聴覚)
- フィルターバンクサブトラクションによる雑音環境下の音声認識 (音声認識による字幕サービス 特集号)
- 生字幕放送のための音声認識 : システムの概要とリスピークの効果
- 連続音声認識における動的特徴量の高精度な計算法
- 可変長サブワードHMMに基づく未知語処理を導入した音声認識(Session-6 音声認識,第8回音声言語シンポジウム)
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 雑音環境下単語認識のための複素周波数領域における参照再構成法
- マルチSNR・マルチバンド法を用いた話者識別における様々な学習雑音に対する性能評価
- マルチSNR部分帯域モデルを用いた話者識別システムの耐雑音性能改善
- マルチSNR部分帯域モデルを用いた雑音環境下での話者識別
- フレーム単位で最適 SNR 部分帯域モデルを選択する話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- マルチSNR部分帯域GMMを用いた雑音環境下での話者認識
- 部分帯域HMMを用いた雑音環境下における話者識別
- 部分帯域HMMを用いたテキスト独立型話者識別
- 日本語連続音声認識におけるスコア関数の比較
- 雑音低減のための複素周波数領域における参照再構成法(第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 雑音低減のための複素周波数領域における参照再構成法
- 話し言葉コーパスの係り受け解析を目的とした韻律の分析
- [若手研究者育成レクチャーシリーズ]韻律と統語構造
- 韻律情報を用いた日本語読み上げ文の係り受け解析におけるニューラルネットワークの利用
- 日本語読み上げ文の係り受け解析における複数ポーズ情報の利用
- 文節間係り受け整合度と文節重要度を用いて自動簡約した日本語文の主観評価
- 韻律を利用した係り受け解析におけるポーズ・基本周波数情報の結合法の検討
- 日本語読み上げ文の係り受け解析における韻律的特徴量の有効性
- 係り受け解析におけるポーズ・ピッチの利用法の検討
- 文節重要度と係り受け整合度に基づく日本語文簡約アルゴリズム
- 帯域フィルタ出力の時間変化特徴量を利用したニュース音声認識(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 実況・対談における発声変形を考慮した音響モデルの検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- 誤認識関数を最小化する標準パターン学習アルゴリズム
- 音響尤度補正による雑音環境下の音声認識の改善
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 複数の信頼度尺度を統合した音声認識(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音モデルに基づく補正音響尤度を用いた音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 真の認識率の事後確率に基づく認識システムの性能比較
- 決定木による日本語長文の短文分割
- 分類木を用いた日本語文の自動文節分割
- 文節間係り受け距離の統計的性質を用いた日本語文の係り受け解析
- 文節間係り受け距離の統計的性質とその係り受け解析への応用
- アフィン変換を用いた音声特徴量の正規化
- 選択学習による音響モデルの適応化 (音声認識による字幕サービス 特集号)
- 文節重要度と係り受け整合度に基づいた文簡約実験
- 雑音重畳音声の認識における連語言語モデルの比較
- 1994年音声言語処理国際会議
- 間投詞・非流暢発話と休止による対話音声区分化の検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- ニュース音声認識における言語モデルの検討
- 韻律情報を利用した係り受け解析
- 韻律情報を利用した係り受け解析
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討(ポスターセッション,第13回音声言語シンポジウム)
- 11-2 番組音声とリスピーク音声の自動認識を利用したニュース字幕制作実験(第11部門 放送現業)
- 10-2 番組音声とリスピーク音声の認識を併用した生字幕制作の検討(第10部門 放送現業)
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討
- 非負値行列因子分解を用いた音素配列情報の抽出による言語識別の検討