雑音環境での認識に頑健な発声全体平均局所分散正規化法
スポンサーリンク
概要
- 論文の詳細を見る
実環境での分散型音声認識システムの利用では,背景雑音による認識精度の劣化を回避するために,軽量でリアルタイム処理が可能な耐雑音機能が必須である.本稿では,このような要件を満たす平均分散正規化法を拡張した,発声全体平均局所分散正規化法を提案する.提案方式は,時間的に変動する雑音によるミスマッチ成分を補正するために局所のケプストラム分散値を用い,また,チャネル特性の推定精度の劣化を回避するために発声全体のケプストラム平均値を用いて正規化処理を行なう.AURORA-2J評価セットを用いた評価実験の結果,クリーン学習時に7.6%,マルチコンディショナル学習時に2.1%,局所平均分散正規化法より高い認識精度を得られることを示す.分散型音声認識の拡張フロントエンドに対しても軽量な処理で同程度の認識精度を達成し,セグメント長を31フレームとした場合に,クリーン学習時に0.8%,マルチコンディショナル学習時に0.4%高い認識精度を得られることを示す.また,音素毎の分布に関する分析の結果,提案手法は局所平均分散法と比較して,音素毎の音響特徴量の分布間距離が長いために音素間の識別性能の劣化をある程度回避できる特徴を持つことを示す.
- 社団法人電子情報通信学会の論文
- 2007-11-21
著者
関連論文
- テレビ視聴環境を利用した顔認識のための変動学習
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- 音楽情報検索向け類似テキスト検索システムの試作(音楽情報検索)
- 携帯電話音声に対する主観評価の精度及び客観評価尺度PESQの有効性の検証(一般)
- B-7-90 VoIPサービス向け通話品質評価手法
- IPベースの音声チャネル多重転送におけるパケット構成制御方式の性能評価
- IPネットワークにおける音声チャネル多重転送方式の音声品質評価
- IPベースのチャネル多重化システムにおけるパケット送出間隔に関する一検討
- 音声IPパケット転送のための多重化リンク制御方式
- B-7-69 音声IPパケットの効率的転送方式に関する性能評価
- B-7-68 音声IPパケットの生成待ち時間に関する検討
- B-7-92 VoIPサービス向け音声IPパケット化方式の一考察
- 雑音環境での認識に頑健な発声全体平均局所分散正規化法
- B-6-57 総合音声伝送品質率に基づくヘッダ圧縮処理の制御に関する一検討(B-6.ネットワークシステム,一般講演)
- 転送特性が非対称なワイヤレスリンクにおけるヘッダ圧縮性能向上に関する検討(Webサービスベースのオフィスアプリケーション・ネットワーキング・マネジメント及び一般)
- B-6-124 転送特性の異なる複合IP網における会話型アプリサービス提供に関する一検討(B-6.ネットワークシステム, 通信2)
- 背景雑音を含む携帯電話音声に対するMOS評価の精度推定とPESQの有効性検証
- B-6-115 ワイヤレスIP網におけるRTPパケット受信バッファ制御に関する一検討(B-6. ネットワークシステム, 通信2)
- 無線 IP 網上における区間分割型 QoS 情報通知機能に基づくメディア品質制御手法
- 無線IP網上における区間分割型QoS情報通知機能に基づくメディア品質制御手法
- B-6-204 NAT環境におけるVoIPプロトコル制御に関する-検討
- B-7-61 IPベースの回線多重化転送方式における音声品質評価
- B-6-11 無線LAN環境での音声IPパケット転送に関する一検討
- アンサンブル学習に基づく音韻継続長のモデル化(合成, 生成, 韻律, 一般)
- 分散型音声認識の商用システム構築(特別企画「音声認識デベロッパーズフォーラム」)
- B-15-16 統合PDA端末の開発(6) : 分散型音声認証システムの実装(B-15. モバイルマルチメディア通信, 通信1)
- 大語彙汎用音声認識エンジンの評価
- 大語彙汎用音声認識エンジンの開発
- 音声翻訳システムのための声質変換法と日中英語間における評価
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験
- 多言語音声の合成
- 連続数字認識を利用した悪戯電話排除システム
- 少数マイクロホンを用いた音声入力手法の検討(立体音響・トランスデューサ/一般)
- 大規模コーパスを用いた音声合成システムXIMERA(音声,聴覚)
- 音声合成システムXIMERAにおける日本語合成音の自然性劣化要因の分析
- コーパス・ベース音声合成システムXIMERA(一般, 一般, チュートリアルレクチャー)
- コーパス・ベース音声合成システムXIMERA
- ATRにおける中国語テキスト音声変換システム
- 品詞列の分析にもとづく中国語音声のポーズ予測(合成・生成,韻律,一般)
- A-10-7 2段階DOA推定法に基づく音源分離手法の評価(A-10.応用音響,一般講演)
- 波形接続型音声合成における素片選択遅延時間の短縮(音声,聴覚)
- 素片接続型音声合成における最良優先探索に基づく素片選択(一般, STRAIGHTスペシャルセッション(SS))
- 波形接続型音声合成における連続素片優先探索の効果(合成, 生成, 韻律, 一般)
- 幅優先探索に基づく短遅延素片選択アルゴリズムの評価
- 短遅延素片選択におけるビーム幅制御の検討
- 短遅延音声合成のための素片選択法(合成・生成,韻律,一般)
- 音声認識を利用した携帯電話サービスの開発(パネルディスカッション「音声認識技術の実用化」)
- 音声合成用大規模音声コーパスの構築(チュートリアル: 音声収録から始めるコーパスベース音声合成, 一般, チュートリアルレクチャー)
- 無線 IP 網上における区間分割型 QoS 情報通知機能に基づくメディア品質制御手法
- 無線IP網上における区間分割型QoS情報通知機能に基づくメディア品質制御手法
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定 (音声)
- INとユーザ設備とのインターワーキングによる高度通信サービスの検討
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定
- B-7-91 音声IPパケットの効率的な伝送方式に関する検討
- コーパスベース音声合成技術の動向[III] : コーパスの設計と評価尺度
- 2010年度喜安記念業績賞紹介 : 第3世代携帯電話向けの分散型音声認識システムの実用化
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- 分散共有フルコンテキストモデルによるHMM音声合成に関する検討
- 個人性を考慮した異言語音声合成に対する知覚評価
- 個人性を考慮した異言語音声合成に対する知覚評価(オーガナイズドセッション「音声知覚生成インタラクション・音声認識合成統合技術」,音声知覚生成/聴覚コミュニケーション,一般)