環境音モデルとHMM合成による音声区間検出法の文章発話への適用
スポンサーリンク
概要
- 論文の詳細を見る
著者らは, 音声と環境音が重畳している場合にも頑健かつ効率的な音声区間検出を行うために, 環境音モデルとHMM合成を用いる方法を提案している.提案法では, まず音声と環境音のモデルを用いてビタビアライメントを求め, 音声に重畳している環境音を予測する.そして, 音声と予測した環境音の重畳モデルをHMM合成により作成し, この重畳モデルを加えて再度ビタビアライメントを求める.その結果, 音声と環境音が重畳している区間, 重畳している環境音とそのSN比を推定する.本稿では, 提案法を複数の音声区間が存在する文章発話の場合に拡張する.9通りの環境音を文章発話に重畳し, 音声区間検出実験を行った結果, 提案法の検出正解率は従来法と比べて最大で4.7%改善していることが明らかとなった.
- 一般社団法人情報処理学会の論文
- 2001-12-20
著者
-
浅野 太
産業技術総合研究所
-
渡部 生聖
筑波大
-
山田 武志
筑波大学電子・情報工学系
-
北脇 信彦
筑波大学電子・情報工学系
-
渡部 生聖
筑波大学大学院理工学研究科
-
浅野 太
産業技術総合研 情報技術研究部門
関連論文
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
- 一般化固有値展開を用いたセミブラインド音源分離
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 視聴覚センサ情報の統合による音源追跡
- マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
- ロボットにおける音源位置推定(ロボットにおける音響技術)
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 音を分ける
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- Q&Aコーナー(コーヒーブレーク)
- コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- 環境音モデルと HMM 合成による音声区間検出法
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- 音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- SVMを用いた音源数推定の音源分離システムへの応用
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- Kirchhoff-Helmholtz 積分方程式に着目した状態フィードバック制御による反射音抑圧手法の提案
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
- 帯域とビットレートを考慮した楽音符号化品質設計法
- 3. ICAによる音響信号の分離(見分ける,聞き分ける)
- 実音響環境における音響シーンデータの収集
- D-14-36 RWCP実環境音声・音響データベース
- 実環境における音響シーンデータベースの構築
- 一般化固有値展開を用いたセミブラインド音源分離
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
- Eモデルにより算出される品質指標と主観評価値との相関に関する検討(リッチメディア,信頼性・セキュリティ,一般)
- 高次Cumulantを用いたアレイ信号処理
- 近頃, 思うこと
- サブスペース法に基づいたアレイ信号処理による音声強調手法
- 分割構造を持つGriffiths-Jim型適応ビームフォーマについて
- RLS適応ビームフォーマの実装に関する検討
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(ポスターセッション)(第5回音声言語シンポジウム)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(第5回音声言語シンポジウム : ポスターセッション)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討(第5回音声言語シンポジウム : ポスターセッション)
- 複数の雑音抑圧手法を用いた認識結果の統合によるロバスト音声認識の検討
- 低ビットレートオーディオ符号化方式と品質評価
- オーディオメディアの高品質圧縮符号化技術の動向
- IP電話の通話品質評価法に関する標準化動向(VR,ヒューマンファクタ,一般)
- IP電話の通話品質評価法に関する標準化動向(VR,ヒューマンファクタ,一般)
- マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム