経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
音声区間検出(VAD)は,観測信号の音声/非音声区間を検出する技術である.しかし,現在のVAD技術には,目的音声以外に背景雑音や非音声信号が混在する環境では,検出精度が著しく低下するという重大な問題がある.これまでに著者らは,この問題を解決するため,観測信号を経験的モード分解により固有モード関数(IMF)に分解し,その後,非定常成分のIMFから再合成した信号に対して変調スペクトル分析を行うVAD法の提案を行った(提案法A).提案法Aは背景雑音や非音声信号の存在する環境で,従来法より優れた精度で音声区間を検出できたが,誤受理率や誤棄却率を完全には無くせなかった.本論文では,提案法Aの耐性を向上させる手段を検討した.その結果,非定常なIMFを再合成せず,各IMFから音声区間を検出する手法を提案する(提案法B).評価の結果,非定常な背景雑音がある環境で,提案法Bは提案法Aより正確かつ信号の種類に検出精度の左右されない音声区間検出を行うことができ,耐性が向上していることを確認できた.
- 一般社団法人電子情報通信学会の論文
- 2012-05-17
著者
関連論文
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況:2009ソウル会議
- 変調伝達関数に基づいた骨導音声ブラインド回復法の検討
- 変調伝達関数に基づく音声信号処理(3) - 残響環境下の基本周波数推定法と残響時間のブラインド推定 -
- 音声信号への蝸牛遅延特性を利用した情報ハイディングの検討
- 線形予測に基づいた骨導音声回復法の総合評価
- A study on the LP-based blind model in restoring bone-conducted speech (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
- 音声明瞭度の回復を目的とする線形予測分析に基づいた骨導音声ブラインド回復法の評価(聴覚・音声/一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況:2008 Boras会議
- 同時マスキングから推定された聴覚フィルタの同調特性におけるcue音呈示の効果(聴覚と福祉情報工学・一般)
- 同時マスキングにおけるcue音呈示の効果--1kHzプローブ音検知に対するcue音の存在とその周波数配置に関して
- 同時マスキングにおけるcue音呈示の効果 : 1kHzプローブ音に対するマスキング閾値の変化について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- SingBySpeaking : 歌声知覚に重要な音響特徴を制御して話声を歌声に変換するシステム(スペシャルセッション・歌情報処理2)
- cue音呈示によって生じる周波数選択性の変化に関する検討
- 方向性の手掛かりが雑音環境下での報知音の検知能力に及ぼす影響(聴覚・音声・言語とその障害,一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況 : 2008 Boras 会議
- ヒトの聴覚情報処理過程を考慮した音声認識モデル(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 変調伝達関数に基づく音声信号処理(2) - ブラインド残響音声回復法 -
- 残響環境に頑健な音声認識のための前処理 : 音声特有の特徴の利用(認識,理解,対話,一般)
- DS-3-2 蝸牛遅延に基づく電子音響透かし法の総合評価(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- EA2010-31 線形予測に基づいた骨導音声回復法の総合評価
- EA2010-27 音声信号への蝸牛遅延特性を利用した情報ハイディングの検討
- MTFに基づいた残響音声パワーエンベロープの回復方法
- MTFに基づいた残響音声パワーエンベロープの回復方法
- 蝸牛遅延特性に基づいた電子音響透かし法の総合評価
- 雑音残響環境下におけるMTFに基づくパワーエンベロープ回復処理の検討
- ISO/TC 43 ・ISO/TC 43/SC 1 ・ISO/TC 43/SC 2総会 : 音響に関する国際規格の審議状況 : 2009ソウル会議
- SingBySpeaking : 歌声知覚に重要な音響特徴を制御して話声を歌声に変換するシステム(スペシャルセッション・歌情報処理2)
- 時間情報と周波数情報を用いた実環境雑音下における基本周波数推定(聴覚・音声・言語とその障害)
- Improvement of robustness using selective sound segregation for automatic speech recognition systems in noisy environments (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
- 歌声らしさの知覚モデルに基づいた歌声特有の音響特徴量の分析
- 自然性の高い歌声合成のためのヴィブラート変調周波数の制御法の検討(聴覚・音声, 発声, 感情音声)
- 歌声らしさに影響を与える音響的特徴を考慮した話声からの歌声合成法(聴覚・信号処理/一般)
- 歌声におけるF0動的変動成分の抽出とF0制御モデル
- 変調伝達関数に基づいた骨導音声ブラインド回復法の検討
- 線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- DS-3-11 蝸牛遅延特性に基づいた電子音響透かし法の埋め込み限界の検討(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- 蝸牛遅延特性に基づいた電子音響透かし法の提案(聴覚・音響信号処理/一般)
- 頑健で正確なF0推定における室内残響特性の影響について(認識,理解,対話,一般)
- 同時・非同時ノッチ雑音マスキングを利用した聴覚フィルタの同調特性の推定(聴覚・信号処理/一般)
- ガンマチャープフィルタバンクの構築
- 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 複素ケプストラム分析を利用した残響音声の基本周波数推定法(聴覚・音響信号処理/一般)
- DS-4-2 蝸牛遅延に基づいた電子音響透かし法の検討(DS-4. マルチメディア情報ハイディング,シンポジウムセッション)
- 蝸牛遅延特性に基づいた電子音響透かし法の提案
- 方向性の手がかりを利用した雑音環境下での報知音の検知能力の向上(聴覚・音声/一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (音声)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (信号処理)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (応用音響)
- 雑音が付加された波形からの信号波形の一抽出法
- 残響音声からの基本周波数推定に関する検討
- 変調伝達関数の概念に基づいた音声伝達指標のブラインド推定法の検討 (応用音響)
- MTFに基づいた残響音声の回復法の検討(聴覚,音声,言語とその障害)
- 電子音響透かし法のための蝸牛遅延フィルタの最適構成に関する検討
- 雑音環境下における音源分離を認識規範とした音声認識法の提案(生成,認識、音響心理)(音声の基礎と応用シンポジウム)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況:2011ロンドン会議
- 変調伝達関数の概念に基づいた音声伝達指標のブラインド推定法の検討(音場計測・解析,アクティブ・コントロール,一般)
- 電子音響透かし法のための蝸牛遅延フィルタの最適構成に関する検討(音響信号処理,聴覚,一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討 (音声)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討 (応用音響)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (応用音響)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (音声)
- 13. 雑音環境下における音源分離を認識規範とした音声認識法の提案(第309回研究例会発表要旨)
- 蝸牛遅延特性に基づいたサブバンド型電子音響透かし法の検討
- D-21-9 音響電子透かし技術の評価基準と評価コンテスト(D-21.マルチメディア情報ハイディング・エンリッチメント,一般セッション)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 蝸牛遅延に基づいた可逆電子音響透かしの検討(臨場感生成,ユニバーサルメディア,ディジタルエンタテインメント,一般)
- 同時マスキングにおけるcue音呈示の効果1kHzプローブ音に対するマスキング闘値の変化について
- ノッチ雑音同時マスキングデータから推定された聴覚フィルタの同調特性に手がかり音呈示が与える影響
- 蝸牛遅延に基づいた可逆電子音響透かしの検討
- 線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価
- 音響信号に対する情報ハイディング及びその評価基準の検討
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討
- 蝸牛遅延特性に基づいたサブバンド型電子音響透かし法の検討(音響信号処理,聴覚,一般)
- 変調伝達関数に基づいたパワーエンベロープ減算処理の検討(音響信号処理,聴覚,一般)
- 第1回音響電子透かしコンテスト実施結果とその講評(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 第1回音響電子透かしコンテスト実施結果とその講評(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- MTFに基づいたパワーエンベロープ回復処理における統合的な雑音残響除去(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- MTFに基づいたパワーエンベロープ回復処理における統合的な雑音残響除去(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 振幅変調方式のラジオシステムにおけるディジタル音響信号への情報ハイディングの検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 振幅変調方式のラジオシステムにおけるディジタル音響信号への情報ハイディングの検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 室内インパルス応答のモデル化とMTF/STI推定法の検討
- RK-005 蝸牛遅延に基づいた電子音響透かし法とそのブラインド検出の実現(高機能マルチメディア,K分野:教育工学・福祉工学・マルチメディア応用)
- 蝸牛遅延に基づいた電子音響透かし法を利用した音声信号の改ざん検出の検討
- 経験的モード分解と変調スペクトルを用いた音声区間検出と雑音除去の同時処理(音声・音響処理信号,電気音響,信号処理,音声一般)
- 経験的モード分解と変調スペクトルを用いた音声区間検出と雑音除去の同時処理(音声・音響処理信号,電気音響,信号処理,音声一般)
- 経験的モード分解と変調スペクトルを用いた音声区間検出と雑音除去の同時処理(音声・音響処理信号,電気音響,信号処理,音声一般)
- 聴覚の情景解析に基づいた雑音下の調波複合音の一抽出法
- 残響音声からの音声伝達指標のブラインド推定法の検討