残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,人工的な残響環境下ならびに実際の残響環境下での大規模な音声データセットに対して,9個の代表的な基本周波数(F_0)推定法と,前報にて提案したF_0推定法の比較評価の結果を報告する.代表的な推定法として,ケプストラム法,AMDF法,LPC法,自己相開法といった従来法の他,TEMPO,YIN,PHIA法といった最近の手法も利用した.提案法は,複素ケプストラム分析上の変調伝達関数と音源フィルタモデルを利用して,音源情報の周期性・周波性からF_0を推定するものである.大規模な比較評価実験の結果から,代表的な手法すべてによるF_0の推定精度が,残響時間の増加とともに著しく低下したのに対し,提案法により推定されたF_0か,比較的ロバストで正確であることがわかった.また,比較評価の結果から,準同形処理と音源フィルタモデルの概念がF_0推定に効果があることも分かった.これらの結果は,ロバスト性に関して提案法が,従来法よりも優れていることと,人工的な残響環境下ならびに実際の残響環境下で正確なF_0推定を可能としていることを示している.
- 2008-01-18
著者
-
鵜木 祐史
北陸先端科学技術大学院大学情報科学研究科
-
鵜木 祐史
北陸先端科学技術大学院大学
-
石本 祐一
東京工科大学メディア学部
-
細呂木谷 敏弘
北陸先端科学技術大学院大学情報科学研究科
-
石本 祐一
東京工科大学片柳研究所
-
Ishimoto Yuichi
School Of Information Science Japan Advanced Institute Of Science And Technology
-
鵜木 祐史
北陸先端科学技術大学 院大学情報科学研究科
関連論文
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況:2009ソウル会議
- 変調伝達関数に基づいた骨導音声ブラインド回復法の検討
- 変調伝達関数に基づく音声信号処理(3) - 残響環境下の基本周波数推定法と残響時間のブラインド推定 -
- 音声信号への蝸牛遅延特性を利用した情報ハイディングの検討
- 音声信号への蝸牛遅延特性を利用した情報ハイディングの検討 (応用音響)
- 線形予測に基づいた骨導音声回復法の総合評価
- Comparative evaluation of bone-conducted-speech restoration based on linear prediction scheme (応用音響)
- A study on the LP-based blind model in restoring bone-conducted speech (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
- 音声明瞭度の回復を目的とする線形予測分析に基づいた骨導音声ブラインド回復法の評価(聴覚・音声/一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況:2008 Boras会議
- 同時マスキングから推定された聴覚フィルタの同調特性におけるcue音呈示の効果(聴覚と福祉情報工学・一般)
- 同時マスキングにおけるcue音呈示の効果--1kHzプローブ音検知に対するcue音の存在とその周波数配置に関して
- 同時マスキングから推定された聴覚フィルタの同調特性におけるcue音呈示の効果
- 同時マスキングにおけるcue音呈示の効果 : 1kHzプローブ音に対するマスキング閾値の変化について(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- SingBySpeaking : 歌声知覚に重要な音響特徴を制御して話声を歌声に変換するシステム(スペシャルセッション・歌情報処理2)
- cue音呈示によって生じる周波数選択性の変化に関する検討
- 方向性の手掛かりが雑音環境下での報知音の検知能力に及ぼす影響(聴覚・音声・言語とその障害,一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況 : 2008 Boras 会議
- ヒトの聴覚情報処理過程を考慮した音声認識モデル(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 変調伝達関数に基づく音声信号処理(2) - ブラインド残響音声回復法 -
- 残響環境に頑健な音声認識のための前処理 : 音声特有の特徴の利用(認識,理解,対話,一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況 : 2009ソウル会議
- 蝸牛遅延特性に基づいた電子音響透かし法の総合評価 (応用音響)
- DS-3-2 蝸牛遅延に基づく電子音響透かし法の総合評価(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- EA2010-31 線形予測に基づいた骨導音声回復法の総合評価
- EA2010-27 音声信号への蝸牛遅延特性を利用した情報ハイディングの検討
- MTFに基づいた残響音声パワーエンベロープの回復方法
- MTFに基づいた残響音声パワーエンベロープの回復方法
- 蝸牛遅延特性に基づいた電子音響透かし法の総合評価
- 雑音残響環境下におけるMTFに基づくパワーエンベロープ回復処理の検討
- ISO/TC 43 ・ISO/TC 43/SC 1 ・ISO/TC 43/SC 2総会 : 音響に関する国際規格の審議状況 : 2009ソウル会議
- SingBySpeaking : 歌声知覚に重要な音響特徴を制御して話声を歌声に変換するシステム(スペシャルセッション・歌情報処理2)
- 時間情報と周波数情報を用いた実環境雑音下における基本周波数推定(聴覚・音声・言語とその障害)
- Improvement of robustness using selective sound segregation for automatic speech recognition systems in noisy environments (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
- 歌声らしさの知覚モデルに基づいた歌声特有の音響特徴量の分析
- 自然性の高い歌声合成のためのヴィブラート変調周波数の制御法の検討(聴覚・音声, 発声, 感情音声)
- 歌声らしさに影響を与える音響的特徴を考慮した話声からの歌声合成法(聴覚・信号処理/一般)
- 歌声におけるF0動的変動成分の抽出とF0制御モデル
- 変調伝達関数に基づいた骨導音声ブラインド回復法の検討
- 線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- DS-3-11 蝸牛遅延特性に基づいた電子音響透かし法の埋め込み限界の検討(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- 蝸牛遅延特性に基づいた電子音響透かし法の提案(聴覚・音響信号処理/一般)
- 頑健で正確なF0推定における室内残響特性の影響について(認識,理解,対話,一般)
- 同時・非同時ノッチ雑音マスキングを利用した聴覚フィルタの同調特性の推定(聴覚・信号処理/一般)
- ガンマチャープフィルタバンクの構築
- 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 残響環境下でのロバストで正確なF0推定法の比較評価(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 複素ケプストラム分析を利用した残響音声の基本周波数推定法(聴覚・音響信号処理/一般)
- DS-4-2 蝸牛遅延に基づいた電子音響透かし法の検討(DS-4. マルチメディア情報ハイディング,シンポジウムセッション)
- 蝸牛遅延特性に基づいた電子音響透かし法の提案
- 方向性の手がかりを利用した雑音環境下での報知音の検知能力の向上(聴覚・音声/一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (音声)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (信号処理)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用 (応用音響)
- 雑音が付加された波形からの信号波形の一抽出法
- 残響音声からの基本周波数推定に関する検討
- 変調伝達関数の概念に基づいた音声伝達指標のブラインド推定法の検討 (応用音響)
- MTFに基づいた残響音声の回復法の検討(聴覚,音声,言語とその障害)
- 電子音響透かし法のための蝸牛遅延フィルタの最適構成に関する検討
- 雑音環境下における音源分離を認識規範とした音声認識法の提案(生成,認識、音響心理)(音声の基礎と応用シンポジウム)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- ISO/TC43・ISO/TC43/SC1・ISO/TC43/SC2総会 : 音響に関する国際規格の審議状況:2011ロンドン会議
- 変調伝達関数の概念に基づいた音声伝達指標のブラインド推定法の検討(音場計測・解析,アクティブ・コントロール,一般)
- 電子音響透かし法のための蝸牛遅延フィルタの最適構成に関する検討(音響信号処理,聴覚,一般)
- 振幅変調成分の動きの知覚と検出に関する研究
- 蝸牛遅延に基づいた可逆電子音響透かしの検討 (マルチメディア情報ハイディング・エンリッチメント)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討 (音声)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討 (応用音響)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (応用音響)
- 音響信号に対する情報ハイディング及びその評価基準の検討 (応用音響)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (音声)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討 (信号処理)
- 13. 雑音環境下における音源分離を認識規範とした音声認識法の提案(第309回研究例会発表要旨)
- 蝸牛遅延特性に基づいたサブバンド型電子音響透かし法の検討
- D-21-9 音響電子透かし技術の評価基準と評価コンテスト(D-21.マルチメディア情報ハイディング・エンリッチメント,一般セッション)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 蝸牛遅延に基づいた可逆電子音響透かしの検討(臨場感生成,ユニバーサルメディア,ディジタルエンタテインメント,一般)
- ノッチ雑音同時マスキングデータから推定された聴覚フィルタの同調特性に手がかり音呈示が与える影響
- Data hiding scheme for digital-audio in AM radio broadcasting systems (マルチメディア情報ハイディング・エンリッチメント)
- 第1回音響電子透かしコンテスト実施結果とその講評 (マルチメディア情報ハイディング・エンリッチメント)
- 同時マスキングにおけるcue音呈示の効果1kHzプローブ音に対するマスキング闘値の変化について
- ノッチ雑音同時マスキングデータから推定された聴覚フィルタの同調特性に手がかり音呈示が与える影響
- 蝸牛遅延に基づいた可逆電子音響透かしの検討
- 線形予測分析に基づいた骨導音声ブラインド回復法の総合的評価
- 音響信号に対する情報ハイディング及びその評価基準の検討
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 変調伝達関数に基づいたパワーエンベロープ回復処理における音声区間検出の検討(一般,音声・音響信号処理,音声及び一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
- 経験的モード分解と変調スペクトル分析を用いた音声区間検出の耐性向上に関する検討(一般,音声・音響信号処理,音声及び一般)
- 音響信号に対する情報ハイディング及びその評価基準の検討
- 蝸牛遅延特性に基づいたサブバンド型電子音響透かし法の検討(音響信号処理,聴覚,一般)
- 変調伝達関数に基づいたパワーエンベロープ減算処理の検討(音響信号処理,聴覚,一般)
- 第1回音響電子透かしコンテスト実施結果とその講評(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)
- 第1回音響電子透かしコンテスト実施結果とその講評(異種メディア融合,コンテンツ処理,メディア検索,電子透かし,一般)