監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
スポンサーリンク
概要
- 論文の詳細を見る
筆者らは,マイクロホンで観測した環境音中から異常な音を自動検出する手法として,複数のGMMを併用することで出現頻度の少ない正常音を学習する「多段GMM」をこれまで提案してきた.本稿では,多段GMMを用いたときの異常音検出性能と,監視環境での背景音の関係について検討した.その結果,高騒音下では検出性能が低下し,検出性能は背景音と異常音のSN比に依存することが明らかとなった.また,提案法では複数のしきい値やGMM混合数などのパラメータが必要であるため,観測データから最適なパラメータを推定する手法について検討した.Ptile法による閾値決定とBICによる混合数決定が有効であったが,パラメータを自動推定した場合には20%程度の性能低下が見られた.
- 2010-10-01
著者
-
伊藤 彰則
東北大学大学院工学研究科電気・通信工学専攻
-
牧野 正三
東北大学大学院工学研究科
-
伊藤 仁
東北工業大学
-
相場 亮人
東北大学大学院工学研究科
-
牧野 正三
東北大学|現在,東北文化学園大学
-
伊藤 彰則
東北大学大学院工学研究科
-
伊藤 彰則
東北大学
-
牧野 正三
東北文化学園大学科学技術学部
-
伊藤 仁
東北工業大学工学部
関連論文
- 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化(音声,聴覚)
- 局所変化率変換と時間軸変換に基づく有声音声の正弦波モデル (画像符号化・映像メディア処理レター特集)
- ADPCM出力とサンプルの絶対値を考慮したG.711への固定ビットレート情報ハイディング(マルチメディア情報ハイディング技術とその応用論文)
- DS-3-8 ADPCMを利用した情報ハイディングのビットレート制御(DS-3.マルチメディア情報ハイディング,シンポジウムセッション)
- LogPCM及びADPCMへのMultiple Descriptionスカラ量子化の適用(研究速報,留学生による日本語技術論文)
- MP3パケットロス隠蔽における音質の客観評価に関する検討(音響信号処理,一般)
- MP3パケットロス隠蔽における音質の客観評価に関する検討
- マルチタスク型音声対話システムの対話制御のための発話識別 (音声)
- マルチタスク型音声対話システムの対話制御のための発話識別 (言語理解とコミュニケーション)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)