複素時間窓を利用した混合音声の分析手法の検討(音響信号処理,聴覚,一般)
スポンサーリンク
概要
- 論文の詳細を見る
有声音声や楽器音などの音響特性を,振幅と周波数が滑らかに時間変化する正弦波の和として近似する正弦波モデルは,音声の分析や合成など幅広い分野への応用が期待されている.一般に音声信号は基本周波数や声道伝達特性が時間変化する非定常信号であり,この様な信号を高い精度で再現する正弦波パラメータの推定は容易ではない.本稿では理論的な検討により,このパラメータ推定の障害を個々の正弦波成分のスペクトル歪みと,周波数軸上で近接する成分間の干渉の二つに分類した.このうち前者に対しては局所変化率変換を,後者に対しては複素窓関数を用いることで,非定常信号の正弦波パラメータを推定する新たな音響分析手法を提案した.音声信号や楽器音を入力とした性能評価実験の結果は,提案手法の有効性を支持するものであった.また,これらの混合音の分析結果から,複数の音響信号が混在する場合の正弦波パラメータ推定において提案手法が重要な基礎となる可能性が示唆された.
- 一般社団法人電子情報通信学会の論文
- 2013-08-02
著者
関連論文
- 局所変化率変換と時間軸変換に基づく有声音声の正弦波モデル (画像符号化・映像メディア処理レター特集)
- DS-4-3 ADPCMを規範に用いたlogPCMへの下位ビット置換法の提案(DS-4. マルチメディア情報ハイディング,シンポジウムセッション)
- MP3パケットロス隠蔽における音質の客観評価に関する検討(音響信号処理,一般)
- MP3パケットロス隠蔽における音質の客観評価に関する検討
- マルチタスク型音声対話システムの対話制御のための発話識別 (音声)
- マルチタスク型音声対話システムの対話制御のための発話識別 (言語理解とコミュニケーション)
- 局所変化率変換と時間軸変換に基づく有声音声の正弦波モデル(音声,聴覚)
- 正弦波モデルに基づく高品質音声変調の検討(聴覚・音響信号処理/一般)
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法 (福祉情報工学)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法 (音声)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法 (パターン認識・メディア理解)
- 多段GMMおよびセグメントモデルを用いた異常音検出の検討(音響信号処理,一般)
- 5R-4 ハミング楽曲検索のための音響信号からのデータベース生成の検討(音楽検索・解析,学生セッション,人工知能と認知科学)
- 1W-1 ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(映像処理システム,学生セッション,ネットワーク)
- WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価 (音声)
- WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価 (言語理解とコミュニケーション)
- 多段GMMおよびセグメントモデルを用いた異常音検出の検討
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,一般)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,及び一般)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,及び一般)
- ビットストリームパターン再構成によるFlash Videoの適応的Multiple Description符号化(画像符号化,通信・ストリーム技術,及び一般)
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- B-6-82 ディスジョイントパスルーティングによる高秘話・高音質音響通信システム(B-6.ネットワークシステム,一般講演)
- 歌唱の「熱唱度」評価の検討
- マルチタスク型音声対話システムの対話制御のための発話識別(言語モデル,第11回音声言語シンポジウム)
- マルチタスク型音声対話システムの対話制御のための発話識別
- 複数F0候補を用いた音楽音響信号からのハミング楽曲検索
- 複数の音声対話システム併用のための発話識別
- 複数 F0 候補データベースによる歌声楽曲検索の検討
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- 監視マイクロホンのための多段GMMを用いた異常音検出手法(テーマセッション,福祉と見守りのための画像・音声処理)
- WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価(一般(ポスターセッション),第11回音声言語シンポジウム)
- WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価
- WWW を利用した言語モデル適応のための検索クエリ構成の検討
- WWW を利用した言語モデル適応のための検索クエリ構成の検討
- 質問応答データベースの自動作成に基づく音声対話システムの評価(ポスターセッション,第10回音声言語シンポジウム)
- 合成音声と評価スコア統合に基づく英語のイントネーション評価(認識,理解,対話,一般)
- 対話型CALLシステムに関する検討
- I-021 動き情報を用いたビットストリームパターン推定によるFlash VideoのMultiple Description符号化(グラフィクス・画像,一般論文)
- 複数の音声対話システム併用のための発話識別
- 正弦波モデルに基づく高品質音声変調の検討
- 城下町の形態研究 : V・京都-その3・道の性格について
- 城下町の形態研究 : V・京都-その2・街区について
- 城下町の形態研究 : V・京都-そのユ・屋敷の分布について
- RE-005 局所変化率変換に基づく有声音声の正弦波モデル(自然言語・音声・音楽,査読付き論文)
- 複数の音声対話システム併用のための発話識別
- 音声認識を利用した韓国人のための日本語発音学習システム
- デモンストレーション:音楽情報処理の研究紹介XI
- 非言語情報を用いたHMMによるユーザ発話前内部状態の推定(テーマセッション,時系列パターン認識)
- 非言語情報を用いたHMMによるユーザ発話前内部状態の推定(テーマセッション,時系列パターン認識)
- 非言語情報を用いたHMMによるユーザ発話前内部状態の推定
- 対話ターン中のユーザ状態の推定に有用なモダリティの分析(オーガナイズドセッション)
- 複素時間窓を利用した混合音声の分析手法の検討(音響信号処理,聴覚,一般)