音源アクティビティ系列のクラスタリングに基づく高残響・劣決定下音源数推定法
スポンサーリンク
概要
- 論文の詳細を見る
音源アクティビティ系列のクラスタリングに基づく,新しい音源数推定法を提案する.提案法では,まず,周波数ビンごとに,想定される最大の音源数よりも多いクラスタを用意してクラスタリングベース音源分離を行うことにより,音源アクティビティ系列を得る.次に,全周波数ビンで得られた音源アクティビティ系列をまとめてクラスタリングし,アクティビティが集中しているクラスタの数として音源数推定値を得る.実験により,高残響・劣決定の条件下でも,提案法により音源数を高精度で推定できることを示す.なお,我々は,[1]において,スパース事前分布を用いた音源数推定法を提案したが,本稿ではスパース事前分布を用いなくても音源数推定が可能であることを示す.
- 一般社団法人電子情報通信学会の論文
- 2013-10-04
著者
-
中谷 智広
日本電信電話(株)
-
伊藤 信貴
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
荒木 章子
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
-
ジャファリ イングリッド
日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
関連論文
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 時変ガウス音源モデルと多チャネル自己回帰観測モデルに基づく最ゆう法による音響信号の残響除去(ブラインド信号処理の技術とその応用論文)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 周波数領域における音声信号の残響除去のためのクロスバンド効果補正(音響信号処理/一般)
- 音声分離と楽音分離の統合のための音オントロジーの提案
- Dirichlet事前分布を用いた音声区間検出の検討
- 音声区間検出技術の最近の研究動向
- B-8-59 停電時上り音声通信を実現する光アクセス方式の提案(B-8.通信方式,一般セッション)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 音声信号のブラインド残響除去:最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声信号のブラインド残響除去 : 最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声信号のブラインド残響除去 : 最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
- 音声ストリーム分離法の提案と複数音声の同時認識の予備実験
- カクテルパーティ効果実現のための音響ストリーム分離の検討 : II.残差駆動型アーキテクチャの提案とモノラル音への適用
- カクテルパーティ効果実現のための音響ストリーム分離の検討 : I.音環境理解によるモデル化
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- B-8-11 停電時上り音声通信光アクセス方式の実現技術の検討(B-8.通信方式,一般セッション)
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- A-10-6 周波数領域ICAにおける初期値の短時間データからの学習(A-10. 応用音響,一般セッション)
- ブラインド信号処理技術の研究動向(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- バイノーラル音源分離の音声認識による評価
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- AS-6-4 マルチステップ線形予測に基づく残響除去法の雑音耐性の音声認識による評価(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- 調波構造に基づくモノラル音声信号のブラインド残響除去(音声, 聴覚)
- 調波構造に基づく音声信号のブラインド残響除去
- 複数の音声区間検出法の適応的統合の検討と考察
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- ホイットマンリチャーズ編, "ナチュラルコンピュテーション"
- 複合型ニューラルネットワークについて
- Exponential 自己回帰モデルを用いた音声信号分析方法
- 占有度を用いた耐雑音性の高い基本周波数推定法
- 調波成分の占有度を用いた基本周波数抽出法
- 瞬時周波数を用いたF_0抽出法の複数音声による評価
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 雑音低減・耐雑音音声認識のためのスペクトル強調と特徴量補正の統合的アプローチ(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 帯域に適した分離手法を用いるサブバンド領域ブラインド音源分離
- サブバンド処理によるブラインド音源分離に関する検討
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 音声の周期性・非周期性成分比とSwitching Kalman filterに基づく雑音下音声区間検出(音響処理)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
- 確率モデルを用いた音声強調 : 雑音抑圧,音源分離,残響除去,統合技術及びその応用(近年の音響信号処理における数理科学の進展)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧
- 音声・音楽信号の残響除去・制御技術とその応用 : 音声をより聞き取りやすく、音楽をより豊かに
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 音源アクティビティ系列のクラスタリングに基づく高残響・劣決定下音源数推定法