複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
近年,会話音声の自動アノテーションや議事録作成,会議支援などを目的に,会話音声を認識・理解する会話シーン分析の研究が国内外で盛んに行なわれている.会話においては,複数話者が自由に発話することから,収録音声は複数話者の声や環境雑音が重畳された複雑な構造をしており,音声認識などの分析を行なう際には,様々な音声処理技術が必要である.本稿では,会話シーン分析で用いられる,マイクロホンアレイによる音声強調処理と話者区間推定(ダイアライゼーション)にフォーカスを当て,その代表的な技術を紹介する.
- 2011-05-05
著者
-
荒木 章子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
中谷 智広
NTTコミュニケーション科学基礎研究所
-
吉岡 拓也
日本電信電話(株)NTTコミュニケーション科学基礎研究所
-
藤本 雅清
NTTコミュニケーション科学基礎研究所
-
藤本 雅清
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
堀 貴明
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
堀 貴明
Nttコミュニケーション科学基礎研究所
-
中谷 智広
日本電信電話(株)nttコミュニケーション科学基礎研究所
-
FUJIMOTO Masakiyo
the ATR Spoken Language Communication Research Laboratories
-
中谷 智広
Nttコミュニケーション科学基礎研究所日本電信電話株式会社
-
中谷 智広
日本電信電話(株)
-
Fujimoto Masakiyo
Ntt Communication Science Laboratories Ntt Corporation
-
Fujimoto Masakiyo
Department Of Electronics And Informatics Faculty Of Science And Technology Ryukoku University
-
中谷 智広
NTT研究所
-
堀 貴明
日本電信電話(株)
-
吉岡 拓也
日本電信電話株式会社
関連論文
- 音声信号のブラインド残響除去--最新の研究動向 (音声)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 時変ガウス音源モデルと多チャネル自己回帰観測モデルに基づく最ゆう法による音響信号の残響除去(ブラインド信号処理の技術とその応用論文)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
- 音声信号のブラインド残響除去--最新の研究動向 (信号処理)
- 音声信号のブラインド残響除去--最新の研究動向 (応用音響)
- 雑音下音声認識評価ワーキンググループ活動報告 : 認識に影響する要因の個別評価環境(3)(SIG-SLP内組織の活動報告)
- 周波数領域ブラインド音源分離のための極座標表示に基づく活性化関数
- 周波数領域における音声信号の残響除去のためのクロスバンド効果補正(音響信号処理/一般)
- 招待講演 時間周波数マスクによる実環境でのブラインド音源分離 (応用音響)
- Dirichlet事前分布を用いた音声区間検出の検討
- 音声区間検出技術の最近の研究動向
- B-8-59 停電時上り音声通信を実現する光アクセス方式の提案(B-8.通信方式,一般セッション)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 音声信号のブラインド残響除去:最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声信号のブラインド残響除去 : 最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声信号のブラインド残響除去 : 最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
- Dirichlet事前分布を用いた音声区間検出の検討 (音声)
- B-7 乳児音声の基本周波数パタンの分析のための統計的手法(時系列モデル)(2003年度統計関連学会連合大会記録(日本統計学会第71回大会))
- 乳児音声の基本周波数パタン分析のための統計的手法
- 調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
- 音源分離技術の最新動向
- 5T-4 調波GMMとWienerフィルタに基づく音楽音響信号の残響抑圧(音楽信号処理,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- B-8-11 停電時上り音声通信光アクセス方式の実現技術の検討(B-8.通信方式,一般セッション)
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- AS-4-5 音声のスパース性を用いたUnderdetermined音源分離(AS-4. ICAを超える,シンポジウムセッション)
- A-10-6 周波数領域ICAにおける初期値の短時間データからの学習(A-10. 応用音響,一般セッション)
- A-10-9 多くの背景音からの主要音源のブラインド抽出(A-10.応用音響,基礎・境界)
- A-10-8 3次元マイクロホンアレイを用いた多音源ブラインド分離(A-10.応用音響,基礎・境界)
- A-10-7 観測ベクトルのクラスタリングによるブラインド音源分離(A-10.応用音響,基礎・境界)
- 畳込み混合のブラインド音源分離(独立成分分析とその応用特集号)
- ブラインド信号処理技術の研究動向(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- [招待論文]独立成分分析に基づくブラインド音源分離(マイクロホンアレー・ブラインド分離・音源位置推定及び一般)
- 移動音源の低遅延実時間ブラインド分離
- 周波数領域ブラインド音源分離における permutation 問題の頑健な解法
- 周波数領域ICAと時間遅れスペクトル減算による残響下での実時間ブラインド音源分離
- 間隔の異なる複数のマイクペアによるブラインド音源分離
- 非定常スペクトルサブトラクションによる音源分離後の残留雑音除去
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- NTTにおける男女共同参画への取組み(男女共同参画のページ)
- 「木のいのち 木のこころ」, 西岡常一著, 新潮OH!文庫, 2001年(私のすすめるこの一冊)
- 周波数領域ブラインド音源分離と適応ビームフォーマの等価性について
- 周波数領域ブラインド音源分離と周波数領域適応ビームフォーマの関係について
- 混じりあった声を解く--遠隔発話の認識を目指して (特集論文1 人にやさしい対話型コンピュータ)
- ブラインドな処理が可能な音源分離技術 (特集 コミュニケーションの壁を克服するための音声・音響処理技術)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 動的分散適応に基づく音声強調と音声認識の統合手法の提案(音声認識・識別,第9回音声言語シンポジウム)
- 動的分散適応に基づく音声強調と音声認識の統合手法の提案(音声認識・識別,第9回音声言語シンポジウム)
- 動的分散適応に基づく音声強調と音声認識の統合手法の提案(音声認識・識別,第9回音声言語シンポジウム)
- 複数の音声区間検出法の適応的統合の検討と考察
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (音声)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (信号処理)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (応用音響)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 音声特徴抽出法SPADEを用いたフロントエンドの耐雑音評価標準コーパスによる評価(Session-7 スペシャルセッション(ポスター): 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- 集束ビーム型スピーカアレイを用いた音像の遠近制御について(音響・超音波サブソサイエティ合同研究会)
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 雑音のバイアス-残差成分の分解と各成分の最適化に基づく雑音抑圧の検討(音響モデル・雑音・分析,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 時間周波数マスクによる実環境でのブラインド音源分離
- 雑音低減・耐雑音音声認識のためのスペクトル強調と特徴量補正の統合的アプローチ(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 帯域に適した分離手法を用いるサブバンド領域ブラインド音源分離
- サブバンド処理によるブラインド音源分離に関する検討
- フレーズ置換のための調波非調波GMM・NMFに基づく音源分離・演奏合成
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 雑音モデルの頑健なオンライン推定法に基づく雑音抑圧の検討(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)
- 集束ビームを用いて生成した仮想音源の遠近感評価
- 劣決定音源分離のための分離音声のケプストラムスムージング
- A-10-9 フルランク空間相関行列モデルに基づく拡散性雑音除去(A-10.応用音響,一般セッション)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
- 周波数依存の時間差モデルによる劣決定BSS
- 高即応・高精度な歪み特徴量モデルの推定のための動的静的アプローチ(耐雑音処理,第13回音声言語シンポジウム)
- 高即応・高精度な歪み特徴量モデルの推定のための動的静的アプローチ(耐雑音処理,第13回音声言語シンポジウム)
- 招待講演 音声・音楽信号の残響除去・制御技術とその応用 : 音声をより聞き取りやすく、音楽をより豊かに (応用音響)
- 確率モデルを用いた音声強調 : 雑音抑圧,音源分離,残響除去,統合技術及びその応用(近年の音響信号処理における数理科学の進展)
- 周波数依存の時間差モデルによる劣決定BSS
- 高即応・高精度な歪み特徴量モデルの推定のための動的静的アプローチ
- 複数人会話シーン分析の研究と今後の展望(オーガナイズドセッション:マルチモーダル情報によるコミュニケーション環境理解,認識,理解,対話,一般)
- 音声・音楽信号の残響除去・制御技術とその応用 : 音声をより聞き取りやすく、音楽をより豊かに
- 対数スペクトル事前分布を用いたMAPスペクトル推定に基づく劣決定音源分離(ブラインド信号処理,一般)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 周波数依存到来時間差推定に基づく劣決定ブラインド音源分離の高速化