[招待論文]独立成分分析に基づくブラインド音源分離(マイクロホンアレー・ブラインド分離・音源位置推定及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
私たちが普段それほど意識せずに行っている「聞きたい音を聞き分ける」という能力がコンピュータには欠けている.独立成分分析に基づく手法は,ある人が話している声と別の人の声,背景に流れる音楽,雑音等,それぞれの音は互いに統計的に独立であるという仮定により,複数のマイクで観測した信号を互いに独立な信号に分離すれば,それぞれのもとの音を復元できる,という原理に基づいている.この手法は,音源や混合系の情報を原理的に必要としない,いわゆるブラインドな分離が可能である.招待講演では,独立成分分析とは何か,ブラインド音源分離とは何か,どのようにして分離が達成されるのか,分離のメカニズムはどのようなものか,などについて,できるだけ直感的に分り易く説明する[1].
- 社団法人電子情報通信学会の論文
- 2003-06-13
著者
-
荒木 章子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
向井 良
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
澤田 宏
NTTコミュニケーション科学基礎研究所
-
牧野 昭二
NTTコミュニケーション科学基礎研究所
-
澤田 宏
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
荒木 章子
NTTコミュニケーション科学基礎研究所
-
向井 良
NTTコミュニケーション科学基礎研究所
-
牧野 昭二
Nttコミュニケーション科学基礎研究所メディア情報研究部
関連論文
- メディアコンテンツ特定技術の最新動向(学生/教養のページ)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 周波数領域ブラインド音源分離のための極座標表示に基づく活性化関数
- 複数人会話における非言語インタラクション構造の推定--誰が誰にどのように反応しているか?
- PMTC/N-ISDN用多地点エコーキャンセラの構成
- メディアコンテンツ特定技術の最新動向
- 高速メディア探索 (特集 コミュニケーション環境の未来に向けた研究最前線)
- 招待講演 時間周波数マスクによる実環境でのブラインド音源分離 (応用音響)
- 再構成可能なハードウェアを用いた充足可能性問題の解法
- しきい論理に基づく再構成可能デバイスの可変論理部
- しきい論理に基づく再構成可能デバイスの可変論理部
- しきい論理に基づく再構成可能デバイスの可変論理部
- ニューロンMOSによる対称関数回路の設計
- ニューロンMOSによる対称関数回路の設計手法
- ニューロンMOSを可変論理部に用いた再構成可能デバイスに関する検討
- ニューロンMOSによる対称関数回路の設計手法
- ニューロンMOSを可変論理部に用いた再構成可能デバイスに関する検討
- SPFD : 論理関数の自由度の新しい表現方法
- 論理関数の種々の分解手法を統合したLUT回路合成法
- 論理関数の種々の分解手法を統合したLUT回路合成法
- 論理関数の種々の分解手法を統合したLUT回路合成法
- 変数の重なりのない単純な関数分解を用いた組合せ回路の改善方法
- B-8-59 停電時上り音声通信を実現する光アクセス方式の提案(B-8.通信方式,一般セッション)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- ステレオエコーキャンセラの課題と解決法
- 全指向性を持つスピーカ・マイクロホン一体型通話装置の設計
- チャネル数変換型多チャネル音響エコーキャンセラ
- ハンズフリー音声会議装置における複数マイクロホンの構成の検討
- ステレオエコーキャンセラにおける相互相関変動方式の検討
- 音響系の変動に着目したステレオ信号の相関低減方法 -(第2報)聴覚特性を考慮した最適化
- ハンズフリー音声会議装置における複数マイクロホンの構成の検討
- 音響系の変動に着目したステレオ信号の相関低減方法
- 音源分離技術の最新動向
- サブバンドエコーキャンセラにおけるフィルタ係数更新ベクトルの平坦化の検討
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 多クラス早期認識ブースティング法(一般,顔・人物・ジェスチャ・行動)
- 多クラス早期認識ブースティング法(一般,顔・人物・ジェスチャ・行動)
- B-8-11 停電時上り音声通信光アクセス方式の実現技術の検討(B-8.通信方式,一般セッション)
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- AS-4-5 音声のスパース性を用いたUnderdetermined音源分離(AS-4. ICAを超える,シンポジウムセッション)
- A-10-6 周波数領域ICAにおける初期値の短時間データからの学習(A-10. 応用音響,一般セッション)
- A-10-9 多くの背景音からの主要音源のブラインド抽出(A-10.応用音響,基礎・境界)
- A-10-8 3次元マイクロホンアレイを用いた多音源ブラインド分離(A-10.応用音響,基礎・境界)
- A-10-7 観測ベクトルのクラスタリングによるブラインド音源分離(A-10.応用音響,基礎・境界)
- 畳込み混合のブラインド音源分離(独立成分分析とその応用特集号)
- 周波数領域ICAと時間領域ICAを統合したSIMOモデル信号のブラインド抽出法の評価(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- ブラインド信号処理技術の研究動向(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- [招待論文]独立成分分析に基づくブラインド音源分離(マイクロホンアレー・ブラインド分離・音源位置推定及び一般)
- 移動音源の低遅延実時間ブラインド分離
- 周波数領域ブラインド音源分離における permutation 問題の頑健な解法
- 周波数領域ICAと時間遅れスペクトル減算による残響下での実時間ブラインド音源分離
- 間隔の異なる複数のマイクペアによるブラインド音源分離
- 非定常スペクトルサブトラクションによる音源分離後の残留雑音除去
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告 (パターン認識・メディア理解)
- 1990年音響・音声・信号処理国際会議(ICASSP 90)報告
- H-021 ファッション雑誌を用いたコーディネート推薦システム(H分野:画像認識・メディア理解,一般論文)
- F-056 ネットワーク構造による類似探索性能の分析法の提案(F分野:人工知能・ゲーム,一般論文)
- RF-007 オブジェクト集合に依存したRNGの特性分析(F分野:人工知能・ゲーム,査読付き論文)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- NTTにおける男女共同参画への取組み(男女共同参画のページ)
- 「木のいのち 木のこころ」, 西岡常一著, 新潮OH!文庫, 2001年(私のすすめるこの一冊)
- 周波数領域ブラインド音源分離と適応ビームフォーマの等価性について
- 周波数領域ブラインド音源分離と周波数領域適応ビームフォーマの関係について
- 実環境におけるブラインド音源分離と残響除去性能に関する検討
- 混じりあった声を解く--遠隔発話の認識を目指して (特集論文1 人にやさしい対話型コンピュータ)
- ブラインドな処理が可能な音源分離技術 (特集 コミュニケーションの壁を克服するための音声・音響処理技術)
- 2.最近の電話の音響技術 : エコー制御技術(最近の音響技術)
- ブロック長を独立にしたブロック高速射影法
- 高速FIRフィルタリング算法を利用した射影法
- 変数の重なりのない単純な関数分解を用いた組合せ回路の改善方法
- 論理関数の自由度の新しい表現方法とそのFPGA向け論理設計への応用
- 論理関数の自由度の新しい表現方法とそのFPGA向け論理設計への応用
- 対称変数の検出による関数分解の高速化と多段論理合成への応用
- マイクロプロセッサを用いたプログラム制御形音声スイッチの設計
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (音声)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (信号処理)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (応用音響)
- TRECVID 2010 Content-Based Copy Detectionタスク参加報告(テーマセッション,映像処理とTRECVID)
- 時間周波数マスクによる実環境でのブラインド音源分離
- 帯域に適した分離手法を用いるサブバンド領域ブラインド音源分離
- サブバンド処理によるブラインド音源分離に関する検討
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- HDLで記述されたハードウェア設計の時相論理による検証
- HDLで記述されたハードウェア設計の時相論理による検証
- 劣決定音源分離のための分離音声のケプストラムスムージング
- 音楽や映像を特定するメディア指紋技術とその応用(インダストリアルマテリアルズ)
- A-10-9 フルランク空間相関行列モデルに基づく拡散性雑音除去(A-10.応用音響,一般セッション)
- 周波数依存の時間差モデルによる劣決定BSS
- 非負値行列因子分解NMFの基礎とデータ/信号解析への応用
- 非負制約下における複合行列分解
- 線形回帰モデルにおけるNCスペクトラルクラスタリングを用いた効率的な入力変数選択(第15回情報論的学習理論ワークショップ)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)