多チャンネル間の伝達関数の差による2話者の音声分離 : 相関に基づく漸近推定法によるチャンネル間伝達関数の求め方
スポンサーリンク
概要
- 論文の詳細を見る
室内など反響のある環境で複数話者音声を分離する時にバイノーラルキューとして知られる時間差と強度差に着目するだけでは不十分で、反響音も含めて伝達関数として考える必要がある。一方、チャンネル間伝達関数の推定は音源から受音点までの伝達関数の逆関数が推定可能かどうかと密接に関連する。逆関数が推定可能であれば伝達関数も一般的に推定可能である。室内において音源から受音点の伝達関数は一般的に最小位相関数(Minimum Phase Function)ではなく、その逆関数は容易には推定できないとされる。われわれは室内における伝達関数が最小位相関数でない原因は主に壁などの反射物が周波数によって反射率が異なることに起因し、信号を帯域に分割すれば伝達関数は近似的に最小位相関数とみなすことができると考える。したがって、各帯域において伝達関数の逆関数が推定でき、チャンネル間の伝達関数も推定可能となる。また、残響時間の長い室内においてはインパルス応答の次数が大きくなり有効な解法が存在しないとの問題を解決するために、われわれは推定元信号と残差信号のクロス相関係数に基づく漸近推定法を用いることにより高次インパルス応答の有効な推定法を提案する。
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
-
大西 昇
名古屋大学大学院情報科学研究科
-
黄 捷
会津大コンピュータ理工学部
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
大西 昇
名古屋大学大学院工学研究科
-
大西 昇
理研 名大工
-
黄 捷
理化学研究所
-
大西 昇
名古屋大学工学部情報工学科
-
大西 昇
名古屋大学
関連論文
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 自己運動感覚を誘導する視覚刺激に対する生体反応の分析
- 自己運動を誘導する視覚刺激に対する生体反応の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 自己運動を誘導する視覚刺激に対する生体反応の計測
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- 視聴覚事象の中心的事例の教師なし学習
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 吹き付けによる3次元形状モデリングの提案
- 三次元CGにおけるカメラワークの自動生成
- 固視微動に示唆を得たビジョンシステムによる奥行き判別支援
- ディジタル画像内での部分複写の検出(改竄検出,映像符号化,システム及び一般)
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- スペクトルの特徴マップを用いた上下方向音源定位学習システム(バイオサイバネティックス,ニューロコンピューティング)
- 音圧差情報付加による音源定位システムの性能改善
- 感覚運動統合による音源定位ロボットの構築
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- スリット提示の視認性の検討
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 大画面スリット視における文字・図形の収縮率の検討
- 大画面スリット視における文字・図形の収縮率の検討(視聴覚情報処理及び一般)
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- 日本語の修飾構造を評価する添削支援システムを実現するための基礎研究
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- オンライン言語処理モデルにおける自己修復文の解析手法
- 自己修復の分析に基づく発話生成モデルに関する考察
- 自己運動を誘導する視覚刺激に対する生体反応の分析
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- オプティカルフローを用いた複雑背景下における人物の腕領域の抽出と運動パラメータ推定
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 触刺激による「方向」情報呈示とその識別について
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- 3)主観的輪郭生成のアルゴリズムとその画像理解への応用(〔情報ディスプレイ研究会視聴覚技術研究会画像通信システム研究会〕合同)
- 主観的輪郭生成のアルゴリズムとその画像理解への応用 : 情報ディスプレイ視聴覚技術画像通信システム(視覚と画質特集)
- 適応的なロバストSuper-Exponential法を用いた瞬時混合ブラインド音源分離(研究速報)
- 周波数領域BSSに対するSEMと参照信号EVA(アレー信号処理・音響計測/一般)
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 音源分離における指向性マイクの有効性
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- D-14-12 3音源混合信号からの源信号分離
- D-14-11 独立成分分析を用いた音源分離の性能評価
- 周波数領域で行うブラインド分離の一手法
- ラインカメラによる道路面撮像と画像処理
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人工筋肉を利用したヘビ型水中推進ロボット
- 人工筋肉を利用したヘビ型推進ロボット
- 追従型高速ステレオビジョンシステムを用いた移動物体の形状復元(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- D-12-135 超高速ビジョンシステムと高速リニアスライダを用いた物体追跡
- コンピュータアニメーションによるサッカーシーンの再現
- 任意視点からサッカーシーンを復元する仮想カメラシステム
- 移動する選手から見たシーンの生成 : キャリブレーションと選字抽出の自動化
- 生体模倣の実時間ビジュアルトラッキングシステム
- 生体模倣の実時間ビジュアルトラッキングシステム
- 視覚障害者向け商品情報取得システム
- 視覚障害者の共有資料観覧支援システム
- 生物に示唆を得た選択的注意による視聴覚事象の対応付け手法
- 事前学習を用いないオンラインでの話者識別(聴覚・音声・言語とその障害,一般)
- 物体操作による視聴覚事象の対応付け
- 旋削自動プログラミングにおける同時加工順序のプランニング
- 盲人の空間認知に関する実験的考察(バリアフリーインタフェース)
- 類似画像検索における部分教師付き特徴次元圧縮
- NC2000-43 神経回路を用いた音源定位能力の自己組織的獲得
- 両眼網膜像の不一致検出と奥行き推定過程に基づいたサッカード機構 : 注視位置とサッカード間隔の評価
- テクスチャの有無による物体注視時のサッカード駆動スキーマの違い : サッカード間隔の評価 : 視聴覚技術
- 10-2 初期視覚での両眼網膜像の不一致検出
- リム注視時の両眼の注視位置の分布 : 円柱の上面が見える時
- リムオクルージョンに誘発される両眼の注視位置の変化
- 7-4 円柱上面の見えによる両眼リム注視位置の変化
- 大規模コーパスに基づいた未登録語の傾向分析
- 5ZD-6 聴覚障がい者向け情報保障のための講師発話からの指示語抽出手法の検討(障碍者補助・福祉,学生セッション,インターフェース)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 遠隔PC要約筆記のための指示発話と動作の関連性分析(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 物体操作による視聴覚事象の対応付け(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 物理法則に基づく視聴覚情報の対応付け
- 物理法則に基づく視聴覚情報の対応付け
- 物理法則に基づく視聴覚情報の対応付け
- 近似Chamfer距離とカーネル部分空間を用いたシルエット画像からの三次元人物姿勢推定(顔・ジェスチャの認識理解(1),顔・ジェスチャの認識・理解)
- 近似Chamfer距離とカーネル部分空間を用いたシルエット画像からの三次元人物姿勢推定(顔・ジェスチャの認識理解(1),顔・ジェスチャの認識・理解)
- 検索 : 組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション2)
- 検索-組合せ法を用いた単眼画像からの三次元人物姿勢推定(テーマ関連セッション,事例ベースメディア解析)
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)