劣決定音源分離のための分離音声のケプストラムスムージング
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,音源信号のスパース性に基づき,時間周波数バイナリマスク(BM)を用いる音源分離手法におけるミュージカルノイズの低減を目的とした,分離音声のケプストラムスムージング(CSS)を提案する。CSSは,近年提案されたスペクトルマスクのケプストラムスムージング(CSM)で用いられるケプストラム領域でスムージングする考え方と,ケプストラム表現による音声特性の保持の制御という観点では,マスクではなくBMによって得られた分離音声を直接スムージングする方が好ましいという仮説とに基づいている。また,従来法(CSM)や提案法(CSS)と他のミュージカルノイズ低減手法の性能を実験により比較する。CSSでは,CSMと同程度のミュージカルノイズ低減性能を有し,更に目的音声の歪の小さい分離信号が得られた。
- 2012-02-01
著者
-
荒木 章子
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
北脇 信彦
筑波大学
-
山田 武志
筑波大学
-
山田 武志
筑波大学大学院
-
中谷 智広
NTTコミュニケーション科学基礎研究所
-
中村 篤
Nttコミュニケーション基礎科学研究所
-
山田 武志
筑波大学大学院システム情報工学研究科
-
牧野 昭二
筑波大学大学院システム情報工学研究科
-
北脇 信彦
筑波大学システム情報工学研究科
-
中村 篤
日本電信電話株式会社コミュニケーション科学基礎研究所
-
北脇 信彦
Ntt ヒューマンインタフェース研
-
北脇 信彦
筑波大学システム情報工学研究科コンピュータサイエンス専攻
-
北脇 信彦
筑波大学 電子・情報工学系
-
荒木 章子
NTTコミュニケーション科学基礎研究所
-
北脇 信彦
筑波大 電子・情報工学系
-
北脇 信彦
Ntt
-
北脇 信彦
NTT電気通信研究所
-
中谷 智広
Nttコミュニケーション科学基礎研究所日本電信電話株式会社
-
牧野 昭二
筑波大学システム情報工学研究科
-
北脇 信彦
日本電信電話(株)通信網総合研究所
-
牧野 昭二
Nttコミュニケーション科学基礎研究所メディア情報研究部
-
中谷 智広
NTT研究所
-
安齊 祐美
NTTコミュニケーション科学基礎研究所
-
牧野 昭二
筑波大学大学院システム情報工学研究科:筑波大学生命領域学際研究センター
-
安齊 祐美
Nttコミュニケーション科学基礎研究所:筑波大学大学院システム情報工学研究科
関連論文
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 3X-6 コード進行モデルを用いた楽曲のコード認識の検討(音楽情報科学(2)自動作曲・楽曲分析,学生セッション,人工知能と認知科学)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 楽音と音声の双方に適用できる客観品質推定尺度の検討(ワイヤレス環境でのアプリケーション品質,P2P/アドホックネットワーク,画像符号化ストリーム技術,信頼性,一般)
- IP電話における中国・日本・欧米のMOS評価特性の比較(五感メディア,映像/音声サービスの品質,ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,仮想空間におけるユーザコミュニケーション,一般)
- 周波数領域ブラインド音源分離のための極座標表示に基づく活性化関数
- 空間パワースペクトルの主成分分析に基づく時間断続信号の検出 (応用音響)
- B-11-1 IP網における音声の客観品質評価に用いる擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- CQ2010-35 超高速インターネット衛星きずなを用いた遠隔授業における映像・音声品質の評価(一般,映像配信・コミュニケーションを支える品質技術,一般)
- 空間パワースペクトルの主成分分析に基づく時間断続信号の検出(音響信号処理/聴覚/一般)
- CQ2010-27 ディジタル通信網における音声品質評価法の研究と国際標準化(特別講演,映像配信・コミュニケーションを支える品質技術,一般)
- 招待講演 時間周波数マスクによる実環境でのブラインド音源分離 (応用音響)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 符号化劣化要因と周波数帯域及びパケット損失を考慮した楽音の客観品質評価法(アプリケーション品質,モバイルP2P,ユビキタスネットワーク,アドホックネットワーク,センサネットワーク,一般)
- A-19-8 タッチパネルのための音像定位インタフェースの検討(A-19.福祉情報工学,一般セッション)
- B-8-59 停電時上り音声通信を実現する光アクセス方式の提案(B-8.通信方式,一般セッション)
- 雑音抑圧された音声の主観・客観品質評価法
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 大規模データベースを用いたタスク依存言語モデル構築の検討
- IP電話サービスの通話品質評価技術
- CCITT SG XIIの動向 : 電話網と音声通信端末の通話品質
- 周波数領域でのブラインド信号分離における分離行列の補間
- 音源分離技術の最新動向
- B-11-2 雑音抑圧音声の総合品質推定モデルを適用したフルリファレンス客観品質評価法(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-11 時間離散ひずみの評価を考慮した擬似音声信号の検討(B-11.コミュニケーションクオリティ,一般セッション)
- B-11-12 中国と日本のMOS評価特性の比較(B-11.コミュニケーションクオリティ,一般セッション)
- BS-8-3 雑音抑圧音声の品質推定モデルを用いたノンリファレンス客観品質評価法(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- BS-8-4 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(BS-8.次世代ネットワークにおける新たなサービス提供を目指したQoS関連技術,シンポジウムセッション)
- D-14-7 ETSI標準雑音抑圧フロントエンドのための雑音推定法の検討(D-14. 音声,一般セッション)
- 雑音抑圧音声の品質推定モデルとそのノンリファレンス客観品質評価への適用(NW管理,次世代NWアーキテクチャ,次世代NWのオペレーションアーキテクチャ,トラヒック計測・モデリング・品質,オーバレイネットワーク,次世代NWサービス品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 映像品質と音声品質との相互作用を考慮したマルチメディア品質の推定モデル(画像処理・品質確保,マルチメディア(システム/通信/ネットワーク),放送通信連携サービスとその品質,一般)
- 装置劣化要因の品質評価に用いるテスト信号の検討(五感メディア,映像/音声サービスの品質,有線無線ネットワークの品質・QoS制御,次世代ネットワークアーキテクチャ,一般)
- 認識対象語彙数を考慮した雑音下孤立単語認識の性能推定(耐雑音性)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- B-8-11 停電時上り音声通信光アクセス方式の実現技術の検討(B-8.通信方式,一般セッション)
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- AS-4-5 音声のスパース性を用いたUnderdetermined音源分離(AS-4. ICAを超える,シンポジウムセッション)
- A-10-6 周波数領域ICAにおける初期値の短時間データからの学習(A-10. 応用音響,一般セッション)
- A-10-9 多くの背景音からの主要音源のブラインド抽出(A-10.応用音響,基礎・境界)
- A-10-8 3次元マイクロホンアレイを用いた多音源ブラインド分離(A-10.応用音響,基礎・境界)
- A-10-7 観測ベクトルのクラスタリングによるブラインド音源分離(A-10.応用音響,基礎・境界)
- 畳込み混合のブラインド音源分離(独立成分分析とその応用特集号)
- ブラインド信号処理技術の研究動向(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- [招待論文]独立成分分析に基づくブラインド音源分離(マイクロホンアレー・ブラインド分離・音源位置推定及び一般)
- 移動音源の低遅延実時間ブラインド分離
- 周波数領域ブラインド音源分離における permutation 問題の頑健な解法
- 周波数領域ICAと時間遅れスペクトル減算による残響下での実時間ブラインド音源分離
- 間隔の異なる複数のマイクペアによるブラインド音源分離
- 非定常スペクトルサブトラクションによる音源分離後の残留雑音除去
- [若手研究者育成レクチャーシリーズ]音声・楽音符号化及び通話品質の研究と標準化(合成, 韻律, 生成, 一般)
- 低ビット音声/楽音符号化の品質 : ITU-T標準方式とTwinVQ方式
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- 衛星きずな(WINDS)を用いた遠隔授業実験(衛星,移動通信におけるアンテナ・伝搬技術,一般)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- 環境音モデルと HMM 合成による音声区間検出法
- BS-5-4 雑音抑圧音声のMOSと単語了解度の客観推定(BS-5.QoE最前線-情報通信サービスにおけるユーザ体感品質-,シンポジウムセッション)
- NTTにおける男女共同参画への取組み(男女共同参画のページ)
- 「木のいのち 木のこころ」, 西岡常一著, 新潮OH!文庫, 2001年(私のすすめるこの一冊)
- 符号化パラメータとパケット損失を考慮したAV通信品質の推定モデル(NW性能管理, NW品質, 一般)
- 周波数領域ブラインド音源分離と適応ビームフォーマの等価性について
- 周波数領域ブラインド音源分離と周波数領域適応ビームフォーマの関係について
- 混じりあった声を解く--遠隔発話の認識を目指して (特集論文1 人にやさしい対話型コンピュータ)
- ブラインドな処理が可能な音源分離技術 (特集 コミュニケーションの壁を克服するための音声・音響処理技術)
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- 雑音下音声認識の性能推定のためのひずみ尺度の検討(雑音・VAD,第9回音声言語シンポジウム)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- SVMを用いた音源数推定の音源分離システムへの応用
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (音声)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (信号処理)
- 招待講演 複数人会話シーン分析におけるマイクロホンアレイ音声処理 (応用音響)
- 時間周波数マスクによる実環境でのブラインド音源分離
- 帯域に適した分離手法を用いるサブバンド領域ブラインド音源分離
- サブバンド処理によるブラインド音源分離に関する検討
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 複数人会話シーン分析におけるマイクロホンアレイ音声処理(一般,音声・音響信号処理,音声及び一般)
- 劣決定音源分離のための分離音声のケプストラムスムージング
- A-10-9 フルランク空間相関行列モデルに基づく拡散性雑音除去(A-10.応用音響,一般セッション)
- 周波数依存の時間差モデルによる劣決定BSS
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)
- 時変混合重みに基づくパーミュテーション問題のないクラスタリングベース音源分離(音響信号処理,電気音響,信号処理,音声一般)