カクテルパーティ効果実現のための音響ストリーム分離の検討 : II.残差駆動型アーキテクチャの提案とモノラル音への適用
スポンサーリンク
概要
- 論文の詳細を見る
カクテルパーティ効果のように,実環境での柔軟な音の理解(音環境理解)機構を計算機上で実現するには,混合音から何らかの特徴を一貫して持つ連続した音である音響ストリームの分離が必要である.我々は,音源数未知の入力音に対するマルチエージェントによる音響ストリーム分離システム(以下,『従来システム』と呼ぶ)を構築し,その有効性を示した.しかし,従来システムには,多様な音を含む実環境入力を処理するための課題が残っていた.本稿では,これらを解決するために,より一般化した計算モテルとして,残差駆動型アーキテクチャ(Residue-Driven Architecture,以下,RDAと略す)を提案し,モノラル入力の音響ストリーム分離システム設計へのRDAの適用についても報告する.
- 一般社団法人情報処理学会の論文
- 1995-09-20
著者
-
奥乃 博
日本電信電話(株)基礎研究所
-
奥乃 博
京都大学大学院情報学研究科知能情報学専攻
-
中谷 智広
日本電信電話(株)基礎研究所 情報科学研究部
-
川端 豪
Ntt研究所
-
川端 豪
日本電信電話株式会社基礎研究所
-
中谷 智広
Ntt基礎研究所:(現)東日本電信電話(株)法人営業本部
-
中谷 智広
日本電信電話(株)
関連論文
- 複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
- 音声信号のブラインド残響除去--最新の研究動向 (音声)
- 時変ガウス音源モデルと多チャネル自己回帰観測モデルに基づく最ゆう法による音響信号の残響除去(ブラインド信号処理の技術とその応用論文)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
- 音声信号のブラインド残響除去--最新の研究動向 (信号処理)
- 音声信号のブラインド残響除去--最新の研究動向 (応用音響)
- 周波数領域における音声信号の残響除去のためのクロスバンド効果補正(音響信号処理/一般)
- 発話行為レベルの情報を活用した音声対話システムの研究
- 音声分離と楽音分離の統合のための音オントロジーの提案
- 背景音楽つき音声に対する音響ストリームの分離
- 背景音楽つき音声に対する音響ストリームの分離
- 多重奏中の歌声の基本周波数と有声音素の同時推定手法
- テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発
- RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションの創発
- NueLinda Interpreter in NueLinda : 非均質システム NueLinda インタプリタの自己記述 (並列処理)
- NueLinda Interpreter in NueLinda : 非均質システム NueLinda インタプリタの自己記述
- Dirichlet事前分布を用いた音声区間検出の検討
- 音声区間検出技術の最近の研究動向
- Query-by-Conducting:テンポ類似性に基づく同一楽曲における多様な解釈の検索インタフェース
- 多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム
- バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
- SpeakBySinging: 歌声を話声に変換する話声合成システム
- 音声信号のブラインド残響除去:最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声信号のブラインド残響除去 : 最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- 音声信号のブラインド残響除去 : 最新の研究動向(オーガナイズドセッション:スピーチエンハンスメント,音声,応用/電気音響,信号処理,及び一般)
- Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
- バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
- 調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
- 音オントロジーに基づいた音環境理解システムの統合 (「オントロジーの基礎と応用」)
- マルチエージェントシステムによる音響ストリーム分離
- 音声ストリーム分離法の提案と複数音声の同時認識の予備実験
- 調波構造分離と子音補完による音声ストリーム分離
- 音響ストリーム分離の音声認識からの評価
- 音響ストリーム分離の音声認識からの評価
- カクテルパーティ効果実現のための音響ストリーム分離の検討 : II.残差駆動型アーキテクチャの提案とモノラル音への適用
- カクテルパーティ効果実現のための音響ストリーム分離の検討 : I.音環境理解によるモデル化
- 音環境理解のためのマルチエージェントによる調波構造ストリームの分離
- マルチエージェントシステムによる音響ストリーム分離 : ストリーム分離の排他性の向上
- マルチエージェントシステムによる音響ストリーム分離のダイナミクス
- 創発的計算モデルによる音環境理解 : 音響ストリーム分離エージェントの構築と評価
- 3U-2 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6J-6 楽器音イコライザによる楽曲音響特徴変動と類似楽曲検索への応用(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- ブラインド信号処理技術の研究動向(マイクロホンアレー・ブラインド分離・音源位置推定/一般)
- 検索機能を内蔵した独立型・開放型文献集 : 10周年記念 CD-ROM 制作の経験
- 5V-6 RNNを用いた行為予測による人間とロボットの協調物体配置(人工知能一般(4),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6U-1 F0・振幅・音韻長の制御により歌声を話声に変換する話声合成システムSpeakBySinging(音声・歌声合成,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 2ZN-2 バージイン許容音声対話におけるLSMによる許容発話範囲の拡張(情報爆発時代における対話インタラクション,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- バージイン発話タイミングモデルを導入した指示対象同定
- 6W-8 MTRNNを用いた単語と文法の階層的自己組織化による文の認識・生成(構文解析・生成・学習,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5U-9 ユーザの文法知識を状態に加えたPOMDPに基づく音声対話システム(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-9 環境音から擬音語への自動変換における特徴量抽出法の検討(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3U-7 スペクトル推定を用いたマイク数以上の同時発話に対する音声認識(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- AS-6-4 マルチステップ線形予測に基づく残響除去法の雑音耐性の音声認識による評価(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- 調波構造に基づくモノラル音声信号のブラインド残響除去(音声, 聴覚)
- 調波構造に基づく音声信号のブラインド残響除去
- 複数の音声区間検出法の適応的統合の検討と考察
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- ベース音高と和音特徴の統合に基づく和音系列認識
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- MAHL:演奏者間のインタラクション分析のためのスコアアライメント手法の提案
- 歌詞と音響特徴量を用いた楽曲印象軌跡推定法の設計と評価
- 特集「並列処理」の編集にあたって
- ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
- ドメイン外発話が扱え拡張性が高い対話ドメイン選択フレームワーク
- N-Queens Game, Tangram and Tait's Problem (計算機によるパズル・ゲームの研究)
- 音環境理解研究 (CASA) へのいざない (AIチャレンジ)
- ぺた語義:京大における Lisp を使ったプログラミング教育
- 視聴覚統合ビートトラッキングを用いた音楽ロボットとギターとの合奏システム
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 音楽共演ロボット:開始・終了キューの画像認識による人間のフルート奏者との実時間同期
- 音声対話システムにおける 簡略表現認識のための自動語彙拡張
- フレーズ置換のための調波非調波GMM・NMFに基づく音源分離・演奏合成
- 発語行為レベルの情報をユーザ発話の解釈に用いる音声対話システム
- 混合音を聞き分けるセンシング技術 (特集人間を理解するためのICT技術 : 人間を対象としたセンシング・情報処理からその応用まで) -- (人間をセンシングする技術)
- ベイジアン非負値調波因子分解と多重基本周波数推定への応用
- 押弦制約と運指制約を用いたタブ譜自動生成システム
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- ロボット聴覚用オープンソースソフトウェア HARKの展開
- ROS(Robot Operating System)を用いた音楽合奏ロボットシステムの構築(ビッグデータで変わる環境知能とロボット,及びその他一般)
- 方言対訳コーパスを用いた日本語方言音声認識システム(言語モデル・音声対話)
- アクセント特徴量を用いた歌声と朗読音声の識別システム
- マイク数以上の同時発話分離のための調波・非調波音源モデルの検討
- Kinectによる楽器マスキングを用いた視聴覚統合ビートトラッキング
- 楽曲印象軌跡に基づく楽曲検索システムの実装と評価
- パーティクルフィルタを用いた動的環境下の複数音源追跡