移動型および静止型マイクロホンアレイ統合による複数移動音源追跡

概要

論文の詳細を見る
日本ロボット学会の論文
2007-09-15

著者

辻野広司
(株)ホンダ・リサーチ・インスティチュート・ジャパン
奥乃博
京都大学大学院情報学研究科
長谷川雄二
(株)ホンダ・リサーチ・インスティチュート・ジャパン
中臺一博
(株)ホンダ・リサーチ・インスティチュート・ジャパン
中臺一博
HRI-JP
中島弘史
(株)ホンダ・リサーチ・インスティチュート・ジャパン
村瀬昌満
京都大学大学院情報学研究科
村瀬昌満
京都大学大学院情報学研究科知能情報学専攻
奥乃博
京都大学大学院

関連論文

複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
Artificial Subtle Expressionとしての明滅光源による音声対話の円滑化(インタラクションデザイン,人とエージェントのインタラクション論文)
4Q-2 音声認識と言語理解を動的に選択する音声理解フレームワーク(音声対話・音声要約,学生セッション,人工知能と認知科学)
音声認識と言語理解を動的に選択する音声理解フレームワーク
複数の言語モデル・言語理解方式を用いた音声理解の高精度化(理解)
ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
3U-6 インタラクティブなプレゼンテーションでのユーザ発話の自然な制限のための複数エージェントの利用(音声言語情報処理,学生セッション,人工知能と認知科学)
MFTを用いたロボットの動作中における音声認識
LE-008 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(自然言語・音声・音楽)
音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(学生セッション I)
マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択(音声言語)
音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
インタラクション機能を有するプレゼンテーション記述言語の開発(インタフェース,入出力,その他)
5Q-3 神経回路モデルを用いた音声模倣モデルによる音声バブリングと母音獲得過程シミュレーション(ニューラルネット(1),学生セッション,人工知能と認知科学)
ロボット聴覚オープンソースソフトウエアHARK
人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション
残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
4ZC-2 楽器の内部モデルに基づくフィードフォワード制御によるテルミン演奏ロボットの開発(身体,学生セッション,コンピュータと人間社会)
3Y-2 顔追跡による音環境可視化システムのアウエアネスの改善(アンビエント・インタフェース,学生セッション,インタフェース)
5S-1 RNNを備えた2体の小型ロボット間の首振り動作と音声によるインタラクションにおける共有シンボルの創発(認知・推論・探索,学生セッション,人工知能と認知科学)
5R-7 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発(音楽検索・解析,学生セッション,人工知能と認知科学)
5R-6 ベース音高確率とクロマベクトルの相関を考慮した和音進行認識(音楽検索・解析,学生セッション,人工知能と認知科学)
4R-2 音色特徴量に基づく調波・非調波統合モデルによる楽器音モーフィング(音楽演奏・生成,学生セッション,人工知能と認知科学)
4R-1 連続発音中の音色変化に着目した未学習譜面上への演奏信号生成(音楽演奏・生成,学生セッション,人工知能と認知科学)
4Q-4 音声対話システムにおける想定外発話の文法検証を用いた対話行為推定に基づくヘルプ生成(音声対話・音声要約,学生セッション,人工知能と認知科学)
4Q-3 実環境音声対話システムにおけるバージイン発話タイミングを活用した指示対象の同定(音声対話・音声要約,学生セッション,人工知能と認知科学)
3D-3 ロボットによる卓上物体操作のためのRNNを用いた道具身体化モデルの構築(人工知能(1),一般セッション,人工知能と認知科学)
「ロボット聴覚」特集について
5ZC-6 本質的に異なる数独解盤面の列挙と番号付け(エンタテインメントコンピューティング,学生セッション,コンピュータと人間社会)
調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
ロボット聴覚の現状と展望
ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
ニホンアマガエルの同期した発声行動に関する数理的研究および音響信号解析 (第5回生物数学の理論とその応用)
4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
単一テンプレート適応法による音楽音響信号を対象としたハイハットシンバルの音源同定(音楽音響信号認識)
6U-5 フィールドにおける音源定位のための音声視覚化デバイス「カエルホタル」の設計(ネットワーク応用,学生セッション,ネットワーク)
環境変動を考慮したロボット聴覚のための音源分離
ドラムパターン推定によるドラム音認識誤り補正手法
テンプレート適応を利用した実世界の音楽音響信号に対するドラムスの音源同定
ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析
移動型および静止型マイクロホンアレイ統合による複数移動音源追跡
適応ステップサイズパラメータ法による高性能ブラインド音源分離(ブラインド信号処理/一般)
AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
楽譜情報を援用した多重奏音楽音響信号の音源分離と調波・非調波統合モデルの制約付きパラメータ推定の同時実現(音楽情報,新しいパラダイムの中での分散システム/インターネット運用・管理)
自己組織化マップによる教師なしクラスタリングを利用したドラム演奏の自動採譜(音楽音響信号認識/生成1)
ゲーム理論に基づく参照結束性のモデル化と日本語・英語の大規模コーパスを用いた統計的検証
発話行為レベルの情報を活用した音声対話システムの研究
音高による音色変化を考慮した楽器音の音高・音長操作手法(演奏分析・支援・加工)
インタラクション機能を有するプレゼンテーション記述言語の開発(HAIにおけるコミュニケーションとインタラクション適応)
複数の言語モデルと言語理解モデルによる音声理解の高精度化
楽曲推薦システムの効率性とスケーラビリティの改善のための確率的推薦モデルのインクリメンタル学習法(検索・推薦)
2D-1 ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識(音声・音楽情報処理,一般セッション,人工知能と認知科学)
音声対話システムにおける簡略表現認識のための誤認識増加を抑制する自動語彙拡張(学生セッション II)
3U-5 音声対話システムにおけるユーザの固有名詞の簡略化に対処する語彙拡張(音声言語情報処理,学生セッション,人工知能と認知科学)
多重奏中の歌声の基本周波数と有声音素の同時推定手法
テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発
複数の編集距離を用いた口語翻訳文の自動評価
RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションの創発
2X-8 音楽と自分の声を聞き分けながらビートに合わせて発声するロボットの開発(音楽情報科学(1)音楽音響,学生セッション,人工知能と認知科学)
Query-by-Conducting:テンポ類似性に基づく同一楽曲における多様な解釈の検索インタフェース
多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム
ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
音声対話システムにおけるラピッドプロトタイピングを指向したWFSTに基づく言語理解
文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
バージイン許容音声対話システムにおけるユーザ発話の分析と指示対象同定への応用
SpeakBySinging: 歌声を話声に変換する話声合成システム
歌声GMMとビタビ探索を用いた多重奏中のボーカルパートに限定した基本周波数推定手法(音楽音響信号処理 (1))
多重奏音楽音響信号の音源分離のための調波・非調波モデルの制約付きパラメータ推定(認識・測定)
多重奏音楽音響信号の音源分離のための調波・非調波モデルの制約付きパラメータ推定(認識・測定)
複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解
楽曲の特徴量抽出と検索技術
マルチメディアコンテンツにおける音楽と映像の調和度計算モデル
多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重み付け及び音楽的文脈の利用(画像認識,コンピュータビジョン)
Instrogram : 発音時刻検出とF0推定の不要な楽器音認識手法
伴奏書抑制と高信頼度フレーム選択に基づく楽曲の歌手名同定手法(音楽情報,情報処理技術のフロンティア)
伴奏音抑制と高信頼度フレーム選択に基づく楽曲中の歌声の歌手名同定手法
LG_002 タスク指向対話とチャットを統合した対話ロボットインターフェース(G分野:音声・音楽)
ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
ロボットの共生的対話システムとマルチモーダルな表現システムの開発と評価(テーマセッション(1), ロボットとの相互作用のための言語処理・パターン認識・メディア理解)
音声質問応答システムのユーザ発話を用いた質問応答データベース拡張支援
人と共存するロボットシステムの展望
指向性スピーカを用いたロボット音声インタフェースの提案
A-16-16 ヒューマノイドロボットとアニメキャラクタによる共同プレゼンテーションMPML-HR Ver.2.0(A-16.マルチメディア・仮想環境基礎,一般講演)
HRI-JPにおけるヒューマン-ロボットインタラクション研究(システムオンシリコン及び一般)
ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(学生セッション I)
遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)
複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化
3U-2 複数の言語モデルと言語理解モデルによる音声理解手法のラピッドプロトタイピングへの適用(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
3U-6 音声質問応答システムのユーザ発話を用いた質問応答データベース拡張支援(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
マルチモーダルプレゼンテーション記述言語MPMLのヒューマノイドへの拡張とその心理学的評価(ロボットとコミュニケーション及び一般)
脳のこころ (特集情動の脳科学)
7.自動車・交通分野における人工知能技術(人工知能技術と産業応用)
情と意をもつ脳型コンピュータ (特集知・情・意の神経学)
1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)
系列運動の自律学習におけるラットの適応的な学習法選択(一般講演,機械学習によるバイオデータマインニング,一般)

移動型および静止型マイクロホンアレイ統合による複数移動音源追跡

スポンサーリンク

概要

著者

関連論文

スポンサーリンク