マルチモーダル情報に基づく物体概念の形成(一般セッション,クロスモーダル)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,ロボットが身体性を利用することで取得する視覚・聴覚・触覚のマルチモーダル情報を用い,総合的に物体のカテゴリ分類を行うことで,物体概念を形成する手法を提案する.ロボットは,複数の情報を利用することにより,今まで画像だけでは分類することができなかった物体であっても分類することができるようになり,より人間の感覚に近い物体概念を形成することが可能である.提案するアルゴリズムはグラフィカルモデルに基づいており,物体のカテゴリゼーションはそのパラメータである条件付確率を推定する学習の問題となる.提案手法は教師なし学習であるため,人間が正解を教えることなくロボットの自律的なカテゴリゼーションが可能である.また,学習結果を利用した未知物体のカテゴリ認識や,カテゴリを通した機能の確率的推定も可能となる.さらに本稿では,マルチモーダルLDAにより形成された概念を基に,単語の意味を接地する手法を提案する.提案手法では,入力されたマルチモーダル情報に対応する単語を確率的に推論することや,単語からその単語が指す概念を推定すること,さらに単語とモダリティとの結びつきを求めることが可能となる.本論文では,提案するアルゴリズムを実際のロボットに実装することで,提案手法の有効性を示す.
- 2010-01-14
著者
-
岩橋 直人
情報通信研究機構
-
長井 隆行
電気通信大学
-
長井 隆行
電気通信大学知能機械工学専攻
-
中村 友昭
電気通信大学大学院電気通信学研究科電子工学専攻
-
中村 友昭
電気通信大学電子工学専攻
-
中村 友昭
電気通信大学
-
中村 友昭
電気通信大学大学院情報理工学研究科
関連論文
- 1.京都観光案内対話システムのための選好評価構造の抽出 : グルーピング評価グリッド法と自由記述法による抽出要因の差異とその融合(特別セッション 好みの計量特別セッション〜行動計量手法の新たなる地平はどこにあるか?)
- 複数予測モデル遷移の N-gram 統計に基づく非分節運動系列からの模倣学習手法
- DS-2-5 共有信念に基づく発話場面の推定(DS-2. 共生コンピューティング,シンポジウムセッション)
- 視覚情報および使い方と機能の関係に基づく物体概念のモデル化(HCGシンポジウム)
- マルチモーダル情報に基づく物体概念の形成 (パターン認識・メディア理解)
- マルチモーダル情報に基づく物体概念の形成 (コミュニケーションクオリティ)
- 実世界における人とロボットの共有信念の推定に基づいた相互適応的な発話生成
- 実世界における人とロボットの共有信念に基づいた相互適応的な発話生成(対話,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたモデル構造探索に基づく抽象的単語の学習(人工知能,認知科学)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマ関連セッション1)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマセッション(1),CVのためのパターン認識・学習理論の新展開)
- 言語と動作によるコミュニケーションを学習するロボット(クロスモーダル)
- 言語と動作によるコミュニケーションを学習するロボット(クロスモーダル)
- 言語と動作によるコミュニケーションを学習するロボット(クロスモーダル)
- 言語と動作によるコミュニケーションを学習するロボット(クロスモーダル)
- I-66 サブバンドEHMMを用いた低解像度文字画像の高解像度化(画像高解像度化・劣化復元,I.画像認識・メディア理解)
- 線形位相双直交フィルタバンクの新しい設計アプローチ
- 線形位相完全再構成FIRフィルタバンクの設計
- 頭部伝達関数を利用したロボットによる音源定位能力の自律的な獲得(一般セッション(7))(ユビキタスコンピューティングのためのパターン認識・理解)
- A-10-17 頭部伝達関数を利用したロボットによる音源定位能力の自律的な獲得(A-10. 応用音響)
- 5Y-1 複数特徴量を統合したパーティクルフィルタによる物体の検出と追跡(ロボットビジョン,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3X-9 距離情報を用いた3次元物体認識(3次元画像処理・認識,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 情景画像中の文字及び看板領域の抽出
- 情景画像中の文字及び看板領域の抽出
- 情景画像中の文字及び看板領域の抽出
- マルチモーダル情報に基づく物体概念の形成(一般セッション,クロスモーダル)
- マルチモーダル情報に基づく物体概念の形成(一般セッション,クロスモーダル)
- マルチモーダル情報に基づく物体概念の形成(一般セッション,クロスモーダル)
- マルチモーダル情報に基づく物体概念の形成(一般セッション,クロスモーダル)
- AI-1-2 マルチモーダルカテゴリゼーションに基づくロボットの概念形成と実世界理解(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 機能と視覚的情報の関係性に基づく物体の概念モデル
- 5V-3 把持動作による物体カテゴリの形成と認識(人工知能一般(4),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 5V-1 自然言語によるロボットプログラミング(人工知能一般(4),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- D-8-3 LDAを用いたマルチモーダル物体概念に基づく語意獲得(D-8. 人工知能と知識処理,一般セッション)
- ロボットによる物体のマルチモーダルカテゴリゼーション
- ロボットによる物体のマルチモーダルカテゴリゼーション(人工知能,認知科学)
- RF-002 グラフィカルモデルを用いた物体概念モデル(人工知能・ゲーム,査読付き論文)
- 対話ロボットの為のマルチモーダルな想起と連想(HCGシンポジウム)
- マルチモーダルな想起と連想を用いた対話システムの検討(ソフトコンピューティング,一般)
- 自由会話における発話内容と基本周波数変化の分析
- 基本周波数変化による自由会話の句境界検出
- 日本語自由発話会話音声のピッチパターンのラベリング認識
- 自由会話における基本周波数の立て直し現象に関する検討
- D-8-16 人とロボットの共有信念に基づいた発話の生成(D-8. 人工知能と知識処理,一般セッション)
- 実世界における人とロボットの共有信念に基づいた相互適応的な発話生成(対話,第10回音声言語シンポジウム)
- 実世界における人とロボットの共有信念に基づいた相互適応的な発話生成(対話,第10回音声言語シンポジウム)
- 混合行列推定によるブラインド音源分離(信号処理, スペクトル拡散, 及び一般)
- 混合行列推定によるブラインド音源分離(信号処理, スペクトル拡散, 及び一般)
- 不等分割ブロック直交変換の直接構成
- 線形位相を有する完全再構成不等分割フィルタバンク
- 線形位相完全再構成不等分割FIRフィルタバンクの設計
- 非最大間引き完全再構成FIRフィルタバンクの設計
- DFT変調による完全再構成FIRフィルタバンクの設計
- 直線位相をもつコサイン変調2次元完全再構成FIRフィルタバンク
- 線形位相完全再構成不等分割フィルタバンクの設計
- ラグランジュ・ニュートン法を用いた線形位相M分割完全再構成FIRフィルタバンクの設計
- 阻止域等リプル特性をもつ線形位相2分割完全再構成FIRフィルタバンクの設計と実現
- LI_006 物体のマルチモーダルカテゴリゼーション(I分野:画像認識・メディア理解)
- D-12-104 マルチモーダル情報を用いた物体のカテゴリゼーション(D-12.パターン認識・メディア理解,一般講演)
- D-12-77 ベイジアンネットワークによる物体の概念モデル(D-12.パターン認識・メディア理解,一般講演)
- ユーザの簡易指定に基づく情景中の文字抽出と認識(画像情報)
- HMMを用いたシーンのアピアランスモデルとFace-to-Face変換への応用(一般セッション(7))(ユビキタスコンピューティングのためのパターン認識・理解)
- 動きアテンションによる物体の抽出とオンライン教師なし学習による物体認識(一般セッション(3))(ユビキタスコンピューティングのためのパターン認識・理解)
- A-10-24 話者モデルを用いた多チャンネル混合音声分離(A-10. 応用音響)
- A-10-23 参照再構成法を用いた周波数領域における混合音の分離(A-10. 応用音響)
- D-12-158 動きアテンションによる物体の抽出とオンライン教師なし学習による物体認識(D-12. パターン認識・メディア理解B)
- 話者情報を用いた周波数振り分けによる混合音声分離
- 参照再構成法を用いた時間領域における雑音除去と音響変化点抽出
- 周波数振分けによるマルチチャネル混合音声の分離と音源定位(電気音響,音響一般)
- HMMを用いた単一画像からの物体形状復元(画像処理,画像パターン認識)
- 情景画像からの看板領域および看板文字の自動抽出(画像処理)
- D-14-7 サブバンド HMM を用いた音声の広帯域化
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- マイクロホンアレーを用いた話者位置推定による車載音声認識
- SD-2-4 2次元MUSIC法による話者位置推定を用いた車載音声認識
- 車載音声認識のための2次元MUSIC法を用いた話者位置推定
- 視覚情報を用いた道具の使い方モデル(ソフトコンピューティング,一般)
- 屋内外の情景画像を対象とした看板文字の自動抽出
- D-12-23 情景画像からの情報取得を目的とした看板文字の自動認識
- D-12-46 子供や高齢者と遊ぶロボット実現のための基礎的検討(D-12.パターン認識・メディア理解,一般セッション)
- D-8-6 マルチモーダルな概念形成に基づく対話ロボットの実現(D-8.人工知能と知識処理,一般セッション)
- D-11-5 オクルージョンを考慮した高解像度画像と高精度3次元情報の同時推定(D-11. 画像工学,一般セッション)
- 高解像度画像と高精度3次元情報の同時復元におけるオクルージョン検出の適用(画像,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 高解像度画像と高精度3次元情報の同時復元におけるオクルージョン検出の適用(画像,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 高解像度画像と高精度3次元情報の同時復元におけるオクルージョン検出の適用(画像,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- D-12-40 ビジュアルアテンションと領域拡張を用いた情景画像中の文字抽出(D-12.パターン認識・メディア理解A)
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話
- 人とロボットの言語コミュニケーションにおける間主観性(主観性とパースペクティブ)
- 拡張モバイルマニピュレーションのための新規物体の学習
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正(話者照合・音声認識,第13回音声言語シンポジウム)
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正(話者照合・音声認識,第13回音声言語シンポジウム)
- 観光案内への音声対話システムの活用
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正
- ロボットと言語 : 言語コミュニケーション能力の機械学習(記号創発ロボティクス)
- 特集「記号創発ロボティクス」にあたって
- 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正
- ロボットと言語 : 言語コミュニケーション能力の機械学習