音声・画像入力からの概念獲得のためのインターモーダル学習(マルチメディアとパターン認識理解,一般)
スポンサーリンク
概要
- 論文の詳細を見る
複数モダリティの情報を利用するインターモーダルな学習によって,物体の形や色といった概念を獲得するシステムを提案する.物体の画像,及び物体を表す音声を組合せたマルチモーダル情報をシステムに入力する.システムは特徴抽出を行なった後に,カーネル法による多変量解析手法と情報理論的な基準を適用して,複数モダリティ間の特徴の対応関係として概念を獲得する.実験において,提案したシステムは物体の形状や色の概念を獲得し,また,獲得された概念の一部を一般化するなど,柔軟な概念の取り扱いが可能であることを示した.
- 社団法人電子情報通信学会の論文
- 2004-10-15
著者
関連論文
- AI Goggles:追加学習機能を備えたウェアラブル画像アノテーション・リトリーバルシステム(ヒューマンコンピュータインタラクション,情報爆発論文)
- 情報系複合領域アカデミック・ロードマップ
- 大規模Web画像のための画像アノテーション・リトリーバル手法(パターン認識応用,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 2M-1 因果性発見を用いた時系列データからの情報の構造化・モデル化手法(進化的計算とデータマイニング,学生セッション,ソフトウェア科学・工学)
- 高次局所自己相関特徴を用いた車載カメラからの高速シーン認識
- 積分特徴と部分空間法を用いた高速三次元物体認識の実データへの適用(テーマセッション関連,一般物体認識・画像特徴量)
- 三次元環境地図からの物体探索タスク応用を目指したカラー立体高次局所自己相関特徴の開発
- 高次局所自己相関特徴による多チャンネル時系列データからの異常検知
- 高次局所自己相関特徴を用いた病理組織診断支援技術の研究
- 画像・単語間概念対応の確率構造学習を利用した超高速画像認識・検索方法(パターン認識・メディア理解のための学習理論とその周辺)
- 印象情報の付与による類似画像検索性能の評価(パターン認識)
- 複数の重み付け領域特徴量の組み合わせによる高速物体認識(テーマセッション関連,一般物体認識・画像特徴量)
- Web画像と文章の大域的特徴から得る潜在的意味に基づくデータ検索 : Web上での一般画像認識実現への新たなアプローチを目指して(テーマセッション関連,一般物体認識・画像特徴量)
- 2K-3 ジャーナリストロボットシステム : 実世界からの自律的ニュース探索と事象の記述(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 2K-2 サイバーゴーグル : 画像情報からリアルタイムに実世界記述・検索を行うシステム(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 2K-1 画像・単語列間の確率的な概念獲得による高速かつ高精度な汎用的画像認識・検索手法(情報爆発時代における実世界情報解析とロボット,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 知的行動の発生原理(知能コンピューティングとその周辺〔第7回〕)
- 逆問題解析に基づく触覚分布センサ
- 対象同定に基づく道具身体化の計算論
- 模倣の適応性と創発性 : 実世界における人間的知性の基盤
- 情報爆発時代におけるヒューマンコミュニケーション基盤(情報爆発時代に向けた新しいIT基盤技術の研究)
- 等身大ヒューマノイドロボットによるダイナミック起き上がり行動の実現
- 2P1-N-043 マルチモーダル感覚の同期性に基づくロボット身体図式延長モデルと実機実現(認知ロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
- 1P1-N-052 力学系の有限時間到達可能性に基づく運動生成法(制御の新理論とモーションコントロール2,生活を支援するロボメカ技術のメガインテグレーション)
- ロボット模倣の創発・発達的構成論にむけて(模倣)
- 音声・画像入力からの概念獲得のためのインターモーダル学習(マルチメディアとパターン認識理解,一般)
- インターモーダル学習による概念の獲得(計算知能)
- ロボットハンドによる作業の統計的学習(情緒・感性・身体性)
- ヒューマノイドロボットのコツに基づく全身運動の模倣(ヒューマノイド1)
- ヒューマノイドのロバスト全身動作と制御システム(ヒューマノイド1)
- 機械はコツを身につけられるか (特集 ロボットから人間を読み解く)
- ロボットの知能 : 創発実体主義の挑戦
- 2P1-3F-F7 ゲルロボットの研究 : 空間分布電場平行移動法による電場応答性高分子ゲルの巻きつき運動生成
- 2P1-3F-F6 ゲルロボットの研究 : 空間分布電場平行移動法による電場応答性高分子ゲルの反転運動生成
- 2A1-3F-F5 ゲルロボットの研究 : 入力周波数変調法による電場応答性高分子ゲルの多極形状生成
- 2A1-3F-F4 ゲルロボットの研究 : 一様電場中における電場応答性高分子ゲルの波状パタン形成
- 1P1-3F-G5 C 言語記述のマルチタスクモニタを用いたメカトロ・プログラミング演習 : 東京大学機械情報工学科メカトロ演習・知能機械情報学演習
- 2P2-L06 ヒューマノイド腱太における随意・反射・状況反応行動の統合による適応性の実現
- 2P2-L05 三次元距離画像の RRT 探索によるヒューマノイドロボットの腕の動作計画
- 2P2-L04 脊椎構造を持つ人間型ロボットにおける GA による匍匐動作の自動獲得
- 1P1-F02 多種入出力を持つ全身腱駆動脊椎ヒューマノイド腱太のための拡張可能な通信システム構成
- 1P1-E05 姿勢角センサを用いた股関節部の変形補償量獲得による歩行動作の安定化
- 身体性に基づく認知とヒューマノイド(ヒューマノイドロボット)
- 神経振動子を用いた三次元2足足踏みシミュレーション - ヒューマノイドの実世界内行動を目指して -
- 時系列データからの汎用的異常検知手法の提案とその性能評価
- Guitarist Simulator : 演奏者の振舞いを統計的に学習するジャムセッションシステム(音楽情報科学)
- CHLAC特徴とGridコンピューティングを併用したリアルタイム動作認識(一般セッション(2), 文字認識・文書理解)
- 幾何学的拘束を考慮したバックミラー画像からの車両検出・追跡(一般セッション7)
- 幾何学的拘束を考慮したバックミラー画像からの車両検出・追跡(一般セッション(5),CVのためのパターン認識・学習理論の新展開)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討(文書・文字メディアの認識・理解, 一般)
- 直進する車載カメラの動画像からのオプティカルフローを用いた環境の形状復元法の検討
- 同値類に基づく回転不変特徴量を用いた3次元物体モデルの類似検索(マルチメディアパターン処理)
- 実演奏音と楽譜情報からの演奏者識別に関する研究
- 人間的身体性に基づく知能の発生原理解明への構成論的アプローチ
- AI Goggles : 追加学習機能を備えたウェアラブル画像アノテーション・リトリーバルシステム
- 1-3 感性への数理科学的なアプローチ(1.感性情報学の方法論,感性情報学)
- 広範囲動画像におけるCHLACによる異常検出
- 交通安全のための状況・意図理解に向けて(交通移動体事故の抜本的低減へ向けて)
- 学習するジャムセッションシステム : 演奏者固有のフレーズの獲得(セッション5 : 自動演奏システム)
- 発音時刻の楽譜上の位置を確率モデルにより推定するクォンタイズ手法(音楽情報科学)
- 学習に基づくクォンタイズ : 発音時刻の楽譜上の位置の推定
- 学習するセッションシステム : 演奏者の振る舞いのモデルの獲得
- 高次相関特徴によるテクスチャ解析の試み
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- 濃度値の量子化を考慮したしきい値選定法
- 画像の量子化誤差を考慮したしきい値選定法
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- パターン識別のための錐制約部分空間法(パターン認識)
- MRFモデルを用いた動画像からの移動物体検出(一般セッション16)
- 錘に基づくパターン識別方法(一般セッション14)
- MRFモデルを用いた動画像からの移動物体検出(一般セッション6,三次元画像,多視点画像)
- 錘に基づくパターン識別方法(一般セッション5,三次元画像,多視点画像)
- 類似画像検索における印象情報の寄与について
- 大規模 Web 画像のための画像アノテーション・リトリーバル手法
- 5Y-7 移動体の自己位置情報を利用した画像からの異常領域検出(ロボットビジョン,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3N-6 因果指標のベイズ理論に基づく統一的な定式化(数理モデルとデータマイニング,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 5ZC-5 場所依存の異常性検出に基づきインタビューを行う自律行動システム(社会システムとWeb(2),学生セッション,ネットワーク,情報処理学会創立50周年記念)
- ロボティック・サイエンスとは何か
- 「ロボティック・サイエンス」特集について
- 自律適応創発システム
- 「アカデミック・ロードマップ」特集について
- 特別講演 身体が脳をつくる--ロボットを題材とした構成論的科学のアプローチ (第13回認知神経科学会(平成20年7月12日・13日開催)(その2))
- 応答予測と馴化・脱馴化に基づき人とやりとりルールを探索・共創するロボットモデル
- 9.サイバー世界と実世界と人間社会を融合する情報爆発時代のロボット知能(情報爆発が創り出すサイバーフィジカルな情報処理)
- 2A1-J21 アームとビジョンを持つ全方位移動ロボットの組込みシステムを用いた行動プログラミング演習 : 東京大学機械情報工学科における実践(ものづくり教育・メカトロニクスで遊ぶ)
- 2A1-D08 力学的三次元対称化法によるヒューマノイドロボットのオンライン受身動作生成(ヒューマノイド)
- 複数画像特徴とクラスラベルの相関に着目した距離計量による大規模画像分類(テーマセッション,映像処理とTRECVID)
- 2P2-B21 直感的な指示に基づく色・距離画像を用いた適切な物体抽出手法(ロボットビジョン)
- 2A1-L03 即応的把持 : 確率ネットワークを用いた知識モデルに基づく把持動作(進化・学習とロボティクス)
- 2A1-J23 機械情報工学科科学部演習における自主プロジェクトとその成果 : 東京大学機械情報工学科,・知能ソフトウエア・ロボットシステム・メカトロニクス設計演習(ものづくり教育・メカトロニクスで遊ぶ)
- 画像・長文からの潜在空間獲得による画像間類似度の改善
- 2P2-G13 仮想目標切替パタンの探索による実ロボットの多様な動作獲得(進化・学習とロボティクス)
- 1A1-A12 把持面全体に触覚を実装可能なロボットフィンガー機構とその実現(ロボットハンドの機構と把持戦略)
- 2A1-L04 仮想目標切替パタンの探索によるダイナミック多自由度運動の学習(進化・学習とロボティクス)
- 2A2-F22 遺伝的プログラミングを用いたニューラルネットワークの構造及び学習則の生成
- 2P1-E20 移動ロボットによる有用な情報検出のための距離画像を用いた人の流れ推定
- 1P1-C21 複数人への聞き込みから記事を作成するロボットシステム
- 対人的共創知能研究 : 胎動から社会性認知基盤に至る発達モデルの構築
- 大規模画像データセットを用いたマルチクラス物体検出器の同時学習 物体毎に特化した負例クラスの導入