能動的な動きに基づく知覚の恒常性を実現する状態表現(人工知能,データマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
ロボットが外部環境との関係を状態としてどのように表現すべきかは,タスクに応じて異なる.ロボットが同一対象を観測する場合でも,観測する環境に応じて得られるセンサ出力は異なる.本研究では,環境の変化に伴いセンサ出力が変化した場合でも,環境に関する事前知識を用いずに変化前後の異なるセンサ出力を類似度の高い状態として表現可能な状態表現法を提案する.提案する状態表現は分布間距離尺度の一つであるf-divergenceの変換不変性を応用したものであり,環境の変化により,センサ出力に変換がなされたとしても,その変換が可逆かつ連続な場合には,変換前後のセンサ出力を類似度の高い状態として表現することが期待できる.提案手法の効果を検証するため,移動ロボットのシミュレーション及び実機を使った実験を行った.その結果,センサ出力に線形変換及び平行移動を行った場合でも,それらの影響を受けない状態が表現可能であることを示した.また,提案手法を用いた強化学習による自律的な行動学習も実現可能であることを確認した.
- 2011-05-01
著者
-
小林 祐一
東京農工大学大学院共生科学技術研究院
-
小林 祐一
理化学研究所バイオ・ミメティックコントロール研究センター
-
小林 祐一
東京農工大学
-
郷古 学
東北学院大学工学部
-
小林 祐一
東京農工大:理研RTC
関連論文
- FPGAアレイに実装するポアソン方程式とCIP法演算回路の性能評価 (回路とシステム)
- hw/sw複合体を用いた木構造型SOMハードウェア (回路とシステム)
- インターネットブースター--ネットワーク配信可能なhw/sw複合体を用いたWEBアプリケーション (システム開発論文特集)
- ネットワーク配信可能なhw/sw複合体,動画像コーデック (リコンフィギャラブルシステム)
- ネットワーク配信可能なhw/sw複合体,動画像コーデック (VLSI設計技術)
- インターネットブースター : ネットワーク配信可能なhw/sw複合体を用いたWEBアプリケーション(映像プロセッサ,システム開発論)
- 人と接するロボットのための並列タスク設計への最適化によるアプローチ
- 群ロボットによる協調捕獲行動の自律分散制御
- マルチエージェントシステムの自律分散制御-群移動ロボットによる協調捕獲行動
- 2A1-3 分散協調捕獲行動のための群移動ロボット制御(2A1 群ロボット)
- ベクトル量子化による決定論的方策地図の不可逆圧縮
- 実時間性と観測コストを考慮した4脚ロボットのサッカー行動設計
- hw/sw複合体を用いた木構造型SOMハードウェア
- ネットワーク配信可能なhw/sw複合体,動画像コーデック(ネットワーク,FPGA応用及び一般)
- ネットワーク配信可能なhw/sw複合体,動画像コーデック(ネットワーク,FPGA応用及び一般)
- ネットワーク配信可能なhw/sw複合体,動画像コーデック(ネットワーク,FPGA応用及び一般)
- FPGAアレイに実装するポアソン方程式とCIP法演算回路の性能評価
- 2A1-J2 四脚ロボットにおけるMonte Carlo Localizationに基づく環境認識(24. ロボカップ)
- 強化学習のための矩形基底による自律分散型関数近似
- 分解能の調節可能な画像情報からの状態空間の構成
- 一次元空間への低次元化写像を用いた対象物操作の強化学習
- 特徴空間における汎化を利用した行動学習のための関数近似
- 自律分散系の適応アルゴリズムによる強化学習のための関数近似
- 視覚情報を用いた状態・行動空間の自律的生成
- 部分観測環境下における自律的状態分割による強化学習
- 視覚・接触情報を用いた状態・行動空間の自律的生成
- 部分観測環境下における強化学習による移動ロボットの行動獲得
- 遅れ報酬を含む多次元評価にもとづく状態と行動の獲得
- 脚型ロボットを用いたロボットサッカー(アミューズメントと工学)
- リリース型マニピュレーションを利用した物体の受渡し操作
- ロボットの障害物回避行動生成における画像特徴の獲得
- 視覚からの対象物抽出に基づいた到達可能領域と拘束領域の推定による対象物操作の学習
- 能動的な動きに基づく知覚の恒常性を実現する状態表現(人工知能,データマイニング)
- 観測範囲に制限のあるセンサ同士の統合によるロボットの行動生成法
- 2A2-E05 SVMと補間を利用した対象物操作学習のための接触モード境界推定
- 1A1-F16 拡散学習を用いた不完全な知覚を有するロボットのための状態推定法
- 2P1-F19 恒常性を実現する能動知覚と行動学習
- 強化学習による物体識別のための探索行動の獲得
- 1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
- 1A1-O07 局所線形埋め込みを用いたロボット動作のための視覚特徴空間の生成(進化・学習とロボティクス)