経験型強化学習における仮想個体から実ロボットへの学習行動の伝播
スポンサーリンク
概要
- 論文の詳細を見る
For a physical robot to acquire behaviors, it is important for it to learn in the physical environment. Since reinforcement learning requires large computation costs as well as a lot of time in the physical environment, most research has performed learning by simulation. However, this does not work well in the real world. Realizing reinforcement learning of a physical robot in a physical environment requires both an adaptation for the diversity of possible situations and a high-speed learning method that can learn from fewer trials. This paper describes cooperative reinforcement learning based on propagating the learned behaviors of a virtual agent to a physical robot in order to accelerate learning in a physical environment. The method consists of two parts: (1) preparation learning in a virtual environment to accelerate initial learning, which accounts for most of the learning cost ; and, (2) refinement learning in a physical environment by using the virtual learning results as an initial behavior set of a physical robot. Experimental results are given for a ball-pushing task with the physical robot and a virtual agent.
- 社団法人人工知能学会の論文
- 1997-07-01
著者
-
谷内田 正彦
大阪大学大学院基礎工学研究科
-
山口 智浩
奈良工業高等専門学校
-
山口 智浩
大阪大学大学院基礎工学研究科システム科学分野
-
田中 康祐
大阪大学大学院基礎工学研究科システム科学分野
-
田中 康祐
大阪大学大学院基礎工学研究科システム科学分野:住友電気工業(株)
-
増渕 元臣
大阪大学大学院基礎工学研究科システム科学分野:(株)村田製作所
関連論文
- 非同期多視点画像による人物追跡システムの構築
- 多様な人物情報の獲得が可能な多視点システムの提案と構築
- 多様な姿勢を有する顔画像からの個人識別
- 知能作業ロボットのための非等方性全方位視覚(センシング, 画像の認識・理解論文)
- 屈折反射光学系を用いた広視野角ヘッドマウントデイスプレイ(マルチメディア処理)
- DCTによる次元圧縮と事例選択を用いたビデオ超解像アルゴリズムの高速化(画像処理・符号化とアプリケーション)
- DCTによる次元圧縮と事例選択を用いたビデオ超解像アルゴリズムの高速化(一般セッション)
- 全方位視覚センサを用いた高解像度3Dモデリング
- 全方位視覚センサを用いた高解像度3D環境モデリング
- 全方位時空間画像からの超解像度化
- 肌色情報を用いた複数人物追跡
- 全方位ビジョンへの注文
- 全方位視覚センサを用いた環境地図とロボット自己位置,姿勢の同時推定法
- 全方位視覚センサを用いた環境地図とロボット自己位置・姿勢の同時推定法
- ロボットナビゲーションのための非等方性全方位視覚
- 一般化全天球オプティカルフロー評価環境の開発
- IBRとMBRを併用した空間モデリングとウォークスルー環境
- キーワード抽出法KeyGraphの転用による地震履歴データからの要注意活断層発見支援(発見科学)
- ウェアラブル全方位視覚センサとGPSを用いた自己位置識別(卒論セッション・概要発表)
- サブトピックを考慮した重要文抽出による報知的要約生成(データマイニング)
- 準教師有りクラスタリングによる行動素抽出(卒論セッション・概要発表)
- 全天球オプティカルフローからの3次元自己運動推定(卒論セッション)
- 全方位画像列からの個人識別
- 階層的パラメトリック固有空間法を用いたパラメータ誘導 (画像の認識・理解論文特集)
- 全方位画像列からの個人識別
- 階層的パラメトリック固有空間構成法
- 顔輪郭抽出のための動的輪郭モデルの提案
- 顔認識のための顔特徴抽出手法
- 顔輪郭抽出のための動的輪郭モデル
- 軸対称性拘束を持つ動的輪郭モデルを用いた顔輪郭自動抽出
- 動きと形状モデルによる人物の姿勢推定 (知能情報メディア論文特集)
- 円錐曲線を用いた全方位視覚センサのキャリブレーション
- ミラーの外縁を利用した全方位視覚センサのキャリブレーション(一般セッション (2))
- ロボットのための視覚センシング技術(ロボットにおける要素技術)(ロボット)
- 顔自動検出のためのフレキシブル特徴照合法の提案
- ユーザの興味の構造を用いて関連検索キーを提示する検索支援インターフェイス
- 情報検索における検索目標決定支援
- コマンド履歴を用いたファイル間の関連性抽出
- Webページ検索におけるユーザの興味表現支援システム
- AAS : 文書の組み合わせによってユーザの興味を満足する検索システム : コストに基づく仮説推論の一応用
- Webページ検索におけるユーザの興味表現支援
- AAS : コストに基づく仮説推論により過去の回答の組み合わせを行なう質問応答システム
- 事象ごとの生起確率から未知事象発見を支援する手法とそのアンケート調査への適用
- KeyGraph : 語の共起グラフの分割・統合によるキーワード抽出
- AAS:過去の回答の自動組み合わせに基づく質問応答システム
- 自律走行車の身体に基づく環境表現により定性的移動計画
- 二次元平面インタフェースによりユーザの曖昧な希望を実現する旅行計画システム
- アクセス履歴を用いたファイル使用ナビゲーション
- AAS:過去の回答の自動組み合わせに基づく質問応答システム
- グラフに基づくキーワード抽出法KeyGraphのデスクトップ整理への転用
- ユーザの変化する興味を理解し表現する文献検索支援システムIndex Navigator
- コストに基づく仮説推論を多項式時間で達成する新しい十分条件
- ネットワーク情報から社会の新しいニーズを発見する大衆心理分析システム
- 仮説推論のコストに基づく協調による時系列の理解
- 二次元画面を利用した旅行者のあいまいな希望を具体化する対話型旅行案内システム
- パーティクルフィルタによる人物行動認識と例外行動検出(一般セッション4)
- パーティクルフィルタによる人物行動認識と例外行動検出(一般セッション2,三次元画像,多視点画像)
- パーティクルフィルタによる人物行動認識と例外行動検出(一般セッション2,三次元画像,多視点画像)
- 確率遷移モデルによる人物行動の認識と例外の検出(テーマ関連セッション3)
- 全方位画像による例外行動の検出(卒論セッション(ポスター発表))
- RNN予測器を用いた人物行動の自動分節化(一般セッション7)
- RNN予測器を用いた人物行動の自動分節化(一般セッション3,三次元画像,多視点画像)
- RNN予測器を用いた人物行動の自動分節化(一般セッション3,三次元画像,多視点画像)
- リカレントニューラルネット予測器を用いた人物行動のモデル化と例外行動検出(卒論セッション)
- 時間的・空間的分解能の異なる複合センサカメラシステム(テーマ関連セッション)
- モーフィングによる高解像度高フレームレート動画像の生成(複合現実感とパターン認識・メディア理解, 一般)
- 手振り認識システムのための幅情報を用いたカメラ位置・姿勢推定(3次元映像情報メディア技術)
- ABMとMSCによる実時間移動物体検出の検討(卒論セッション・概要発表)
- 時間的・空間的分解能の異なる複合センサカメラシステム(高度センシングに基づくCV)
- モーフィングによる高解像度高フレームレート動画像の生成(画像・映像処理)
- Haarウェーブレットを用いた顔認識(卒論セッション・概要発表)
- 全方位視覚を用いた案内ロボットシステム
- 経路と交差点の観測による環境地図の作成
- サッカー映像からの特定映像イベントの抽出
- サッカー映像からの特定映像イベントの抽出
- サッカー映像からの特定映像イベントの抽出
- 屋外環境における明るさ可変背景とMSCを用いた移動物体検出(運動検出,画像の認識・理解論文)
- 対話者方向からのアピアランスに基づくロボットアバターのためのジェスチャ生成
- 単一視点と均一解像度特性を有する一般化全方位カメラモデル(卒論セッション・概要発表)
- 単一視点と均一解像度特性を有する全方位視覚センサ(センシング,画像の認識・理解論文)
- 非同期多視点情報を用いた複数人物追跡手法の検討
- カルマンフィルタを用いた多数カメラによる複数人物追跡の検討
- 多数カメラによる複数人物の位置・姿勢推定手法の検討
- HMMを利用したジェスチャー認識の高性能化
- カラーラインセンサを用いた高精細3次元復元(卒論セッション・概要発表)
- M-085 全方位画像に対応したストリーミング再生プレイヤの開発(M分野:ユビキタス・モバイルコンピューティング)
- LM-014 高精細全方位動画像配信システムのためのサーバの設計(ユビキタス・モバイルコンピューティング)
- ルートパノラマ画像の色ずれを用いた3次元復元(一般セッション5)
- GPUを用いた全方位視覚センサの実時間動き推定(テーマ関連セッション3)
- L_062 全方位画像に対応したストリーミング再生プレイヤの開発(L分野:ネットワークコンピューティング)
- LI_013 単眼・両眼推定器を複合した自己位置と環境の同時推定(I分野:画像認識・メディア理解)
- ウェーブレット領域での動き補償と画像統合による高解像度高フレームレート動画像の生成(メディアを観る, 画像の認識・理解)
- 複合センサ画像の補正処理の高速化(卒論セッション(ポスター発表))
- LI-004 時空間周波数の異なる画像列からの高解像度動画像の合成(I. 画像認識・メディア理解)
- 2A1-C12 屈折反射光学系を用いた広視野角ヘッドマウントディスプレイ
- 2A1-C11 全方位視覚センサを用いた広視野角テレオペレーション
- 発話テキストからの人間の仲の良さと上下関係の推定(ヒューマンコンピュータインタラクション)
- Webページの難易度と学習順序に基づく情報理解支援システム(コンテンツ技術,Web情報システム)
- 多重画像からの反射成分推定(一般セッション (3))
- オプティカルフローモデルの比較と評価(卒論セッション)