RAE-PIA:報酬獲得効率を最大化する政策の強化学習

スポンサーリンク

概要

論文の詳細を見る

著者

山口智浩
奈良工業高等専門学校情報工学科
山口智浩
奈良工業高等専門学校
石村健二
北陸先端科学技術大学院大学
石村健二
奈良工業高等専門学校専攻科電子情報工学専攻

関連論文

エージェント-環境間相互作用 : 強化学習の立場からの再考
AIもズルや言い訳に熟達すべきか?(編集委員2007年の抱負)
LC学習 : モデルに基づく段階的平均報酬強化学習手法
LC学習:モデルに基づく段階的平均報酬強化学習手法
Undiscounted Prioritized Sweeping:最適政策の優先順位付け強化学習の効率化手法
RAE-PIA:複数報酬環境下における最適政策の効率的強化学習
2000-ICS-121-14 強化信号のコミュニケーションに基づくマルチエージェント強化学習
OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
RAE-PIA : 報酬獲得効率を最大化する政策の強化学習
RAE-PIA:報酬獲得効率を最大化する政策の強化学習
多戦略学習手法MS-RL : 環境変動下におけるロバストな学習エージェントの実現
未来開拓谷内田プロジェクト : インタラクションによる感性創発世界の構築(未来開拓谷内田プロジェクト-人間情報の可視化とインタラクション支援)
未来開拓谷内田プロジェクト : インタラクションによる感性創発世界の構築
ヒューマノイドの為の目標生成
人間と擬人化エージェントによるマインドマッピングの相互適応(IDEA: 適応のためのインタラクション設計)
人間とペットロボットの相互適応 : AIBOをしつける
Self-Rewarded RAE:学習の合理性と高速性とを両立させた経験強化型学習法
Self-Rewarded RAE : 学習の合理性と高速性とを両立させた経験強化型学習法
人間とペットロボットの相互適応--AIBOをしつける (小特集「ヒューマンエージェントインタラクション」および一般)
行為の同型性に基づく強化学習法
視線行動の可視化による着眼スキル伝達支援
視線情報の可視化・共有による感性インタラクション支援(未来開拓谷内田プロジェクト-人間情報の可視化とインタラクション支援)
インタラクション支援のための視線可視化方法の検討 : 発想支援システム"ミラーエージェント"の構築に向けて
情報量を考慮した関係記述の類似度に基づく家の初期構造概念の学習
背景知識に基づく家の構造概念の学習
関係の類似度に基づく家の構造概念の学習
人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザーモデルの推定
人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザモデルの推定
適応型模倣による複数個体の強化学習
模倣と自己主張に基づく行動の学習 : 集団における協調行動の生成
実例と教示による物体形状の概念学習 : 定量3D情報から定性値表現へ
抽象化副報酬の自動生成による実ロボット強化学習の高速化
経験型強化学習における仮想個体から実ロボットへの学習行動の伝播
人間と擬人化エージェントによる感情マッピングの相互学習 (特集 HAI(Human-Agent Interaction)および一般発表) -- (HAIセッション1 感情と表情)
逐次的学習法における時系列学習データ分布の変動点推定
種を単位とした適応度評価による利他的コミュニケーションの進化的獲得
種を単位とした適応度評価による利他的コミュニケーションの進化的獲得
種を単位とした適応度評価による個体間の協調行動の進化
強化学習における時系列学習データ分布の変動点推定
視覚からのモデルと概念の学習
中学生の保護者を取り込む体験入学の実施ー名作ゲーム開発疑似体験を通してー
Squeakを用いた小中学生のためのプログラミング講座ー奈良高専情報工学科公開講座ー

もっと見る閉じる

スポンサーリンク

論文relation | CiNii API
論文
論文著者
博士論文
研究課題
研究者
図書
論文
著者
お問い合わせ
プライバシー