宮崎 和光 | 東京工業大学 総合理工学研究科
スポンサーリンク
概要
関連著者
-
宮崎 和光
東京工業大学 総合理工学研究科
-
小林 重信
東京工業大学
-
宮崎 和光
独立行政法人大学評価・学位授与機構 学位審査研究部
-
山村 雅幸
東京工業大学
-
荒井 幸代
カーネギーメロン大学ロボティクス研究所
-
荒井 幸代
東京工業大学大学院総合理工学研究科知能科学専攻
-
宮崎 和光
大学評価・学位授与機構
-
木村 元
九州大学大学院工学研究院海洋システム工学部門
-
木村 元
東京工業大学
-
坪井 創吾
(株)東芝研究開発センターヒューマンインターフェースラボラトリー
-
坪井 創吾
東京工業大学 総合理工学研究科
-
石原 秀一
東京工業大学大学院総合理工学研究科
-
宮崎 和光
東京工業大学大学院総合理工学研究科 知能システム科学専攻
著作論文
- 罰回避政策の境界維持による合理的政策の形成
- 強化学習に基づくオセロゲームの政策形成
- Profit Sharingを用いたマルチエージェントと強化学習における報酬配分の理論的考察
- マルチエージェント強化学習における報酬配分の理論的考察
- POMDPs環境下での決定的政策の学習
- マルチエージェント強化学習の方法論 : Q-LearningとProfit Sharingによる接近
- 強化学習システムの設計指針
- Profit Sharing に基づく強化学習の理論と応用 (計算学習理論の進展と応用可能性)
- POMDPsにおける合理的政策の逐次改善アルゴリズムの提案
- 離散マルコフ決定過程下での強化学習 ( 強化学習)
- ロボットアームによるほふく行動の強化学習
- マルコフ決定過程下での統合的強化学習システム
- MarcoPolo : 報酬獲得と環境同定のトレードオフを考慮した強化学習システム
- l-確実探査法:エージェントによる環境同定のための行動選択戦略 : k-確実探査法の不確実性下への拡張
- MarcoPolo - 報酬獲得と環境同定のトレードオフを考慮した学習システム
- エージェントの学習 (「エージェントの基礎と応用」)
- k-確実探査法 : 強化学習における環境同定のための行動選択戦略
- 強化学習の特徴と発展の方向
- 強化学習における報酬割当ての理論的考察
- 強化学習における環境同定と経験強化のトレードオフ
- 離散マルコフ決定過程における強化学習