エージェント-環境間相互作用 : 強化学習の立場からの再考
スポンサーリンク
概要
- 論文の詳細を見る
- 2005-12-10
著者
関連論文
- エージェント-環境間相互作用 : 強化学習の立場からの再考
- 専門科目名のリストを利用した学位授与事業のための科目分類支援システムの評価
- キーワードの関連用語を考慮したシラバス検索システムの構築(Webインテリジェンスとインタラクション)
- シラバス-専門用語の相互クラスタリングを用いたカリキュラム分析システムの改善(高等教育と情報)
- 分類候補数の能動的調整を可能にした学位授与事業のための科目分類支援システムの提案と評価(高等教育と情報)
- キーワードの関連用語を考慮したシラバス検索システムの改善(情報教育と授業支援システム/一般)
- 電子化されたシラバスに基づく学位授与事業のための科目分類支援システムの試作(組織活動を支える情報システム)(情報システム論文)
- シラバスの文書クラスタリングに基づくカリキュラム分析システムの構築(教育)
- N-029 シラバスデータベースの構築と利用(N.教育・人文科学)
- N-004 科目分類支援システムの改善とその応用(N.教育・人文科学)
- AIもズルや言い訳に熟達すべきか?(編集委員2007年の抱負)
- 罰回避政策形成アルゴリズムの改良とオセロゲームへの応用
- 罰を回避する合理的政策の学習
- 罰を回避する合理的政策の学習
- 罰回避政策の形成とゲーム問題への応用
- ITを利用した高等教育の展開--教室外講義,通信教育を中心に
- LC学習 : モデルに基づく段階的平均報酬強化学習手法
- LC学習:モデルに基づく段階的平均報酬強化学習手法
- Profit Sharingを用いたマルチエージェントと強化学習における報酬配分の理論的考察
- Undiscounted Prioritized Sweeping:最適政策の優先順位付け強化学習の効率化手法
- RAE-PIA:複数報酬環境下における最適政策の効率的強化学習
- 101 強化学習によるロボットの知的制御 : Lego Mindstorms への実装
- 2000-ICS-121-14 強化信号のコミュニケーションに基づくマルチエージェント強化学習
- OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
- OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
- RAE-PIA : 報酬獲得効率を最大化する政策の強化学習
- RAE-PIA:報酬獲得効率を最大化する政策の強化学習
- 強化学習システムの設計指針
- Profit Sharing に基づく強化学習の理論と応用 (計算学習理論の進展と応用可能性)
- 多戦略学習手法MS-RL : 環境変動下におけるロバストな学習エージェントの実現
- 未来開拓谷内田プロジェクト : インタラクションによる感性創発世界の構築(未来開拓谷内田プロジェクト-人間情報の可視化とインタラクション支援)
- 未来開拓谷内田プロジェクト : インタラクションによる感性創発世界の構築
- 大学評価と学位授与(アイ・サイ問答教室)
- ヒューマノイドの為の目標生成
- 人間と擬人化エージェントによるマインドマッピングの相互適応(IDEA: 適応のためのインタラクション設計)
- 電子化シラバスに基づく学位授与のための科目分類支援システムの検討
- 人間とペットロボットの相互適応 : AIBOをしつける
- 合理的政策形成アルゴリズムの連続値入力への拡張
- 期待報酬推定型 Profit Sharing におけるロバスト性解析 : 無効ルール抑制条件における理論的考察と局所解問題への展開
- Self-Rewarded RAE:学習の合理性と高速性とを両立させた経験強化型学習法
- Self-Rewarded RAE : 学習の合理性と高速性とを両立させた経験強化型学習法
- 人間とペットロボットの相互適応--AIBOをしつける (小特集 「ヒューマンエージェントインタラクション」および一般)
- 行為の同型性に基づく強化学習法
- 視線行動の可視化による着眼スキル伝達支援
- 視線情報の可視化・共有による感性インタラクション支援(未来開拓谷内田プロジェクト-人間情報の可視化とインタラクション支援)
- インタラクション支援のための視線可視化方法の検討 : 発想支援システム"ミラーエージェント"の構築に向けて
- 情報量を考慮した関係記述の類似度に基づく家の初期構造概念の学習
- 背景知識に基づく家の構造概念の学習
- 関係の類似度に基づく家の構造概念の学習
- 人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザーモデルの推定
- 人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザモデルの推定
- Profit Sharing の不完全知覚環境下への拡張 : PS-r^*の提案と評価
- 適応型模倣による複数個体の強化学習
- 模倣と自己主張に基づく行動の学習 : 集団における協調行動の生成
- 実例と教示による物体形状の概念学習 : 定量3D情報から定性値表現へ
- 抽象化副報酬の自動生成による実ロボット強化学習の高速化
- 経験型強化学習における仮想個体から実ロボットへの学習行動の伝播
- 人間と擬人化エージェントによる感情マッピングの相互学習 (特集 HAI(Human-Agent Interaction)および一般発表) -- (HAIセッション1 感情と表情)
- 逐次的学習法における時系列学習データ分布の変動点推定
- 種を単位とした適応度評価による利他的コミュニケーションの進化的獲得
- 種を単位とした適応度評価による利他的コミュニケーションの進化的獲得
- 11912 改良型罰回避政策形成アルゴリズムへの罰基底度閾値決定機構の導入と評価(OS7 ロボティックス・メカトロニクス(3),オーガナイズドセッション)
- より人間らしい人工知能を目指して(編集委員2007年の抱負)
- より人間らしい人工知能を目指して
- MindStormsと高等教育 : 特集総説(MindStormsと高等教育)
- 種を単位とした適応度評価による個体間の協調行動の進化
- 強化学習における時系列学習データ分布の変動点推定
- 視覚からのモデルと概念の学習
- 中学生の保護者を取り込む体験入学の実施ー名作ゲーム開発疑似体験を通してー
- Squeakを用いた小中学生のためのプログラミング講座ー奈良高専情報工学科公開講座ー