強化学習を用いたサッカーゲームモデル
スポンサーリンク
概要
- 論文の詳細を見る
Collective behaviorおよび強化学習に含まれる学習システムの問題の一つである,如何に現実的で有効な行動集合を設定するかという課題は,学習環境が複雑になればなる程困難を極める.つまり低レベルな行動集合で効果的に学習を行う為には十分な状態数が必要であり,しばしば学習時間が膨大な量になる.そこでオンラインでの強化学習を行いながら,かつ行動集合を更新する機構の構築を目的とする.また複雑な学習環境としてマルチエージェントシステムによるサッカーにアプローチする.
- 1995-03-06
著者
関連論文
- 創発特性を利用した自己位置推定−ターゲット包囲行動の場合
- 3D Unitary ESPRITにおける推定値ペアリング法の改良(アダプティブアンテナ,等化,干渉キャンセラ,MIMO,無線通信,一般)
- 創発特性を利用した自己位置推定-ターゲット包囲行動の場合
- ロボットレースにおける群れ行動の創発
- A-14-6 認知療法に基づくe-ピアサポートシステムにおける認識定量化手法の検討(A-14. ヒューマンコミュニケーション基礎,一般セッション)
- 利用者の発言頻度の規則性に基づく電子フォーラムのコミュニティサイズ推定法
- ウェブ掲示板における投稿数次数分布の調査と分布関数の導出
- UCAにおけるESPRIT法の精度向上について
- B-1-210 UCAにおけるESPRIT法の誤差改善について(B-1. アンテナ・伝播C(アンテナシステム),一般セッション)
- 調波構造モデルの作成とその相関による多重音の基本周波数解析(聴覚・信号処理/一般)
- GAを用いた共進化 Agent の追跡・回避行動の獲得
- パルス情報を用いた多リンク構造クリーチャーの行動生成
- 遺伝的アルゴリズムを用いた複雑ネットワークの生成(Session 5)
- 動線コンジョイント分析による顧客の選好推定 (特集 人工知能市場と異質的エージェントの相互作用の研究)
- マルチエージェントによる先物取引コンテスト : Pre U-Mart 2000実施報告
- マルチエージェントによる先物取引コンテスト : Pre U-Mart 2000実施報告
- 人工市場のシステム構造(「人工市場」)
- 予測機構による協調動作獲得の促進
- U-Mart における典型的エージェントの振る舞い
- 2P1-3F-B7 ラーニングクラシファイアの報酬系再構築による群ロボットシステムの制御
- 6T-5 ビヘイビアベースの情報組織化に関する研究(GA・エージェントモデル,学生セッション,人工知能と認知科学)
- D-9-1 北海道情報大学における総合情報配信システムの開発と運用(D-9. オフィスインフォメーションシステム,一般セッション)
- ビークル経路計画問題へのSOMの適用
- WEB SERVICE USING THE FUZZY RELATION INEQUALITY
- スモールワールド理論を用いたAGVの経路設計評価に関する研究
- SOMによる癌の予後決定遺伝子の推定
- 2A1-S-067 代謝反応ネットワークの構造特性解析に関する研究(進化・学習とロボティクス4,生活を支援するロボメカ技術のメガインテグレーション)
- ジョブショップスケジューリングにおける多目的評価のペタル図による視覚化
- F-041 Webサービスにおける意思決定支援に関する研究(F.人工知能)
- LF-016 On-line Profit Sharingによる複数AGVの自律走行(F. 人工知能)
- スケールフリー構造を持つオートマタの状態遷移に関する研究
- 自律的Webサービスにおけるビジネスプロトコルの動的生成について(ネットワーク)
- 運動画像からの特徴検出における基礎研究(進化・学習とロボティクス2)
- 装着型パワーアシスト装置の制御 : ニューラルネットワークを用いた動作の識別(進化・学習とロボティクス2)
- 骨動マイク用音声コマンドの設計(進化・学習とロボティクス2)
- FESを用いた空間情報呈示システムの開発 : 距離・刺激強度・刺激応答の関係性について(進化・学習とロボティクス2)
- 北海道大学工学研究科における高度情報技術者教育の実践例
- 進化型強化モジュールを有するクラシファイアシステムに関する研究
- CSにおけるルール表現の拡張に関する研究
- 2A1-30-032 複数自律ブロックエージェントの挙動獲得に関する研究
- 2A1-30-031 多集団型進化戦略に関する研究
- 自動倉庫のための自律エージェント群の場の知識獲得に関する研究
- 形態をもつマルチエージェントの自律的振る舞いに関する基礎研究
- 2P1-3F-B5 遠隔制御を伴う自律除雪機の構築に関する基礎研究
- B-1-185 3D Unitary ESPRITの方向推定におけるペアリング法の改善(B-1.アンテナ・伝播C(アンテナシステム),一般セッション)
- 2A1-2F-D1 骨導マイクと音声認識による福祉機器遠隔操作に関する研究
- 行動選択ネットワークに基づく社会的行動の創発
- B-1-231 Estimation of Direction of Arrival for Circular Signals under Conditions of Mixed Circular and Non-Circular Signals
- 2A1-S-069 エネルギーを共有するロボット群のシミュレーション(進化・学習とロボティクス4,生活を支援するロボメカ技術のメガインテグレーション)
- カオス遍歴を用いた集団的試行錯誤過程によるモバイルエージェント群のデッドロック回避
- P2Pコミュニティのエージェントモデルによる解釈(「21世紀の知識情報科学に向けて」,及び一般)
- 411 自動 2 輪車の運動解析 : 第 1 報 : DCT 機構の開発
- 徳の起源, マットリドレー著, 出版社 翔泳社, 発行 2000年6月, 全ページ 380頁, 価格 2,500円, ISBN 4-881535-877-4
- 非階層的クラスタリング手法による対称巡回セールスマン問題の近似解法
- 強化学習を用いたサッカーゲームモデル
- Boolean Networkを用いた移動ビークルの学習
- 蟻の餌争奪ゲームによるマルチエージェントシステムの協調動作評価
- 蟻の餌争奪ゲームにおける自律エージェント群の学習による協調動作生成
- 学習オートマトンによる協調動作獲得への一手法
- 学習オートマトンによる変動情報を含むTSPへのアプローチ
- 階層型有向ハイパーグラフを用いた知識表現における推論
- マルチエージェントシステムにおける学習エージェントの設計と自律性
- 2A1-3F-B2 階層型エージェントシステムを用いた追跡問題へのアプローチ
- 2P1-L9 生体信号を用いた強化学習の報酬に関する基礎研究(27. 強化学習とロボティクス・メカトロニクス)
- 2P1-E3 柔軟構造を有するSMA-Netの行動生成に関する基礎研究(29. 自己組織ロボットシステム)
- 2P2-3F-A7 Prosthetic hand control with tactile sensory feedback
- 2P2-3F-A6 表面筋電位による運動習熟過程のモデル化 : 上肢到達運動課題における考察
- 2P2-3F-A4 遺伝的アルゴリズムによる 2 エージェントゲームにおける適応的手法
- 2P2-3F-A3 システム構成要素間の関係変更に基づいた学習能力の獲得
- 2P2-3F-A1 統計的手法を用いたペットロボットの動作と印象との関係の解析
- 進化的学習における適応度ランドスケープの自動創成に関する研究 : ペナルティ学習
- ALifeによるタスク処理
- ビリヤード環境におけるアフォーダンス抽出 : コンビネーションプレイにおける不変項の獲得
- 1P1-3F-B3 触覚インタフェイス装着時における接触力を考慮した手指の振動閾値の測定
- 2P2-3F-A2 2 次元内部状態と主観的評価を持つエージェントによる集団の形成
- 部品主体型生産システムにおける情報表現
- 非均質ロボット群における組織的学習に関する研究
- 2A1-3F-B5 装着型パワーアシスト装置制御のための人間動作の解析
- 2P1-3F-B6 バネー質点系を基本としたロボットモデルにおける動作獲得 : 進化型計算による方法とその過程の解析
- [北海道]情報大学紀要20周年巻頭言 (創立20周年記念号)
- 1P1-N8 異種センサ統合のための信頼度マップに関する研究(66. センサフュージョン・アクティブセンシング)
- B-1-224 低SN比での到来波数推定のためのMENSE法の性能改善(B-1. アンテナ・伝播C(アンテナシステム),一般セッション)
- 2P2-G10 Boidsモデルを用いたマルチエージェントの群れの制御(進化・学習とロボティクス)
- スマートエンジニアリングの設計・応用
- 1P1-F6 耐故障性を考慮した再構築可能な制御系のためのモデル同定(13. 安全と診断のメカトロニクス)
- 低SN比でのQR分解を用いた高性能な到来波数推定法