マルコフゲームにおける環境モデルの推定を利用したマルチエージェント強化学習法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, マルコフゲームにおける新たなマルチエージェント強化学習法を提案する.本稿で提案するマルチエージェント強化学習法では, エージェントが, 環境モデル(環境内に存在する他エージェントの政策と, 環境の状態遷移関数)を推定し, その推定した環境モデルを利用して, (エージェントが)どの行動を実行すればどの環境状態に遷移するかを予測する.そして, その予測した環境状態における価値関数(V関数)を基に, どの行動を実行すればよいかを決定し, 強化学習を進行する.提案したマルチエージェント強化学習法をマルコフゲームの枠組みでモデル化した追跡問題に適用し, 実験を行った結果, その有効性が示される.
- 2001-07-16
著者
関連論文
- 移動センサノードを用いたデータ収集型WSNでのk重被覆時間の最大化手法
- 系統的なテストを可能にするユビキタスアプリケーションシミュレータの提案(UBI6:プラットフォーム・アーキテクチャ)
- 指向性アンテナおよび車車間通信を用いた歩行者位置追跡手法とその評価(セッション2)
- 分離・合流をともなうグループ観光スケジュール作成機能の提案
- 分離・合流を伴うグループ観光スケジュール作成機能の提案(セッション4)
- MANETによる携帯端末でのワンセグ視聴品質向上手法(セッション6-C:無線ネットワークと応用技術)
- 多数の観光候補地から効率良い観光スケジュールを自動的に作成・提案するシステムP-TourのGoogle Mapsを利用した設計と実装(セッションB-9:マルチメディア,アプリケーション)
- P-Tour : 観光スケジュール作成支援とスケジュールに沿った経路案内を行うパーソナルナビゲーションシステム(ITS)(次世代移動体通信システム)
- 車車間通信による交差点鳥瞰映像ストリーミング手法の提案(セッション2)
- 各車両の予定経路情報を利用した車車間通信による情報取得手法の提案(セッション1)
- メッセージフェリーと車車間通信を併用した渋滞情報収集システムの情報伝播効率の改善(車車間通信技術,次世代社会基盤をもたらす高度交通システムとモバイル通信システム)
- 多数の情報家電を仮想空間を介して遠隔操作するフレームワークの提案(UBI-1【ホームネットワーク/実世界インタフェース】)
- 仮想空間を用いたスマートスペースアプリケーション向けシミュレータ(モバイルコンピューティング,情報洪水時代のネットワークサービス)
- 異なる品質要求を持つ複数ユーザへのピアツーピアビデオ配信手法(ネットワークプロトコル,情報洪水時代のネットワークサービス)
- ハードウェア化のための多目的GAアーキテクチャの提案(バイオインフォマティックスの情報科学への応用)
- 携帯無線端末向け複数ビデオ同時視聴サービスのための放送型ビデオ配信方式(セッション3:ユビキタスシステムとマルチメディア通信)
- 将来の混雑状況予測に基づく混雑回避巡回スケジューリング手法の提案(セッション4)
- MANET上での効率良いビデオ配信を目的とした準最適マルチキャスト配送木の分散構築法(無線・モバイルネットワーク,シームレスコンピューティングとその応用技術)
- FPGA上への遺伝的アルゴリズムの柔軟な実装手法の提案(応用技術,リコンフィギャラブルシステム論文)
- 関連性の高いアイテム集合のマイニングに要する計算量
- 検索および再帰なし無閉路スキーマに対する型検査問題の計算量
- 満足度と体力を考慮した観光スケジューリング法の提案
- 「情報処理学会論文誌:数理モデル化と応用」の編集にあたって
- 携帯電話端末への低コスト動画広告配信を目的としたWiFi併用協調ダウンロード方式
- 都市や観光地における混雑状況を考慮した多数ユーザ同時巡回スケジューリング手法
- データサイズと送信期限を考慮したDTN経路制御手法
- 無線センサネットワーク長寿命化のためのノード集合の分割に基づくスリープスケジューリング手法
- 無線センサネットワーク長寿命化のためのノード集合の分割に基づくスリープスケジューリング手法
- 天気変化を考慮した観光スケジュール群の探索アルゴリズム
- 電子トリアージタグに基づいた傷病者搬送計画システムの提案
- 利用者の状況に応じて画面レイアウトが変更可能な遠隔教育支援システムの提案
- 大容量コンテンツ配信を目的とした携帯電話網・Bluetooth併用協調ダウンロード手法
- 検索処理を高速化するためのデータベーススキーマの設計手法
- 文字列集合における識別文字列を求めるための多項式時間手続き
- 多数の観光候補地から効率良い観光スケジュールを自動的に作成・提案するシステムP-TourのGoogle Mapsを利用した設計と実装(セッションB-9:マルチメディア,アプリケーション)
- モバイルアンカノードを用いた低コストな水中センサノードの位置推定法
- 移動センサノードを用いたデータ収集型WSNでのk重被覆時間の最大化手法
- 水面を移動可能なアンカーノードを用いた水中センサネットワークのノード位置推定手法の提案
- 編集にあたって(平成20年度論文賞の受賞論文紹介)
- 電子トリアージタグに基づいた傷病者搬送計画システムの提案
- 天気変化を考慮した観光スケジュール群の探索アルゴリズム
- 大容量コンテンツ配信を目的とした携帯電話網・Bluetooth 併用協調ダウンロード手法
- 複数日にわたる観光のためのパーソナルナビゲーションシステム(モバイルアプリケーション,ユビキタス時代を支えるモバイル通信と高度交通システム)
- 宿泊地を考慮した観光スケジュール作成支援機能の提案(交通における計測・一般(電気系3学会ITS合同研究会))
- 宿泊地を考慮した観光スケジュール作成支援機能の提案(交通における計測, 一般(電気系3学会ITS合同研究会))
- M-058 観光のためのパーソナルナビゲーションシステムP-Tourの携帯端末上への実装と評価(M.ネットワーク・モバイルコンピューティング)
- アナログλ-optアルゴリズムを使った2次割当て問題の解法
- 座標変換を用いたカオス最適化手法
- リクエストに応じた交差点映像配信を目的とした車車間通信プロトコルの提案と評価
- P2Pベースマルチプレイヤネットワークゲームにおけるチートの分散検出手法(品質制御, 通信品質やヒューマンファクタを考慮したモバイルネットワーク及びVRアプリケーションの構築, 及び一般(キーワード: VR, ヒューマンファクタ, アプリケーション品質))
- データマイニングにおける相関規則を求める問題に関する研究
- COMP2000-29 稀出集合問題の計算複雑さ及び連想規則問題との関連
- 頻出集合から連想規則を生成するインクリメンタルアルゴリズム
- 頻出集合からの連想規則の生成の計算複雑さ
- データベースの周期性を判定するアルゴリズム
- 強結合集合問題の計算複雑さ
- 頻出集合のインクリメンタルなデータマイニング
- 効率良く頻出集合をデータマイニング可能なデータベースクラスについて
- 多数の情報家電を仮想空間を介して遠隔操作するフレームワークの提案(UBI-1【ホームネットワーク/実世界インタフェース】)
- メッセージの重要度と配送期限を考慮したDTN経路制御手法の提案と評価
- メッセージの重要度と配送期限を考慮したDTN経路制御手法の提案と評価
- 電子トリアージタグに基づいた傷病者搬送計画システムの提案
- VANET における車両の経路情報を利用した情報伝播プロトコルの提案と評価
- MANET環境におけるノードの移動特性を考慮した自己安定クラスタリング手法
- 無線センサネットワーク長寿命化のためのノード集合の分割に基づくスリープスケジューリング手法
- 無線環境におけるサービス合成にもとづいた複合コンテンツ配信方式(セッション9-A:ユーザ指向,状況依存)
- 無線環境におけるサービス合成にもとづいた複合コンテンツ配信方式(セッション9-A:ユーザ指向,状況依存)
- 系統的なテストを可能にするユビキタスアプリケーションシミュレータの提案(UBI6:プラットフォーム・アーキテクチャ)
- PCグリッド環境での市場原理に基づいた資源共有方式(分散処理, ブロードバンド・ユビキタス・ネットワークとその応用)
- 多様な要求品質を持つ移動端末ユーザへのリソース効率の良いビデオ配信方式(QoS)
- 多様な要求品質を持つ移動端末ユーザへのリソース効率の良いビデオ配信方式(QoS)
- 再生希望時間を考慮した携帯無線端末向けビデオストリーミングシステム(ネットワークプロトコル)
- 多種多様な端末に対する効率のよいビデオ配信方式(セッション8-B : ミドルウェア)
- 多種多様な端末に対する効率のよいビデオ配信方式(セッション8-B : ミドルウェア)
- 場面の重要度に基づいて再生品質制御を行う省電力ビデオストリーミングシステム(ネットワークアプリケーション)(新時代の分散処理とネットワーク(WebサービスとP2P))
- 市場モデルに基づく計算機資源配分における分散実行系の提案(セッション4:ミドルウェア)
- 市場モデルに基づく計算機資源配分における分散実行系の提案
- 2体エージェント確率ゲームにおける他エージェントの政策推定を利用した強化学習法(分散協調とエージェント)
- マルチエージェント強化学習 : 未来状態の予測に基づいた接近法(エージェント)
- 他エージェントの行動予測を利用したマルチエージェント強化学習の状態空間分割による高速化
- インクリメンタルサポートベクターマシンによる価値関数の学習
- マルコフゲームにおける環境モデルの推定を利用したマルチエージェント強化学習法
- マルコフゲームにおける環境モデルの推定を利用したマルチエージェント強化学習法
- マルコフゲームにおける環境モデルの推定を利用したマルチエージェント強化学習法
- 渋滞緩和を目的とした車車間通信による混雑状況の伝播方式(交通における計測・一般(電気系3学会ITS合同研究会))
- 渋滞緩和を目的とした車車間通信による混雑状況の伝播方式(交通における計測, 一般(電気系3学会ITS合同研究会))
- 車車間通信を用いた渋滞解消ナビゲーションシステムの提案(セッション1-A : アドホックネットワーク)
- 車車間通信を用いた渋滞解消ナビゲーションシステムの提案(セッション1-A : アドホックネットワーク)
- 遺伝的アルゴリズムによるマルチプルストリングアライメント
- 遺伝的アルゴリズムにおけるマルチプル・ストリング・アライメント
- オブジェクト指向データベースにおける逆行を含む経路式の航行可能性に関する考察
- オブジェクト指向データモデルにおける逆行を含む経路式の航行可能性について (時空間データベースおよび一般)
- 実・仮想空間を跨るインタラクションを実現するためのQoS適応機構とその評価
- マルチユーザネットワークゲームにおける負荷分散および遅延時間を考慮したイベント配送方式の提案(分散処理, ブロードバンド・ユビキタス・ネットワークとその応用)
- マルチユーザネットワークゲームにおける負荷分散および遅延時間を考慮したイベント配送機構の提案(セッション3-B : リアルタイム・マルチメディア通信)
- マルチユーザネットワークゲームにおける負荷分散および遅延時間を考慮したイベント配送機構の提案(セッション3-B : リアルタイム・マルチメディア通信)
- マルチユーザネットワークゲームにおける負荷分散および遅延時間を考慮したイベント配送機構の提案
- M-082 P2P環境でのネットワークゲーム向け負荷分散機構と評価(M.ネットワーク・モバイルコンピューティング)
- MANETによる携帯端末でのワンセグ視聴品質向上手法(セッション6-C:無線ネットワークと応用技術)
- ニューラルネットによるλ-optアルゴリズムを使ったQAPの解法