2P1-G12 並列処理を用いた価値関数合成による強化学習の効率化

概要

論文の詳細を見る
In this paper, efficiency improvement of reinforcement learning using parallel processing for combination value function. We propose the method of periodically composing Q table of local learning clusters to global Q table. We apply this method to two applications. One is maze problem and an another is behavior rule detection problem for modular typed robot. Q Learning method and Monte Carlo method are compared with profit share method that learns robot behaviors. We presented computer experiments of 40 PC clusters. The convergence time and learning times are evaluated and discussed.

著者

山田孝治
琉球大学工学部
遠藤聡志
琉球大学工学部
遠藤聡志
琉球大学工学部情報工学科
遠藤聡志
琉球大
山田孝治
琉球大学工学部
仲間祐貴
熊本大
當眞嗣久
琉球大
山田孝治
琉球大

関連論文

日本語オントロジー辞書システム Ontolopedia の構築と興味抽出手法への応用検討
種分類を用いた共進化によるセルオートマトンの近傍則獲得(局所探索)(進化的計算)
電子マネー決済ログによる消費行動パターン分類 : マーケティングプラットフォームの提案と解析事例報告(学生セッション,一般)
LG-1 MMX^テクノロジを用いたセルオートマトン・シミュレータ用並列化コンパイラの開発(G. 人工知能)
自律分散手法を用いた海洋レーダーにおけるドップラースペクトルのピーク検出に関する基礎研究
行動選択ネットワークを用いたマルチエージェント系における協調行動の獲得に関する考察
通勤車利用型カーシェアリングシステムによるモーダルシフト効果のシミュレーション分析
モーション写像による多自由度ロボットの動作生成に関する基礎研究
印象差のある舞踊上肢運動の多変量時系列解析による特徴抽出
舞踊動作における感性情報と上肢運動の解析
沖縄舞踊カチャーシーを用いた印象と上肢運動との関連性 : 舞踊への知識差による比較
マルチモーダル交通シミュレータを用いたデマンドバス需要予測シミュレーション
タグを用いた嗜好抽出による観光イベント推薦システム
土地被覆データを使用した森林火災延焼拡大モデルの検討
電子マネー顧客分類のための手法検討と解析結果に関する報告 : 自己組織化マップと協調フィルタリングを用いたクラスタリング(学生セッション,一般)
8)ポテンシャル場を用いた動的環境でのマルチエージェントシステムの実現(ヒューマンインフォメーション研究会)
ポテンシャル表現されたマルチエージェント環境における組合せ問題への一考察
土地被覆データを使用した森林火災延焼拡大モデルの検討
4U-8 森林火災延焼拡大モデルにおける遺伝的アルゴリズムを用いた地域パラメータの探索(遺伝的アルゴリズム(1),学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
マルチエージェント系における競合共進化型学習の性能評価に関する研究
繰り返し囚人のジレンマゲームにおける競合共進化戦略の解析に関する考察
繰り返し囚人のジレンマゲームにおける競合共進化戦略の解析に関する考察
M-027 マルチエージェント・シミュレーションによる局所通信型渋滞緩和モデルの評価(M分野:ユビキタス・モバイルコンピューティング)
2A1-2 渋滞緩和を想定した車車間通信による交通情報共有に関する研究(2A1 群ロボット)
1C2-2 GISデータを活用したポテンシャル法によるデマンドバス経路探索(1C2 最適化1)
デマンドバス経路探索問題最適化に関する基礎研究
並列型免疫的共進化アルゴリズムに関する研究
免疫細胞間協同作用および抗原との共進化現象を用いた免疫的分業問題最適化手法の提案と評価
免疫細胞間協同作用に基づくマルチエージェントの分業最適化に関する考察
二種類の記憶機構を導入した適応的免疫アルゴリズムの提案と評価
適応的免疫アルゴリズムを用いた多峰性関数最適化
適応的免疫アルゴリズムの多峰性関数への適用
免疫ネットワークを用いた自律ロボットの行動制御に関する一考察
9)免疫システムに基づく組合せ最適化アルゴリズムの検討(ヒューマンインフォメーション研究会)
免疫ネットワークを用いた分業巡回セールスマン問題の解法に関する考察
The Development of a Computational Environment for Cellular Automata(Automata and Formal Language Theory)
セルオートマトン・モデル記述言語DORA及び並列化コンパイラ
拡張SIMD命令を用いたセルオートマトンシミュレータ用並列化コンパイラ(複雑系)
LF-017 グラフィック・アクセラレータによるマルチエージェント・シミュレータの実装(F. 人工知能)
セルオートマトン近傍則設計のためのインタプリタ型シミュレータの開発
2-202 セルオートマトンによる交差点モデルの自動設計に関する検討
セルラ・オートマトン・シミュレータ用インタプリタの開発
MMXテクノロジによる高速化手法を用いたセルオートマトン・シミュレータ用コンパイラの開発(情報・通信)
セルラーオートマトン(マルチエージェントシステムとOR)
MMXテクノロジを用いたセルラ・オートマトン・シミュレータの高速化
MMXテクノロジを用いたセルラ・オートマトン・シミュレータの高速化
MMXテクノロジを用いたCAの高速化手法の提案
強化学習を用いた共同注視点に基づく合意形成の獲得
個人購買履歴解析による消費行動圏の構成
2P1-3F-B1 冗長多脚ロボットの制御システム
I-043 協調型評価エージェントを導入したインタラクティブGAによる建物3Dモデルに関する研究(I分野:グラフィクス・画像,一般論文)
4T-8 Probing genetic algorithm considering Black Jack Strategy
A-002 電荷モデルを利用した競合共進化アルゴリズムによる詰碁の解獲得(A分野:モデル・アルゴリズム・プログラミング,一般論文)
I-039 PTAMを用いた3DCGモデリング支援ツールの提案(I分野:グラフィクス・画像,一般論文)
H-046 一般物体認識におけるクラス内変化を考慮した認識手法に関する基礎研究(H分野:画像認識・メディア理解,一般論文)
F-004 タグによる嗜好抽出を用いた観光イベント推薦システムの提案(F分野:人工知能・ゲーム,一般論文)
E-024 Twitter上で行われる議論要約のための、文脈を表現する指標構築のための検討(E分野:自然言語・音声・音楽,一般論文)
3S-3 類似性に基づく観光イベント情報推薦システムの提案(情報推薦(1),学生セッション,データベースとメディア,情報処理学会創立50周年記念)
2P1-S-065 五脚歩行ロボットにおける前進保容に関する研究(進化・学習とロボティクス5,生活を支援するロボメカ技術のメガインテグレーション)
1P1-S-064 モジュール型ロボットにおける前進移動の獲得(進化・学習とロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
4ZA-5 マルチモーダル交通シミュレータの開発と性能評価(交通管理,学生セッション,ネットワーク,情報処理学会創立50周年記念)
共起を利用したテキスト・クラスタリングにおける最適化問題 (「Web情報処理」および一般発表)
共起を用いたWebテキストの自動分類 (テーマ:知能・適応と社会,ネットワーク) -- (ネットワーク・WWW)
1)感性情報を入力とする線画顔画像検索システム(ヒューマンインフォメーション研究会)
マルチエージェントにおける共同注視点に基づく合意形成
11)マルチエージェント環境におけるフォーカルポイントアルゴリズムによる合意形成(ヒューマンインフォメーション研究会)
フォーカルポイントに基づいたマルチエージェント環境における協調の実現
Layered Learning in Multiagent Systems : A Winning Approach to Soccer, Peter Stone著, 出版社 The MIT Press, 発行 2000年, 全ページ 284頁, 価格 $40.00, ISBN 0-262-19438-4
解のパッケージ化法を導入した競合共進化アルゴリズムの提案
観光情報Webサイトに対する評価システムのための旅行キャリアレベルモデルを用いた利用者目的の表現
1A1-K04 上半身姿勢の特徴同定に関する基礎研究
1P1-F09 Webテキストからの情報文化の収集方法及び解析方法の基礎研究
1P1-E11 駐車場内における車両の挙動シミュレーションに関する基礎研究
2A1-G24 ニューラルネットワークを用いたモジュール型ロボットの制御(マルチエージェント・モジュールロボット)
2A1-C35 五脚歩行ロボットにおけるGAを用いた前進歩容の検討
拡張C4.5システムによる顔画像検索法
2P1-G12 並列処理を用いた価値関数合成による強化学習の効率化
繰り返し囚人のジレンマゲームにおける共進化戦略に関する一考察
10)進化的プログラミング手法に基づく戦略獲得法(ヒューマンインフォメーション研究会)
戦略パッケージ法を用いた競合共進化によるゲーム戦略の獲得
2P1-C05 モバイル端末を用いたロボットインターフェース
対話型遺伝的プログラミングを用いた建築デザインの発想支援システムに関する研究(インタフェース技術と学習支援システム/一般)
対話型遺伝的プログラミングを用いた建築デザインの発想支援システムに関する研究
フォーカルポイントに基づくマルチエージェントの協調行動に関する基礎研究
情報推薦における評価履歴及び相対的評価に基づいた調整型評価手法の検討
F-038 モバイル端末を用いたロボットの学習教示インターフェース作成に関する基礎研究(知能システム,F分野:人工知能・ゲーム)
E-057 学習指導要領に基づいた設問の自動分類タスクにおけるモデルの選択に関する研究(分類,E分野:自然言語・音声・音楽)
I-085 ドロネー三角錐分割にエッジ検出を組み合わせた特徴点群からの3次元復元(画像処理応用,I分野:グラフィクス・画像)
I-015 エッジベース追跡を用いた折り紙作業支援ARシステムの構築(エンタテイメント,I分野:グラフィクス・画像)
H-012 SIFT特徴量の共起を用いた一般物体認識手法に関する基礎研究(一般物体認識,H分野:画像認識・メディア理解)
F-012 合議アルゴリズムにおける適切なプレーヤ重み変更方法の検討(ゲーム情報学,F分野:人工知能・ゲーム)
I-042 環境への適応により3次元構造を獲得する植物自動モデリングに関する研究(コンピュータグラフィクス,I分野:グラフィクス・画像)
A-023 モンテカルロ碁におけるポテンシャルモデルを利用した枝刈りの可能性(数理モデル化と問題解決(2),A分野:モデル・アルゴリズム・プログラミング)
時間的交通分散を目指した旅行計画提示手法の提案
クラスタリングとデマンドバスを用いた大規模通勤システムについての検討
1C2-3 モバイル端末を用いたロボットへの学習教示について(学習システム)
遺伝的アルゴリズムによる植物ホルモンモデルに基づいた植物グラフィックの自動生成
免疫アルゴリズムのnTSPへの適用
M-044 ミクロ交通シミュレーションにおける信号付き交差点の簡略化モデルの提案(M分野:ユビキタス・モバイルコンピューティング,一般論文)
H-054 局所特徴量による同定処理結果を複数組み合わせた局所特徴点マッチング手法の提案(H分野:画像認識・メディア理解,一般論文)

2P1-G12 並列処理を用いた価値関数合成による強化学習の効率化

スポンサーリンク

概要

著者

関連論文

スポンサーリンク