Q-Learning Focusing on Partial States and Reducing Amount of Memory of Tracking Problems
スポンサーリンク
概要
- 論文の詳細を見る
Recently, application of a multi agent system is expected from the viewpoint of the parallel and distributed processing of systems. Reinforcement learning attracts attention as an implementing method of the multi agent systems. However, there is a problem that the more the number of agents to deal with increases, the slower the speed of learning becomes. To solve this problem, we propose a new reinforcement learning that can learn quickly and reduce the amount of memory. It tries to increase efficiency of the learning on a tracking problem by using a method paying attention to partial states of two agents among a large number of agents.
- システム制御情報学会の論文
著者
関連論文
- デイトレードエージェントフレームワークを用いた遺伝的プログラミングによる投資戦略の進化
- 情報リサイクルのための文書の書き込み解析
- 複比とハッシュに基づく文書画像検索(文書・文字メディアの認識・理解, 一般)
- D-5-2 画像検索のための視覚化インタラクティブ・モジュール(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-5-1 語の共起の統計情報を用いた画像と説明文の対応付け(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-12-63 デジタルカメラを用いた文書画像検索の一手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-62 デジタルカメラを用いた文書画像からの書き込み抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- 文字の2次元出現密度分布に基づく文書画像の関連部分検索
- サポートベクトルマシンを用いた新聞記事からのプロフィール情報抽出
- グラフィカルなモデルエディタを用いたマルチエージェントシミュレータ開発手法
- 熱力学的遺伝アルゴリズムによる動的環境への適応
- 熱力学的遺伝アルゴリズムによる多目的最適化
- 時間遅れニューラルネットワークを用いた視聴覚融合音声認識
- ガーベジHMMを用した音声スイッチ
- 進化技術ハンドブック基礎編, 電気学会進化技術応用調査専門委員会 編, 川上浩司 編集責任, 出版社 近代科学社,発 行2010年1月, 全ページ 256ページ, 価格 7,350円, ISBN978-4-7649-0385-2
- 隣接グラフを用いた欧文文書画像からの文字列抽出 (画像の認識・理解)
- D-12-15 弛緩法に基づく文書画像のレイアウト解析
- 一般図形ボロノイ図に基づく文書画像からの文字列抽出
- Webサービスを用いた電力取引システムに対するネットワークモデルの設計
- 効率的な需給均衡を目的とした協調取引システムモデルの構築
- システムのディペンダビリティ向上へのアプローチ
- 情報システム構築に関する課題と将来動向(企業情報システムの過去・現在・未来特集号)
- 複比とハッシュに基づく文書画像検索(文書・文字メディアの認識・理解, 一般)
- 仮想先物市場 U-Mart システムの設計とエージェント・プログラミング教育
- 窓関数を用いた部分テキスト検索 -固定長法と出現密度法の比較-
- 窓関数を用いた部分テキスト検索 : ベクトル空間法と出現密度法の比較
- 単語の出現密度分布と偏出度を用いた図表と説明テキストの対応付け
- 単語の出現密度分布を用いた図表と説明テキストの対応付け
- 効用関数に基づくインタラクティブDSMに関する基礎検討
- エージェントの相互依存関係を用いた適応型高信頼性システム
- 文書画像に対する質問応答システムIQAS(文字とドキュメントの認識・理解)
- 文書画像に対する質問応答システムIQAS(文字とドキュメントの認識・理解)
- サポートベクトルマシンを用いたプロフィール情報の抽出(抽出(1))
- 文字の2次元出現密度分布に基づく文書画像の部分検索
- 文字の2次元出現密度分布に基づく文書画像の部分検索
- キーワード出現密度分布に基づく文書画像の部分検索
- 印刷文書の背景領域への大量データの埋め込みと復元
- 特徴ベクトルの出現密度分布に基づく印刷文書画像の部分検索
- 印刷文書への大量データの埋め込みと取り出し
- 参照重要度に基づくWWW検索
- HTMLファイルからのトピック抽出に基づく興味推定とWWW検索
- 3U-7 レイアウト情報に基づく複数のトピックを含むHTMLファイルの分割
- 1U-10 出現密度分布を用いた図表付き抄録の自動作成
- D-5-5 例示部分に対する関連部分抽出のための文書検索法
- HTMLファイル分割に基づくユーザの興味の把握とWWW検索
- 図表と説明テキストの対応付けを利用した重要図表抽出
- 概念図と説明テキストの対応付け
- 背景の階層構造に着目したカラー文書画像のレイアウト解析
- 熱力学的選択ルールを用いた巡回セールスマン問題の遺伝的解法
- 遺伝的プログラミングにおける多様性評価手法と個体表現の簡約化
- 編集の狙い
- 環境同定型遺伝アルゴリズムによる動的環境への適応
- 動的ゲーム環境におけるルールと個体の共進化
- 記憶機構を導入した熱力学的遺伝アルゴリズムによる動的環境への適応
- 熱力学的遺伝アルゴリズムによる動的環境への適応
- 熱力学的遺伝アルゴリズムを用いた動的環境下での最適化計算-II
- 電力系統制御における信頼性技術 (システムの信頼性工学と安全性特集号)
- 人工無脳を用いた学習支援システムの構築(スキルの分析・教育・学習と支援環境/一般)
- 複数銘柄および複数市場に対応した U-Mart システムの開発
- 第56期会長就任にあたり
- モデル駆動開発手法の経営情報システム構築への適用
- ユーザ嗜好に基づくクラウドサービス連携支援システム
- システム制御情報学会-計測自動制御学会連携活動 : 関西地区若手研究発表会2012活動報告
- 年頭のご挨拶
- Q-Learning Focusing on Partial States and Reducing Amount of Memory of Tracking Problems
- 2B1-5 タマホコリカビ型遺伝的アルゴリズムによる最適化の研究(OS7:エージェントの学習・進化)
- 追跡問題における状態数とメモリ量の削減に着目したQ学習