強化学習による所望時空パターンの合成法について
スポンサーリンク
概要
- 論文の詳細を見る
今日において,セルラ・オートマトン(CA)は画像処理,音データ圧縮,現象のシミュレーション等,多岐にわたる用途で用いられている.しかしCAのルールを現象にあわせて設計する事は設計者にとって大きな負担となる.そこで本研究では設計が容易な強化学習によって所望のCAのルール系列を設計する手法を提案する.まず本手法を用いることで,ある初期状態から別の終了状態まで遷移するルール系列を学習によって合成でき,目標の終了状態に到達出来る事を示す.次に初期状態と終了状態のハミング距離に注目し,本手法の解探索性能との関係を詳しく分析する.さらに,自己修復を行うルール系列,自己増殖を行うルール系列を合成する問題にも適用し,本手法の有効性を確認する.
- 2009-12-14
著者
-
中野 秀洋
東京都市大学
-
宮内 新
東京都市大学
-
蜂屋 慶明
東京都市大学
-
宮内 新
東京都市大 大学院工学研究科
-
中野 秀祥
東京都市大学情報工学専攻工学研究科
-
中野 秀洋
東京都市大学知識工学部情報科学科
-
中野 秀洋
東京都市大学知識工学部
関連論文
- カオスニューラルネットワークを用いた無線センサネットワークにおける効率的なフラッディング手法(脳活動の計測と解析,生命現象の非線形性,一般)
- SPSOを用いた無線センサネットワークの長期運用のためのシンクノード配置問題の解法(脳活動の計測と解析,生命現象の非線形性,一般)
- 優先度付き評価に基づく競合型PSOによる複数解探索手法(脳活動の計測と解析,生命現象の非線形性,一般)
- 抑制機構を有するPSOを用いたセンサネットワークにおける特殊中継ノード配置問題の解法(神経ダイナミクス,一般)
- A-1-8 ダイナミック・リコンフィギャラブル技術の音声復号における適用(A-1. 回路とシステム, 基礎・境界)
- A-1-39 ダイナミック・リコンフィギャラブル技術の音声復号における適用(A-1. 回路とシステム)
- 強化学習による所望時空パターンの合成法について (非線形問題)
- D-6-5 マルチスレッドプロセッサに適した値予測機構の提案(D-6.コンピュータシステムA(アーキテクチャ),一般講演)
- ARTを用いた時系列予測におけるシステムの動的変化の検出法
- リング型状態観測法によるマルチエージェント強化学習の高速化(脳活動の計測と解析,生命現象の非線形性,一般)
- 優先度付き評価に基づく競合型PSOによる複数解探索手法(脳活動の計測と解析,生命現象の非線形性,一般)
- リング型状態観測法によるマルチエージェント強化学習の高速化(脳活動の計測と解析,生命現象の非線形性,一般)
- カオスニューラルネットワークを用いた無線センサネットワークにおける効率的なフラッディング手法(脳活動の計測と解析,生命現象の非線形性,一般)
- SPSOを用いた無線センサネットワークの長期運用のためのシンクノード配置問題の解法(脳活動の計測と解析,生命現象の非線形性,一般)
- 進化的アルゴリズムを用いた複数のDynamic Bayesian Networks構造の探索手法について (非線形問題)
- バイナリニューラルネットワークのGAに基づく幾何学的学習法とその汎化能力について(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 実数値GAに基づくバイナリニューラルネットワークの学習アルゴリズムについて(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- 3E-3 カオス的パルス結合ニューラルネットワークによる同期型センサ情報収集機構とその評価(センサネットワーク(2),一般セッション,ネットワーク)
- 6D-2 MANETノード分布の可視化手法とその応用(通信方式(2),一般セッション,ネットワーク)
- MANETノード分布のARTネットワークによる可視化
- カオス的パルス結合ニューラルネットワークによる同期型センシング情報収集機構
- MANETノード分布のARTネットワークによる可視化
- 値予測機構を有するマルチプロセッサに適したスレッド粒度の検討
- 目的関数に基づくトポロジを有する多目的分散遺伝的アルゴリズム
- 遺伝的アルゴリズムを用いたITC符号化プロセッサの開発
- 遺伝的アルゴリズムを用いたITC符号化プロセッサの開発(プロセッサ)
- A-2-15 ツリー構造を有する多目的分散遺伝的アルゴリズム(A-2. 非線形問題,一般セッション)
- 強化学習による所望時空パターンの合成法について
- 強化学習における行動履歴テーブルに基づく状態空間の自律的構成法について
- D-8-10 強化学習によるCAにおけるルールテーブルの同定法(D-8.人工知能と知識処理,一般セッション)
- D-8-9 局所的状態観測と高次元化によるマルチエージェント強化学習の効率化(D-8.人工知能と知識処理,一般セッション)
- A parallel distributed structure learning method of Dynamic Bayesian Networks using discrete particle swarm optimization (ニューロコンピューテイング)
- 行動履歴に基づく動的強化関数を用いたProfit Sharig強化学習法 (ニューロコンピューテイング)
- A parallel distributed structure learning method of Dynamic Bayesian Networks using discrete particle swarm optimization (MEとバイオサイバネティックス)
- 行動履歴に基づく動的強化関数を用いたProfit Sharig強化学習法 (MEとバイオサイバネティックス)
- 進化的アルゴリズムを用いた複数のDynamic Bayesian Networks構造の探索手法について
- A-3-8 値予測機構を有するマルチスレッドプロセッサに適したスレッド割当て方法について(A-3. VLSI設計技術,一般セッション)
- N-26 簡単なCPUを用いたハードウェア教育(情報技術教育,N.教育・人文科学)
- 行動選択確率に基づく動的強化関数を用いた強化学習手法(人工知能,認知科学)
- D-8-30 Profit Sharing に代わるより効率的な強化学習手法
- D-6-1 ターゲットの変更が可能な命令スケジューラに関する研究
- C-12 ターゲットの変更が可能な命令スケジューラに関する研究(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- トレーダの取引行動の遅延を要因として複雑さを生じる市場モデル(知識処理・知識コミュニティ)
- トレーダの取引行動の遅延を要因として複雑さを生じる市場モデル(一般 : マルチエージェントと学習)
- トレーダの取引行動の遅延を要因として複雑さを生じる市場モデル(一般(マルチエージェントと学習))(「社会システムにおける知能」及び一般)
- D-15-1 COMET-II互換プロセッサ上におけるリアルタイムOS演習の為のデバッグ環境の開発(D-15. 教育工学)
- D-11-114 時系列画像を用いた画像状況に適した統合によるオプティカルフロー抽出精度向上
- C-11 分岐履歴を用いた条件付き双方向パスの考察(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-2 アプリケーションプログラムを基にしたプロセッサアーキテクチャの自動生成(FPGA,C.アーキテクチャ・ハードウェア)
- C-1 COMET-II互換プロセッサによるCPU設計演習環境の開発(FPGA,C.アーキテクチャ・ハードウェア)
- B-39 COMET-II互換プロセッサ上におけるITRON仕様OSに関する研究(リアルタイムと分散共有メモリ,B.ソフトウェア)
- B-38 ITRON仕様カーネルのレディキューに関する性能比較(リアルタイムと分散共有メモリ,B.ソフトウェア)
- BNNのGA学習法に関する汎化能力の解析
- カオス的パルス結合ニューラルネットワークによる同期型センシング情報収集機構
- D-18-1 GALS型システムのFPGAへの実装について(D-18.リコンフィギャラブルシステム,一般講演)
- 行動履歴に基づく動的強化関数を用いたProfit Sharing強化学習法
- 行動履歴に基づく動的強化関数を用いたProfit Sharing強化学習法
- 離散Particle Swarm Optimizationを用いたDynamic Bayesian Networksの並列分散構造学習法
- 離散Particle Swarm Optimizationを用いたDynamic Bayesian Networksの並列分散構造学習法
- 多ビット出力Binary Neural Networksの学習アルゴリズムと認識器への応用
- 離散型振動発火ニューロンを用いた無線センサネットワークにおける情報収集機構 (ニューロコンピューティング)
- 報酬分配エージェントを用いた動的経路探索手法
- 競合型粒子群最適化に基づく無線センサネットワークにおけるフォワーディングノード選択手法の性能評価
- 複数許容解の記憶と交換子に基づくアントコロニー最適化
- 局所情報をもつスパイキングニューラルネットワークを用いた無線センサネットワークにおける情報収集機構 (ニューロコンピューティング)
- マルチエージェント学習に基づくモバイルアドホックネットワークにおけるルーティングアルゴリズム (ニューロコンピューティング)
- 離散型振動発火ニューロンを用いた無線センサネットワークにおける情報収集機構
- 競合型粒子群最適化に基づく無線センサネットワークにおけるフォワーディングノード選択手法の性能評価
- 報酬分配エージェントを用いた動的経路探索手法
- A-034 継続的解探索のための拡散型粒子群最適化(問題解決手法,A分野:モデル・アルゴリズム・プログラミング)
- C-017 資源制約を考慮したマルチプロセッサシステムの自動生成(LSI システムと設計技術,C分野:ハードウェア・アーキテクチャ)
- C-008 H.264動画像処理に適したプロセッサシステムの設計(コンピュータシステム応用,C分野:ハードウェア・アーキテクチャ)
- A-033 人工蜂コロニー最適化を用いたDynamic Bayesian Networkの構造学習法(問題解決手法,A分野:モデル・アルゴリズム・プログラミング)
- C-029 ダイナミック・リコンフィギュラブル技術を用いたハフ変換回路の設計(ディペンダブルシステム,C分野:ハードウェア・アーキテクチャ)
- 局所情報をもつスパイキングニューラルネットワークを用いた無線センサネットワークにおける情報収集機構(ニューロコンピューティングの実装及び人間科学のための解析・モデル化,一般)
- マルチエージェント学習に基づくモバイルアドホックネットワークにおけるルーティングアルゴリズム(ニューロコンピューティングの実装及び人間科学のための解析・モデル化,一般)
- バッファの動的制御機構を有する仮想出力キューイング方式オンチップルータ
- 高次元最適化問題のための部分更新PSO
- 動的最適化問題のための改良型人工蜂コロニー最適化
- 離散PSOを用いたクラスターツリー型ZigBeeネットワークにおけるルータ配置手法
- 間欠的な不応性を有する離散PSOの基本性能
- I-011 MPEGビデオストリームからの移動物体に対する高速なエッジ検出(I分野:グラフィクス・画像,一般論文)
- A-025 レジスタ割り当てにおけるメモリ転送及びレジスタ間転送の削減手法(A分野:モデル・アルゴリズム・プログラミング,一般論文)
- C-006 資源利用率に基づく連想度可変キャッシュメモリ(C分野:ハードウェア・アーキテクチャ,一般論文)
- G-013 離散PSOを用いた動的ニューラルネットワークの学習法(G分野:生体情報科学)