ファジィARTニューラルネットワークによる強化学習のための状態空間の構成法
スポンサーリンク
概要
- 論文の詳細を見る
強化学習のエージェントに対して連続的な知覚入力が与えられる場合、状態空間の分割を行う必要がある。状態空間の構成はエージェントのタスク達成に大きな影響を与えるため、非常に重要な課題である。最近、適応共鳴理論(ART)ニューラルネットワークを用いて、この命題に取り組む研究がなされている。ところが、これらの研究の多くはARTを知覚入力に対する分類器として単純に使用しているだけである。そこで本研究では、強化学習の学習状況として価値関数の変化に着目し、それをARTの合成に利用することで、ARTによる強化学習のための状態空間の構成を試みる。
- 2004-03-12
著者
関連論文
- 単電子トンネリング・デバイスを用いた帯域通過ディジタル・ウェーヴ・フィルタ
- 単電子トンネリング・デバイスを用いた帯域通過ディジタル・ウェーヴ・フィルタ
- マイクロ波帯LN光変調器の高周波化・高感度化のための最適な電極構造の検討(レーザ・量子エレクトロニクス)
- マイクロ波帯LN光変調器の高周波化・高感度化を図るための最適な電極構造の検討(RCS:無線回路,無題QoS,無線リソース制御,アドホックネットワーク,信号処理,無線通信一般)
- イジングスピングラスを用いた低信頼性ナノスケール論理回路の誤り訂正
- Power consumption for coherent optical orthogonal frequency division multiplexing with punctured LDPC codes and variable amplitude block codes (ワイドバンドシステム)
- B-8-21 Time-Frequency Interferometry for OFDM
- 強化学習による避航進路の決定
- 強化学習による多船航路探索法(生命現象,一般)
- 船舶航路決定と強化学習アルゴリズム
- 船舶航路決定のための強化学習アルゴリズムについて
- 潮流の影響を考慮した操船運動の強化学習について
- ARTMAPのための反教師あり学習法(生命現象,一般)
- 反応拡散現象を模擬するセルラーアレイが生成する2値系列のランダム性
- 10GHz帯集中定数型LN光変調器実現に向けての検討(レーザ・量子エレクトロニクス)
- 離散ウォルシュ変換を適用した連想記憶SINNの能力検証
- テンプレートライブラリをもつセルラーニューラルネットワークによる連想記憶システム
- 量子化MLPとSINNから構成される連想メモリのためのノイズ付加学習法
- 多層パーセプトロンとスパース結合ニューラルネットワークによる連想メモリのためのノイズ付加学習法
- 再帰的多層パーセプトロンとスパース結合ニューラルネットワークによる自己連想記憶システム
- 3値荷重MLPとSINNから構成されるハイブリッド連想記憶システム
- 荷重更新における量子化判定レベルを制御したLOGic-Oriented Back Propagationアルゴリズム
- LOGic-Oriented Back Propagationアルゴリズム
- バンドパスシグマデルタ領域ディジタルウェーヴフィルタ(一般)
- バンドパスシグマデルタ領域ディジタルウェーヴフィルタ(一般)
- ソーティングを基にしたシグマ・デルタ領域指数・対数回路
- 強度のノイズ環境下におけるFuzzy ARTMAPの学習法
- Fuzzy ARTMAPにおけるカテゴリの統合
- 単電子リングオシレータの結合による位相雑音の低減(ポスターセッション)
- 単電子リングオシレータの結合による位相雑音の低減(ポスターセッション)
- 先見的知識を導入したマルチエージェント強化学習による船舶航路探索
- B-8-12 HTRCI-MIMO/OFDMにおけるチャネル変動量推定に基づいた高速フェージング補正(B-8.通信方式,一般セッション)
- B-8-13 チャネルランキングを用いた信号検波によるゼロフォーシングの性能強化(B-8.通信方式,一般セッション)
- B-8-14 HTRCI-MIMO/OFDMにおける超遅延波に対するISIとICIの補償(B-8.通信方式,一般セッション)
- 離散時間区分線形表現による遅延ロックループの定常位相誤差解析(生命現象,一般)
- 多重接続干渉が生起する遅延ロックループの確率共鳴 : シミュレーションによる一観察結果(カオスの通信への応用,局在振動,一般)
- 2値マルコフ系列を生成するセルラーアレイの偏差分方程式に関する考察(カオスの通信への応用,局在振動,一般)
- 量子化器の過負荷が考慮された2次デルタシグマ変調回路が生成する信号系列の解析
- ファジィARTMAPにおけるガテゴリの拡大と縮小に関する一考察
- 2次デルタ・シグマ変調器の解析と交流信号計測への応用
- マイクロ波帯LN光変調器の高周波化・高感度化を図るための最適な電極構造の検討(RCS:無線回路,無題QoS,無線リソース制御,アドホックネットワーク,信号処理,無線通信一般)
- ARTニューラルネットワークによる強化学習のための状態生成器の改良
- 適応的な状態空間分割を考慮した強化学習による操船経路決定
- ファジィARTニューラルネットワークによる強化学習のための状態空間の構成法
- 強化学習に基づく操船経路の決定について
- ストカスティック・コンピューティングへのスペクトル変換の導入
- ストカスティック・コンピューティングへのスペクトル変換の導入
- A-1-4 結合線路型2値量子化ディジタルフィルタ(A-1. 回路とシステム, 基礎・境界)
- NLP2000-20 / NC2000-14 時系列の連想記憶を行うデジタル結合振動系の一構成法
- 拡散系を模擬するセルラーアレイを用いた擬似2値マルコフ系列の並列生成法
- 非同期符号分割多重通信における同期追従回路の統計的解析法
- 準同期符号分割多重通信における同期追従回路の統計的解析法
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(II)
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(I)
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(I)
- B-8-22 ディジタルΔΣ変調器を用いた擬似ランダム系列の生成(B-8. 通信方式,一般セッション)
- B-8-20 パスセレクションを基にしたチャネル識別によるTFI-OFDMの性能改善(B-8. 通信方式,一般セッション)
- B-8-19 TFI-OFDMにおける超遅延波に対するISIとICIの補償(B-8. 通信方式,一般セッション)
- B-8-18 TFI-OFDMにおける直接判定と線形予測に基づいた高速フェージング補正(B-8. 通信方式,一般セッション)
- マルチレベル・デルタシグマ変調信号の直接演算回路(通信システム・非線形回路とシステム及び一般)
- ノイズ環境下における結合双安定回路の平衡点間遷移現象
- 自己組織化マップと階層型ニューラルネットワークによる顔画像認識
- NLP2000-20 / NC2000-14 時系列の連想記憶を行うデジタル結合振動系の一構成法
- B-8-34 TFI-MUDiv/OFDMAにおける低精度ブロック選択を用いた計算量削減法(B-8.通信方式,一般セッション)
- 全結合確率ネットワーク表現によるディレイロックループの解析
- 単一磁束量子回路を用いたバンドパスシグマデルタ領域ディジタルウェーヴフィルタ(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 単一磁束量子回路を用いたバンドパスシグマデルタ領域ディジタルウェーヴフィルタ(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 単一磁束量子回路を用いたバンドパスシグマデルタ領域ディジタルウェーヴフィルタ(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- マッチトラッキングの制御によるファジィARTMAPの性能向上
- AS-2-3 単電子トンネリングデバイスを用いたノイズシェーピングとデルタシグマ領域の演算回路(AS-2. 非線形回路の新展開,シンポジウムセッション)
- 白色雑音と非白色多重アクセス干渉下における高階型ディレイロックループの解析
- 不完全な位相検出器を持つ結合同期回路のノイズ環境下における応答 : 周期ポテンシャル系の確率共鳴現象
- 全結合および最近接結合単電子リングオシレータの解析
- 地上ディジタル放送の遅延プロファイル測定において遅延時間がサンプリング間隔の非整数時に生じる誤差の検討と対策(デジタル放送技術および一般)
- A-2-16 陽・陰荷重をもつFuzzy ARTMAPの性能評価(A-2.非線形問題,一般講演)
- タスクの複雑さを考慮した適応共鳴理論に基づく教師あり学習法
- 結合同期回路における確率共鳴現象(非線形問題)
- A-1-7 ソーティング・ネットワークを用いた2値量子化ウェーブフィルタ(A-1.回路とシステム,一般講演)
- 1Δ型遅延ロックループの動作に見られる符号依存性の解析
- ARTMAPに対する隠れ記憶の導入
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(II)
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(I)
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(II)
- ソーティング・ネットワークを応用したマルチレベル・シグマデルタ変調信号用演算回路(I)
- 2値量子化された熱層上で決定論的に発展する動的イジングモデル
- 2値量子化擬似拡散アレイが生成する時系列の相関特性
- マルチレベル・デルタシグマ変調信号の直接演算回路(通信システム・非線形回路とシステム及び一般)
- シグマ・デルタ領域ナノ・エレクトロニック信号処理回路の確率論的解析(システム制御情報における確率論の先端応用)
- 拡散反応現象を模擬するセルラーアレイが生成する擬似乱数の評価
- 確率ネットワークモデルを用いたマルチパス環境CDMA通信におけるディレイロックループの解析
- PSOにおける収束粒子の多様な再初期化に関する検討
- 地上デジタル放送の遅延プロファイル測定において遅延時間がサンプリング間隔の整数倍でない場合に生じる誤差とその対策
- WF/PA-SC-FDMAを用いた多重リレー協調通信における最適分割送信(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- WF/PA-SC-FDMAを用いた多重リレー協調通信における最適分割送信(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- WF/PA-SC-FDMAを用いた多重リレー協調通信における最適分割送信(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 遅延プロファイル測定において遅延時間がサンプリング間隔の非整数時に生じる誤差の検討と対策(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 遅延プロファイル測定において遅延時間がサンプリング間隔の非整数時に生じる誤差の検討と対策(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 遅延プロファイル測定において遅延時間がサンプリング間隔の非整数時に生じる誤差の検討と対策(ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 10GHz帯集中定数型LN光変調器の試作(レーザ・量子エレクトロニクス)
- 確率ネットワークモデルを用いたマルチパス環境CDMA通信におけるディレイロックループの解析