強化学習と最適制御(「システム制御理論の新領域特集号」)

スポンサーリンク

概要

論文の詳細を見る
システム制御情報学会の論文
2001-04-15

著者

森本淳
ATR脳情報研究所
銅谷賢治
(株)国際電気通信基礎技術研究所
森本淳
奈良先端科学技術大学院大学
銅谷賢治
(株)国際電気通信基礎技術研究所;科学技術振興事業団crest
銅谷賢治
奈良先端科学技術大学院大学情報科学研究科:沖縄科学技術研究基盤整備機構
鮫島和行
玉川大学脳科学研究所
鮫島和行
科学技術振興事業団 ERATO川人学習動態脳プロジェクト
鮫島和行
東京農工大学大学院工学研究科

関連論文

モデルフリーとモデルベース戦略の課題依存的な選択(BCI/BMIとその周辺)
自由エネルギーを用いた強化学習による状態のタスク依存な集団符号化(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
自然方策こう配法 : 平均報酬の自然こう配に基づく方策探索(人工知能,認知科学)
強化学習を用いたヒューマノイドロボットによる転倒回避ステップ動作の学習
情動・行動の脳内機構に関するfMRI研究 : うつ病の病態解明に向けて(情動・行動の脳内機序に関する研究の進展)(2004年/第45回日本心身医学総会/北九州)
短-中-長期記憶形成モデルにおける海馬周辺領野のDynamicsについて
強化学習の基礎理論と応用
動作認識における床反力情報の推定と見まね学習への適用(バイオサイバネティックス,ニューロコンピューティング)
経由点表現を用いた強化学習
個性を考慮した周期的全身運動の予測(パターン認識)
変分ベイズ法による自然方策勾配の推定法(一般, 脳・ヒューマンモデリング, 一般)
方策こう配法を用いた動的行動則の獲得 : 2足歩行運動への適用(画像認識,コンピュータビジョン)
動的行動則を用いた2足歩行の獲得(2足歩行ロボット1)
方策勾配法を用いた動的行動則の獲得 : 2足歩行運動への適用(「脳・認知科学」及び一般)
0719 ヒューマノイドとブレイン・マシン・インタフェース(OS41:人間とヒューマノイドの関連を考える)
特集「意図研究のスペクトル」にあたって
歩行・姿勢リハビリテーションのための空電ハイブリッド式外骨格ロボットの提案
脳内報酬情報処理に及ぼす知覚的暖昧性の影響
知覚確率が報酬予測誤差に及ぼす影響
センサフィードバックを用いたCPG制御における環境ダイナミクスと観測の不確定性の影響
線条体における入力タイミングに依存するカルシウム応答モデル
MOSAICモデルにより環境を抽象化する階層型強化学習(バイオサイバネティックス,ニューロコンピューティング)
複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定(バイオサイバネティックス,ニューロコンピューティング)
ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習
遅延を伴う確率的報酬獲得課題におけるヒトの意思決定に関する研究(一般セッション3)
自然 TD 学習 : 割引報酬における TD 誤差を利用する自然方策勾配に基づいた強化学習法
OB-06 ヒトにおける報酬関連脳活動と知覚的曖昧性(日本動物心理学会第68回大会発表要旨)
平均報酬の多様体に基づく方策勾配法
運動学習プリミティブを用いた2足歩行の学習および適応(2足歩行ロボット1)
モデルベース強化学習を用いた2足歩行運動の獲得(2足歩行ロボット1)
神経振動子を用いた2足歩行運動の実験的検討(2足歩行ロボット1)
観測軌道を基にした運動の最適化起立運動, 歩行運動への適用
[招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
[招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得
強化学習と最適制御(「システム制御理論の新領域特集号」)
ロバスト強化学習
強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
強化学習による起き上がり運動パターンの獲得
特集について
学生会員メーリングリスト(RSJ-Forum)
規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用(IBIS2010(情報論的学習理論ワークショップ))
線条体シナプス可塑性の分子機構のシミュレーション研究(セッション3:『バイオモデリング,シミュレーション』)
生化学反応系のためのベイズ的システム同定法(機械学習によるバイオデータマイニング)
生化学反応系のためのベイズ的システム同定法(機械学習によるバイオデータマインニング)
混合カルマンフィルタによる隠れ状態推定法 : Cyber Rodentの自己位置同定への応用
行動学習データの強化学習モデルによる解析とその応用
行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)
行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)
モジュール強化学習と意図(意図研究のスペクトル)
淡蒼球内節/黒質網様部の強化学習による確率的行動選択(一般)(ニューロインフォーマティックスとは何か)
淡蒼球内節/黒質網様部の強化学習による確率的行動選択
大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測
行動決定系列からの学習系の内部状態/パラメータ系列の推定
複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定
強化学習と大脳基底核(運動学習)
複数の予測モデルを用いた強化学習による非線形制御
強化学習MOSAIC : 予測性によるシンボル化と見まね学習
マルチステップ状態予測を用いた強化学習によるドライバモデル
NC2000-48 複数モデルベース強化学習におけるモジュール間の評価割り付け
局所線形モデルに基づく状態分割を用いた階層強化学習
強化学習における適応的状態空間構成法
マルチステップ状態予測を用いた強化学習 : 注視点移動を考慮した自動車運転モデル
ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用(IBIS2010(情報論的学習理論ワークショップ))
床反力情報とモーションキャプチャデータを用いた人間の動作認識
強化学習による自動車運転技能の獲得
強化学習による自動車運転技能の獲得
意思決定と行動学習の数理モデル (特集学習と記憶--基礎と臨床)
モジュール競合による運動パターンのシンボル化と見まね学習
強化学習における分割による自律的状態空間構成法
神経スパイク列からのモデルベースシナプス同定法 (ニューロコンピューティング)
線形ベルマン方程式に基づくロボット制御 : システム同定と指数価値関数近似
ASCONE実施報告
1A1-M09 強化学習を用いたステッピングによる転倒回避動作の学習(人間機械協調)
規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用
ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用
神経スパイク列からのモデルベースシナプス同定法(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
制限付きボルツマンマシンとエコーステートネットワークによる部分観測マルコフ決定問題の解法(一般講演,機械学習によるバイオデータマインニング,一般)
ASCONE06 開催報告
運動-視覚ダイナミクス学習と線形ベルマン方程式によるロボット制御
高次元多重時系列データ解析のための正準多重整列法 (情報論的学習理論と機械学習)
スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用(バイオサイバネティックス,ニューロコンピューティング)
第5回神経情報処理国際会議(ICONIP'98-Kitakyushu)
高次元多重時系列データ解析のための正準多重整列法(時系列解析,統計推理,データベース,一般)

もっと見る閉じる

スポンサーリンク

論文relation | CiNii API
論文
論文著者
博士論文
研究課題
研究者
図書
論文
著者
お問い合わせ
プライバシー