強化学習と教師あり学習を組み合わせたプリズム適応のモデル
スポンサーリンク
概要
- 論文の詳細を見る
プリズム適応時の被験者の振舞いを説明するため, 教師あり学習と強化学習を組み合わせた学習モデルを提案する. 本モデルは, 到達運動の正確さを報酬として強化学習を行なう運動計画モジュールが, 教師あり学習によって運動の順モデルを獲得する内部モデルモジュールを利用して適切な運動指令を選択する. また, 運動結果と内部モデルに基づく予測を比較することにより, 内部モデルの信頼度を推定するとともに文脈の切替えを行なう. これにより, ゆっくりとした環境の変化に追随するとともに, 複数の異なる環境における動作を切り替える性質を実現している. 数値実験により提案したモデルの振舞いを検証したほか, 他のモジュール型学習モデルとの違いについて考察した.
- 2001-03-16
著者
関連論文
- お手玉の運動制御における視覚情報の役割(2)
- お手玉の運動制御における視覚情報の役割
- 手操作運動に関わるサルAIP野神経活動の情報量解析
- 手操作運動課題におけるサルAIP野ニューロンの情報量解析(スパイク信号の統計解析、一般)
- 単一ニューロンのスパイク統計解析 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 手操作運動中のサルF5-AIP野神経活動の情報量解析(BCI/BMIとその周辺,一般)
- 感覚運動統合システムにおけるダイナミックス整合の適応的獲得(バイオサイバネティックス,ニューロコンピューティング)
- ダイナミクス整合にもとづく感覚運動統合 : ターゲットトラッキングにおける戦略の学習
- V1野細胞の受容野と視差選択性細胞に関する計算論的考察
- 誤差フィードバックのタイミングが視覚運動変換の適応に与える影響 : 仮想投てき課題を用いた運動終了と課題終了の分離
- 投擲運動のプリズム適応における視覚情報の効果 : 投擲物の視覚情報が適応に与える影響
- 自動車加速時におけるアクセル操作の習熟過程のモデル化と実験的検討
- 里山活動に触れて
- 即時フィリングインについて(日本基礎心理学会第24回大会,大会発表要旨)
- 即時フィリングインにおける消失物体の視覚特性変化 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第13回「Sensing and Perception」)
- ディレクタからみたサマースクール
- 動的錯視現象と新しい型の視覚効果
- 動的錯視現象と新しい型の視覚効果
- ステレオビジョンにおける非対応領域の処理手法の検討
- 連続運動制御課題における間欠運動プランニング (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 低い時間解像度の運動指令がもたらす手先軌道の性質 : 運動指令表現の単純化仮説(バイオサイバネティックス,ニューロコンピューティング)
- 打撃動作における関節スティフネスの能動的な調節
- 骨格筋モデルに基づく到達運動制御メカニズムの考察
- 技能獲得過程の計算モデル
- 学習曲線の時間変化に着目した自己組織的強化学習アルゴリズム(2)
- 運動の安定化に関する一考察
- 強化学習と教師あり学習を組み合わせたプリズム適応のモデル
- 音の立ち上がりのずれが音源分離に与える影響
- アルファ波の同期現象 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- パルス型神経細胞モデルに基づくsignal dependent noise生成機構の検討(バイオサイバネティックス,ニューロコンピューティング)
- 生体ノイズ特性に基づく終点分散最小規範の再検討(バイオサイバネティックス,ニューロコンピューティング)
- 運動指令の最適性に関する一考察 : タスク最適化とスパース表現
- 感覚運動系におけるスパース表現 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- ヘッドホン受聴による3次元マルチチャンネル音響再生の最適化--付加する残響特性の実験的検討 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- パルス型細胞モデルに基づくsignal dependent noise発生機構の検討
- 身体の動きを音にする (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- ウェアラブルセンサを用いた姿勢計測システム (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 投擲運動のプリズム適応における視覚情報の効果 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 運動指令の疎表現と運動計画二関節非線形腕による到達運動への適用
- 注意の動きに注目した図地反転知覚のモデル
- 注意の動きに着目した図地反転知覚のモデル
- 随意運動における運動指令パタンの創発
- 多点眼電位に基づく視線角度計測法 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 線描画によるスケッチ独習システムの提案 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 視覚フィードバックの有無による運動計画の違い (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 感覚運動適応過程における運動のばらつきの変化--ゲームパッドを用いた行動実験 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 求心路の可逆的遮断のための新しい冷却方式の提案 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第15回「Sensing and Perception」)
- 投擲運動におけるプリズム適応 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 視覚運動変換の適応ゲインは運動終了と課題終了の二つの誤差フィードバックタイミングにおいて異なるピークをとる
- 前頭部と後頭部で計測されるα帯域脳波の関係
- D-12-118 手書きスケッチの評価に向けた頂点情報取得法の検討(D-12.パターン認識・メディア理解,一般講演)
- 足音による個人識別に関する研究 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 運動指令のスパース表現と運動計画 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- ヘッドホンによる3次元音響再生 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 眼電位に基づく視線計測システム (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 手描きスケッチの評価に向けた頂点情報検出法 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第14回「Sensing and Perception」)
- 多変量単位四元数のための因子分析モデル
- ステレオビジョンにおける非対応領域の処理手法の検討
- コミュニケーションにおける脳波同調 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第16回「Sensing and Perception」)
- 感覚フィードバックの可逆的遮断に関する研究 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第16回「Sensing and Perception」)
- 視覚情報の制約が運動計画に与える影響 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第16回「Sensing and Perception」)
- 身体の協調構造についての展望 (電気通信大学 IS(大学院情報システム学研究科)シンポジウム 第16回「Sensing and Perception」)
- 視覚運動変換におけるランプ型適応とステップ型適応の違い
- 床反力情報に基づく装着型ロボットによる起立補助
- 準備動作の違いによる左右踏み出し運動の識別 : 全身運動の時間的構造に基づく行動の先読みに向けて
- 打ち下ろし動作における最適運動パタンの探索
- 目標追従運動の間欠的制御モデル
- ヒトの予測的な運動制御における視覚情報の効果
- 環境変化への適応と文脈切替え
- 強化学習を用いた能動的認識の自己組織化モデル
- 高速フリッカ連続提示による瞬き知覚(日本基礎心理学会第31回大会,大会発表要旨)
- 6. 前頭部Fp1とFp2から導出されるα帯域脳波の位相差をフィードバック制御して自律訓練法の学習効率を向上させる方法について(一般演題,第40回日本バイオフィードバック学術総会抄録集)
- 高速フリッカ刺激の経時提示により生じる瞬き知覚は刺激間の輝度差に依存する(「マルチモーダル」,「感性情報処理」,「視知覚とその応用」及びヒューマン情報処理一般)
- ウェーブレッド解析を用いた運動間欠性の抽出手法の開発
- モデル予測制御に基づくヒトの目標追従運動の間欠的制御モデル
- 身体運動の協調構造を利用した到達運動の先読みシステム
- 打ち下ろし動作における最適運動パタンの探索
- 床反力情報に基づく装着型ロボットによる起立補助