複数制御器の切り換えを行う強化学習アーキテクチャによるドライバモデル
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,ある制御対象において連続値出力を行う複数の制御器が存在するときに,それらの切り換えと制御出力を学習する強化学習アーキテクチャを提案する.制御器切り換えの学習にはQ-learningを用い,制御出力はActor-Criticで獲得する.そして,このアーキテクチャを自動車の速度・車間距離制御タスクに適用し,シミュレーション実験を行った結果について述べる.実験では車両二台による追従走行を想定する.このタスクにはアクセルペダルとブレーキペダルの選択及びペダル踏み込み量を決定するという問題が含まれている.実験の結果より,前方を走行する先行車の速度変化に応じて,学習を行う追従車はペダル選択と操作量を決定し,追突することなく走行できることを確認した.また,この制御方式では複数強化学習器の切り換えを実現したが,この切り換えの効果を単一のActor-Criticモデルと比較し考察する.さらに,提案アーキテクチャで獲得した行動の運転特性が人間による運転と類似していることを示す.
- 2002-12-06
著者
-
小池 康晴
科学技術振興事業団さきがけ21,東京工業大学精密工学研究所
-
小池 康晴
科技構crest:東京工業大学
-
折田 敦
東京工業大学大学院総合理工学研究科知能システム科学
-
小池 康晴
東京工業大学
関連論文
- HMMを用いた筋電信号からの運動プリミティブ抽出(情報論的学習理論論文)
- 筋電信号を用いて解析する腕の運動制御機構
- 筋肉骨格系に基づく人腕の順動力学モデル
- 強化学習に基づく人腕の筋骨格系順動力学シミュレーションモデル
- 強化学習に基づく入腕の筋骨格系順動力学シミュレーションモデル
- 強化学習とフィードバック誤差学習を用いた腕の姿勢制御
- 強化学習とフィードバック誤差学習を用いた腕の姿勢制御(NC一般セッション(3))(認識と学習,模倣学習)
- 筋骨格順動力学モデルに基づく筋電信号からの関節トルクの生成
- 筋骨格順動力学モデルに基づく筋電信号からの関節トルクの生成(画像技術・視覚・その他一般)
- 筋肉骨格データに基づく人腕の順動力学モデル(視覚と画質および一般)
- 筋肉骨格データに基づく人腕の順動力学モデル
- 筋骨格系の平衡位置を考慮したパワーアシストシステムに関する研究
- 生体信号処理とその応用(特別講演,生体信号の計測と解析,一般)
- 筋電信号を用いた指関節角度推定(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 筋活動の知覚とトレーニングシステムに関する研究
- 人間の視線を模擬したモデルを持つリアクティブバーチャルヒューマンの構築(セッション1)
- 錯覚する脳
- 領域グラフの尺度空間解析による顔検出に関する研究
- 擬似触覚を利用した重みのコミュニケーションのためのビジュアルインタラクションデザイン
- 表面筋電に基づく肩周囲筋トルクベクトル方向の推定方法
- 表面筋電と手先力に基づく肩周囲筋トルクベクトル方向の推定
- 介助者モデルを用いたパワーアシスト法の提案
- 独立成分分析により分解された表面筋電信号を用いた指の姿勢推定
- 物理シミュレータ上での力覚提示のための局所的な動力学計算を行う力覚レンダリング(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 物体の重さ比較時の知覚に関する研究
- 視覚と筋へのフィードバック情報を用いた運動支援技術に関する研究
- ガラス細工メタファーによる自由形状モデリング手法の提案
- 落下物体受取り動作における加速度学習モデルの提案
- 両手多指操作デバイスSPIDAR-8の作業操作性について
- 都市風環境評価のための仮想傘の開発に関する研究
- 等身大仮想環境のためのハプティック機能をもつ操作デバイスの開発 : 仮想傘のための提案とその開発
- 筋電信号を介したBrain Machine Interface(「手」及びヒューマン情報処理一般)
- 複数の加速度環境でのボールキャッチングタスクにおけるタイミング予測(脳・ヒューマンモデリング2, 脳・ヒューマンモデリング, 一般)
- 把持操作中における物体の重さの知覚に関する研究
- トルク・スティフネス情報を用いた筋電信号インタフェースによる多自由度操作システムの提案
- 強化学習とフィードバック誤差学習を用いた腕の姿勢制御(バイオサイバネティックス,ニューロコンピューティング)
- 強化学習とフィードバック誤差学習を用いた腕の姿勢制御(NC一般セッション(3))(認識と学習,模倣学習)
- 複数制御器の切り換えを行う強化学習アーキテクチャによるドライバモデル
- 筋骨格順動力学モデルに基づく筋電信号からの関節トルクの生成
- ヒューマンインタフェースのための NIRS の研究
- 安定性と忠実性を両立させる高解像度力覚レンダリングの開発(バーチャルリアリティ,インタラクション技術の原理と応用)
- 局所的な動力学計算を行う力覚レンダリング
- 局所的な動力学計算を行う力覚レンダリング
- 局所的な動力学計算を行う力覚レンダリング(人工現実感)
- 高解像度力覚インタフェースをもつ物理ベースVRシステムの開発(画像処理・ヒューマンインタフェース, システム開発論文)
- 力覚提示を伴う仮想物体の両手多指操作環境の開発
- 関節球整合法による手形状モデルのレジストレーション
- 4+4本指のための力覚提示装置を用いた直接操作環境の構築
- フレッシュパーソン9-6 SPIDARを用いた指先の位置測定による3次元手形状推定
- A-16-4 画像合成のためのSPIDARを用いた3次元仮想手の構成
- 車両制御時におけるステアリング操作の学習と視線の変化
- 強化学習による自動車運転技能の獲得
- 6自由度ワイヤ駆動型力覚ディスプレイ : 提示力に対する評価
- 「手」探り研究委員会
- 力覚提示装置を用いた多指による物体操作のための把持力と外力の提示方法
- 視覚障害者のための可触化システムの提案
- 視覚障害者のための可触化システムの提案
- A-16-30 力覚提示装置SPIDARによる可触化システムの開発
- 筋肉骨格系の数式モデルによる腕のスティフネスの推定(バイオサイバネティックス,ニューロコンピューティング)
- 筋電信号を用いた手首関節のモデル化に関する研究
- 表面筋電信号を用いた腕の姿勢推定
- 表面筋電信号を用いた腕の姿勢推定
- 物理シミュレーションによるバーチャルヒューマンの運動制御
- 物理シミュレーションによるバーチャルヒューマンの運動制御
- 物理シミュレーションによるバーチャルヒューマンの運動制御(人工現実感)
- 等身大視点と鳥瞰視点を組み合わせたインタラクティブな都市空間評価システム
- 力覚クオリティ向上を目指した高解像度ハプティックコントローラの提案(VR,ヒューマンファクタ,一般)
- 力覚クオリティ向上を目指した高解像度ハプティックコントローラの提案(VR,ヒューマンファクタ,一般)
- 力覚提示機能を備えたリアクティブモーションキャプチャシステムの構築(ヒューマンインフォメーション)
- 筋肉骨格系の数式モデルによる腕のスティフネスの推定
- Load-on-Taskにおける腕の運動制御に関する研究
- 筋の活動度とSpeed-Accuracy Trade-off(バイオサイバネティックス,ニューロコンピューティング)
- ガラス細工メタファーによる自由形状モデリング手法の提案
- MVE2000-33 ガラス細工メタファーによる自由形状モデリング手法の提案
- ガラス細工メタファーによる自由形状モデリング
- 多自由度デバイスによる自由形状モデリングに関する研究 : ガラス細工メタファーによる自由形状モデリング
- 画像パターン識別のための新しいパラメータ推定空間の提案
- 色フィルタとテクスチャ解析を用いた緑色道路標識の抽出(ITS(高度交通情報システム)のための映像情報メディア技術)
- 物理法則に基づいた力覚VR環境構築ソフトウェアの開発
- 色フィルタとテクスチャ解析を用いた動画像からの道路標識の抽出
- 12-4 動画像からの道路標識の抽出方法
- 感覚情報を用いた書道における教示効果
- ヴァイオリン演奏時の把持力推定に関する研究
- 運動野の神経活動からの腕の運動予測(「脳・認知科学」及び一般)
- 力覚提示機能を備えたリアクティブモーションキャプチャシステムの開発
- 力覚提示機能を備えたリアクティブモーションキャプチャシステムの開発
- 力覚提示機能を備えたリアクティブモーションキャプチャシステムの開発(人工現実感)(マルチメディア・仮想環境基礎)
- 脳を読む技術の工学応用
- 脳を読む技術の工学応用
- 準教師有学習を用いたBCIのためのEEGのオンラインクラスタリング
- キャッチング作業における人間の接触タイミング予測モデルに関する研究(バイオサイバネティックス, ニューロコンピューティング)
- マルチモーダルな没入型等身大仮想環境の提案
- 足踏みによる没入型仮想環境のための移動インタフェースの開発
- 力覚提示を伴う等身大仮想環境における空間探索行動の分析
- MVE2000-34 力覚提示を伴う等身大仮想環境における空間探索行動の分析
- 力覚インタラクションのための多面体の接触体積に基づく実時間剛体運動シミュレーション
- (6)次世代ヒューマンインタフェース : Brain Machine Interface(招待講演1)
- SPIDARを用いた size-weight illusion の検証
- SPIDARを用いたsize-weight illusionの検証(「手」と脳とVR空間)
- 信号源推定を用いた脳波から筋活動信号の再構築(BCI/BMIとその周辺,一般)