Actor-Qアーキテクチャに基づく能動認識学習システム
スポンサーリンク
概要
- 論文の詳細を見る
Q-learningとActor-CriticアーキテクチャのActorを組み合わせたActor-Qアーキテクチャとそれを用いた能動認識学習システムを提案する.Actor-Qアーキテクチャは, システムの出力を, 離散的な意思である「行動」と連続値である「動作」に区別し, まず, Q値を用いて「行動」を決定し, その「行動」が「動作」を伴う場合には, 更に, 該当するActorの出力に従って「動作」を行う.そして, Q値は, Q-learningで学習し, Actorは, その「行動」に対応するQ値をCriticの出力として学習を行う.ここでは, センサの移動及び各パターンであるという認識の結論を下すことを行動とし, それぞれにQ値を割り当てる.そして, センサの移動が選択された際は, Actorの出力に従ってセンサを移動する.認識が選択された場合は, 対応するパターンであるという認識結果を出力し, 正解不正解を表す強化信号によって該当するQ値を学習する.Q値計算部及びActorはともにニューラルネットで構成し, 視覚センサ信号を入力とする.これによって, 従来の能動認識学習システムの問題点, (1)認識に対する評価値の極大値にセンサがトラップされること, (2)各時間ステップごとに認識出力を評価し, 連続値の強化信号を与える必要があること, (3)認識結果を出力するタイミングをシステム自身で判断できないの三つを解決することができる.そして, 不均一なセンサセルをもつ視覚センサを用いたシミュレーションによって上記の効果を確認した.
- 社団法人電子情報通信学会の論文
- 2001-09-01
著者
関連論文
- 巻頭言
- 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み (ニューロコンピューティング)
- 知的所有権と研究者 〜東大のCASTIを例に〜
- C-8-8 外部磁場の二次元走査によるNb接合の超伝導電流の変調
- 階層型ニューラルネットにおける中間層での適応的空間再構成と中間層レベルの汎化に基づく知識の継承
- 7-215 大分大学工学部におけるGPA制度の現状と課題((12)教育評価・自己点検・評価システム-IV)
- 隠れニューロンの分離を伴う成長型ニューラルネットワーク
- コミュニケーションの強化学習におけるノイズ付加による連続値信号の離散化
- 強化学習による個性・社会性の発現・分化モデル
- Direct-Vision-Based強化学習による視覚付き実移動ロボットの行動獲得
- 移動物体の捕獲行動学習におけるセンサ動作の比較
- 局所信号を入力としたニューラルネットにおける中間層での適応的空間再構成と汎化
- Actor-Qアーキテクチャに基づく能動認識学習システム
- 力学モデルによる大腿義足の関節粘弾性調整法
- 強化学習によるリーチング動作の獲得
- 連続値入力強化学習におけるGauss-Sigmoidニューラルネットワークの有効性
- ニューラルネットワークを用いたDirect-Vision-Based強化学習-センサからモータまで-
- 1337 力学モデルによるエネルギー蓄積型大腿義足のパラメータ調節
- 1335 トルク推定に基づく筋電義手の動作制御
- エネルギー蓄積型大腿義足の力学的解析と制御
- ニューラルネットワークを用いた人間-筋電義手インタフェース
- 認識の学習に基づく注意と連想記憶の形成
- 環境変動下における四足歩行パターンの生成と遷移
- 人間の動作特性を考慮したバイラテラル・マイクロテレオペレーション
- 強化学習とニューラルネットによる知能創発
- 超伝導微小ループのインダクタンス数値計算
- YBaCuO/PrBaCuO/YBaCuO接合における接合界面特性
- 多重バリア超伝導接合の特性
- 超伝導体 / 常伝導体 / 超伝導体接合におけるdc Josephson電流の数値解析
- S/N/S/N/S接合における超伝導電流の特性
- SNS接合およびSNSNS接合を流れる超伝導電流の特性
- 超伝導接合での準粒子の伝搬と超伝導電流
- C-8-8 ダブルバリア超伝導接合の電流-位相特性
- C-8-7 2次元モデル超伝導体/常伝導体/超伝導体接合におけるdc Josephson電流の計算
- ダブルバリア超伝導接合を用いたSQUIDの特性
- 2次元モデルによる超伝導接合の数値解析
- C-8-5 多重のバリアをもつ超伝導接合
- ダブルバリア超伝導接合の電流-位相特性
- 2次元モデルによる超伝導体/常伝導体/超伝導体接合のジョセフソン電流の計算
- 平行平板超伝導体線路の磁束とマグネティクインダクタンス
- S-N-S接合におけるdc Josephson電流の特性
- ダブルバリア超伝導接合におけるdc Josephson電流の特性
- 超伝導接合を流れるジョセフソン電流のアンドレーフ反射係数による計算
- アンドレーフ反射係数によるトンネル接合の超伝導電流の計算
- 電流源をつないだSQUIDでの磁束の保存
- インダクタを用いた電流源の等価回路
- C-8-3 超伝導薄膜近くのジョセフソン接合を流れる超伝導電流の2次元磁界特性(C-8.超伝導エレクトロニクス,一般セッション)
- 鉄棒ロボットにおける大車輪の学習と動的制御
- 2D3 研究評価・プロジェクト評価のあり方について : その検討試案
- 巻頭言
- 0/1出力型ニューロウインドウ連想記憶の有限系解析
- (0, 1)出力型ニューロウインドウ連想記憶
- Direct-Vision-Based 強化学習に基づく Hand-Eye Coordination の形成
- 利害の衝突回避のための交渉コミュニケーションの学習-リカレントニューラルネットワークを用いたダイナミックコミュニケーションの学習-
- 利害の衝突回避のための交渉コミュニケーションの学習と個性の発現
- マルチエージェント系における個性・社会性の学習的生成
- モデル型TD強化学習による動的環境での行動獲得
- 短期記憶のためのリカレントネット簡易学習則の基本構想
- 遅延強化信号による視点移動の学習
- 強化学習による能動認識能力の学習
- 時間軸スムージング学習による局所センサ信号の統合と空間情報の抽出
- 相関情報抽出ネットと空間認識能力の教師なし学習
- トンネルバリアの異なるNb/AlOx-Al/Nbジョセフソン素子の同時製作
- 局在した生体磁場源分布の再構成
- SMN法による心臓磁界発生源の追跡
- SMN法による心臓磁界データのマルチ・ダイポール解析
- 学習機構を有する自律分散型神経回路による多関節ロボットのリズム運動生成
- D-2-4 ニューラルネットワークによるリズム運動の生成
- モデレーショニズムに基づく振幅信号の学習
- セット・リセット情報を利用したSFQ論理回路
- 単一磁束量子論理回路の非ラッチ動作
- 単一磁束量子論理素子の解析
- ニューラルネットワークにおける振動生成のメカニズム
- 連続時間型ニューロウインドウ法の解析
- C-8-1 垂直外部磁界によるNbトンネル接合を流れるジョセフソン電流の変調特性(C-8.超伝導エレクトロニクス,一般セッション)
- 31a-XC-12 パルスニューラルネットワークにおける乱れの効果
- 超伝導微小ループのインダクタンス解析
- エントロピー論あれこれ
- 非対称荷重を持つニューラルネットワークの幾何的解析
- 並列同期計算による巡回セールスマン問題の高速解法
- ニューロウインドウ法による連続時系列の選択的想起
- 部分反転法の統計神経力学
- 離散同期型ダイナミクスを用いた組み合わせ最適解の探索
- 離散同期型ダイナミクスを用いた組み合わせ最適解の探索
- YBa_2Cu_3O_x薄膜およびYBa_2Cu_3O_x/Au/Au/YBa_2Cu_3O_xジョセフソン素子の作製
- Si,GaAs,InSb基板上のJosephson素子の製作.
- InSb基板上へのNb薄膜堆積のプロセス
- 表面清浄化されたInSb基板上へのNb薄膜の堆積.
- Moderatismを用いたRNNによる自律的な協調運動の生成について
- パルスニューラルネットワークによる周期パルスの抽出メカニズム
- GaAs,InSb基板上へのNbジョセフソン素子の製作プロセス
- Nbジョセフソン素子のI-V特性の温度特性
- 電流源の等価回路のエネルギー
- パルスニューラルネットワークにおける相関コーディングとディレイ適応
- 確率的探索手法による写像と記号表現の同時探索
- 確率的探索手法を用いた集合間の合理的な対応写像探索
- YBaCuO/PrBaCuO/YBaCuO電界効果素子の作製
- モデレーショニズムに基づく発振の学習
- 形式的べき級数恒等式の全単射像表現とその進化論的探索
- 超伝導薄膜に何が期待できるか (酸化物超伝導体薄膜の作製法)