複素数で表現された行動価値を用いるQ-learning(人工知能,認知科学)
スポンサーリンク
概要
- 論文の詳細を見る
複素数で表現された行動価値を用いるQ-learningが,行動価値の簡単な逐次更新によって文脈依存性を表現し,部分観測マルコフ決定過程環境での学習の一手法となることを示す.制約されたセンサのもとでの強化学習のために,部分観測マルコフ決定過程環境における学習手法の研究が進んでいる.しかし,現在研究されている多くの手法は,十分な履歴を記憶するメモリや十分な計算資源を仮定するものが多かった.本論文では,簡単な逐次更新によって文脈依存性を表現する手法に着目し,Q-learningの行動価値を複素数値化したQ-learningを提案する.変数を複素数にするという手法は,ニューラルネットワークの分野において時系列信号の処理に有効であると注目されている.強化学習においても,複素数値化された行動価値が文脈依存性を表現できると期待される.グリッドワールド環境での実験と,不完全なセンサをもつAcrobotの振上げタスクの二つの実験を通して,提案手法の有効性を確認した.
- 2008-05-01
著者
関連論文
- 複素数で表現された行動価値を用いるQ-learning(人工知能,認知科学)
- ソフトウェア改変における母体の複雑性の影響について (信頼性)
- 故障を考慮したブロック構造ニューラルネットワークの進化的構築
- ティーチングとQ学習を併用した知的車椅子の自律走行
- 適応的な状態分割を行うQ-Learningにおける状態数の調整方法(人工知能, 認知科学)
- 複数環境学習オートマトンネットワークによるITS自律走行制御
- パルスニューラルネットワークにおける破局的な忘却の抑制を考慮したヘブ型学習則
- フローシステムモデルによる分岐構造形成の計算機シミュレーション
- 経験的知識に基づく遺伝子操作を導入したGAによる効率的なモジュール構造型ロボットの迷路巡航学習
- 誘因価値に基づいて行動選択確率が変化する強化学習法
- 短期的な伝達効率の調節機構を持つパルスニューラルネットワーク
- B208 セル上に配置されたマルチエージェントによる群集行動分析の一手法(人の流れ)
- 契約ネットプロトコルを用いたマルチエージェントによる自律分散型の配電系統事故復旧方式
- マルチエージェント学習を用いた分散電源の協調制御
- 2層型契約ネットプロトコルを用いた配電系統事故復旧の分散処理システム
- 複数の位相変化量を用いる複素 Profit Sharing
- A-12-9 Multi-car Elevator制御における社会的群知能の最適化(A-12.コンカレント工学,一般セッション)
- D-8-14 確率的に表現型が決まる二倍体遺伝的アルゴリズムの多様性維持に関する一検討(D-8. 人工知能と知識処理,一般セッション)
- 人体モデルを用いた自律分散型体内センサの位置推定法
- O-010 音声を用いた医療現場における業務コンテキストの抽出(情報システム,一般論文)
- M-061 進化的ペトリネットを用いた依存関係のある行動コンテキストの学習(ユビキタス・モバイルコンピューティング,一般論文)
- F-006 不完全知覚を含む環境におけるQ-learningの学習係数に関する一考察(人工知能・ゲーム,一般論文)
- RF-001 連続的な状態空間における複素強化学習(人工知能・ゲーム,査読付き論文)
- 環境の変化に応じた多様性維持を可能にする二倍体遺伝的アルゴリズム
- L-006 インプラントセンサネットワークにおけるマイクロロボットの自律的位置推定(L分野:ネットワーク・セキュリティ)
- F-001 複素強化学習において行動価値を多重化する効果について(F分野:人工知能・ゲーム)
- LF-012 確率的に表現型が決まる二倍体GAを用いた動的環境下での最適化に関する研究(人工知能・ゲーム)
- International Conference on System, Man, and Cybernetics(SMC2006)に参加して(国際会議の報告)
- 確率的に表現型が決定する二倍体GA
- AS-3-3 アクティブRFIDを用いた認知障害者のためのコンテキストアウェアネス情報支援システム(AS-3.将来ライフを拓くユビキタス技術(1)-RFID(ICカード・ICタグ)技術-,シンポジウム)
- LF_007 複素評価値を用いたProfit Sharingに関する研究(F分野:人工知能・ゲーム)
- 知的エージェントによる認知障害者のためのコンテキストアウェアネス情報支援システム
- 知的エージェントによる認知障害者のためのコンテキストアウェアネス情報支援システム(高齢者支援,一般)
- マルチエージェントによる配電系統の復旧制御 (電力ソリューション特集) -- (系統監視制御・保護)
- 知的情報処理を用いた電力市場のシミュレーション
- ソフトウェア改変における母体の複雑性の影響について
- 知的車椅子ロボットにおける環境パラメータを介した協調行動の獲得
- 学習オートマトンによるマルチカーエレベータ制御
- 知的車椅子のための進化型シミュレータと行動統括機構の開発
- セル上に配置されたマリチエージェントによる群集流のシミュレーシュン
- 知的車椅子における環境適応のための状態空間の構成法
- マルチエージェントシステムにおけるデザインパターンを用いたフレームワークの設計
- RF-004 マルチエージェントにより問題空間の分割を行う階層化複素強化学習の検討(F分野:人工知能・ゲーム,査読付き論文)
- F-004 複素価値関数を用いた強化学習に関する基礎的検討(F分野:人工知能・ゲーム)
- D-8-18 自律移動ロボットのための要素合成モデルによる状態空間の形成(D-8. 人工知能と知識処理, 情報・システム1)
- RF-005 二倍体遺伝的アルゴリズムにおけるネットワーク荷重の学習(F分野:人工知能・ゲーム,査読付き論文)
- F-041 複素強化学習における負の報酬の及ぼす影響について(人工知能・ゲーム,一般論文)
- F-021 群文脈を利用したマルチエージェントシステムにおける協調動作の創発(人工知能・ゲーム,一般論文)
- 遺伝的アルゴリズムに基づく音声合成のためのスペクトルパタン圧縮法
- 配電系統事故復旧の困難さに応じて解空間を選択的にサンプリングする遺伝的アルゴリズム
- SCTP及びMIPv6を用いたマルチホームの分散経路制御
- 逐次的に分割された問題空間における複素強化学習
- 逐次的に分割された問題空間における複素強化学習(人工知能,データマイニング)
- SCTP及びMIPv6を用いたマルチホームの分散経路制御
- 確率ネットワーク学習による救急救命支援システム (システム研究会 確率的最適化技術と機械学習技術の共進化)
- 社会的群知能構造を用いたマルチエージェントの適応的協調 (システム研究会 機械学習・知能システム一般)
- ベイジアンネットワークによるコールトリアージ判定の高精度化
- 配電系統事故復旧の困難さに応じて解空間を選択的にサンプリングする遺伝的アルゴリズム
- 知的救急医療の実現に向けて:—機械学習の医療分野への応用—
- 有向グラフ分析によるソフトウェア保守性評価の試み
- D-3-6 クラス構造見直しによるソフトウェアの保守性改善の分析(D-3, ソフトウェアサイエンス)