特徴構成法を用いたQ学習の効率改善
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 特徴構成法を用いた強化学習システムFCQLについて述べる.従来の強化学習では, 対象とする環境の各状態を識別する適切な属性が, 学習の前段階であらかじめ準備されていることを仮定している.現実には, 学習システムが状態を識別するのに充分な入力系を持っているとは限らず, 領域に固有の特徴を適宜構成していく機能が必要とされる.本稿では, 構成的帰納学習に用いられる特徴構成法を, 強化学習の一手法であるQ学習と統合し, 有限離散時間環境における適切な内部表現と評価関数を学習する手法を提案する.結果として, 単位時間における期待報酬値を最大化するのみでなく, 収束までに費やす状態数の大幅な削減が実現できた.
- 1998-11-26
著者
関連論文
- ランダムアルゴリズムによる帰納学習の特性解析
- 帰納的学習アルゴリズムの特性解析
- 感覚的情報を扱うためのPrologとニューラルネットワークの結合
- D-12-10 Cell/B.E.を用いた時系列データの類似度検索の高速化(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- 様々な感情動作を生成するためのコンピュータ内での身体運動の記述文法
- 木構造ウェーブレット変換の構造を用いたテクスチャ解析および分類
- 分散発展型データベースシステム技術の研究 (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 説明に基づく失敗の回避
- ESP言語上のウィンドウ制御プログラム開発支援システムWINCS
- 映像文法に基づいた実時間使用可能ショット識別による撮影ナビゲーションシステム(マルチメディアとパターン認識理解,一般)
- 時間系列を伴う例からの抽象化に基づく戦略学習
- 特徴構成法を用いたQ学習の効率改善
- 特徴構成法を用いたQ学習の効率改善
- 要求獲得の知的支援 (「ソフトウェアの知的な開発へ向けて」)
- N-Level決定木アルゴリズムにおける平均的事例解析手法
- 内容の関連性にもとづいたビデオ映像の記述
- 時刻印付ノードリンクグラフによるビデオ映像のデータベース化
- 並列組織化アルゴリズムによるグラフマッチングと部分構造の発見手法 (高度データベース論文特集)
- グラフ表現による動画像内容記述からの階層的場面構造の構築
- グラフによって記述された事例集合からのMDL基準による階層構造の発見
- 神戸大学工学部情報知能工学科前川研究室
- 事例に基づくプランニングを用いた対話管理手法
- 動画像データの内容記述とその構造化処理に関する検討
- 動的環境下における多戦略学習に基づく学習システム
- 複合類推を用いた物理現象の理論形成
- 複合類推による物理現象の理論形成
- 過去の事例をクラスタのラベル付けに利用した部分教師付きデータストリームからの学習(知能ソフトウェア工学)
- 対話プランニングにおける複数事例適合メカニズムについて
- 概念束を用いた選言概念の逐次的学習
- 典型性に基づく概念学習アルゴリズム
- 構成的帰納学習と強化学習の統合による知的エージェントの学習効率の向上
- Case-Based Text Planningにおける文脈情報の取り扱い
- 2Q-11 シナリオ作成を考慮したビデオデータベースシステムの開発 : 制約条件に基づくマルチメディアオブジェクトの表現方法
- 2Q-10 シナリオ作成を考慮したビデオデータベースシステムの開発 : 時間関係に注目したマルチメディアオブジェクトのダイレクト操作インターフェイス
- ストーリの内容記述に基づく映像の検索と要約
- ストーリの内容記述に基づく映像の検索と要約
- ランダムアルゴリズムによる帰納学習の特性解析
- 画像データのカプセル化による版権管理手法 (第54回全国大会 (平成9年前期 於 : 千葉工大) 大会優秀賞受賞論文 (11件)
- 画像データのカプセル化による版権管理手法
- 版権管理のためのJavaによる画像データカプセル化
- 事例の選択的な記憶による極小事例ベースの獲得