強化学習の収益最大化における漸近等分割性の役割
スポンサーリンク
概要
- 論文の詳細を見る
強化学習は, エージェントと環境の相互作用から成る確率的な行動決定過程を記述するのに適した枠組みとしてよく知られている.強化学習においてエージェントは直接教示された行動選択を学習するのではなく, 収益を最大化することにより最適な政策を獲得する.強化学習で扱われる確率過程は, 一般にエルゴードマルコフ決定過程として定式化され, 最終的にはほぼ定常な過程になるように行動選択戦略のパラメータを調節する.本論では漸近等分割性を考えることにより, 収益最大化が達成可能なより一般的な確率過程のクラスを考察する.結果として, 収益最大化が達成可能であるためにエージェントと環境が満たさなくてはならない必要条件を示す.
- 2005-03-22
著者
-
酒井 英昭
京都大学大学院情報学研究科
-
池田 和司
京都大学大学院情報学研究所
-
池田 和司
京都大学大学院情報学研究科システム科学専攻
-
岩田 一貴
広島市立大学情報科学部
-
岩田 一貴
京都大学大学院情報学研究科
-
池田 和司
金沢大学工学部電気・情報工学科
-
酒井 英昭
京都大学大学院 情報学研究科
関連論文
- Rate enhancing Superposition Coding scheme for two-way relaying (無線通信システム)
- ADS-1-8 部分空間法によるブラインドチャネル推定におけるEMアルゴリズムの利用(ADS-1.信号処理のための機械学習,シンポジウムセッション)
- ADS-1-8 部分空間法によるブラインドチャネル推定におけるEMアルゴリズムの利用(ADS-1. 信号処理のための機械学習,シンポジウムセッション)
- マルチキャリア変調のためのAF協調ダイバーシチ法とアウテージ解析(自律・分散・協調システム,自律・分散・協調システム,一般)
- Amplify-and-Forward法を用いたマルチホップ無線ネットワークコーディングのための分散リレーアルゴリズム(SIP:信号処理2,無題QoS,無線リソース制御,アドホックネットワーク,信号処理,無線通信一般)
- フィードバック系の適応フィルタの解析(プロセッサ,DSP,画像処理技術及び一般)
- サイクリックプレフィックスを用いたブロック伝送方式と信号ひずみ補償技術
- 遺伝的アルゴリズムのネットワーク的性質(スパイク信号の統計解析、一般)
- アウテージ解析によるAF無線中継器の最適配置の検討(オーガナイズドセッション「局間連携及び分散アンテナに関する諸技術」,アダプティブアンテナ,等化,干渉キャンセラ,MIMO,無線通信,一般)
- F_041 マルコフ決定過程に基づくマルチエージェントシステムの漸近的性質(F分野:人工知能・ゲーム)
- IFDMA方式のためのIQ不均衡の補償法(ネットワーク,PLC,補償技術,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- OFDMA下り回線のためのSLNR基準を用いた電力配分法 (無線通信システム)
- PA-1 信号処理の教育はこれでよいか
- 無線リレーを用いた双方向通信のためのSuperposition Coding法(初めての研究会,鉄道,車々間・路車間通信,リソース制御,スケジューリング,無線通信一般)
- OFDMA及びSC-FDMA方式受信機における送信IQ不均衡の影響解析(信号処理,スペクトル拡散,及び一般)
- OFDMA及びSC-FDMA方式受信機における送信IQ不均衡の影響解析(信号処理,スペクトル拡散,及び一般)
- IFDMA方式のためのIQ不均衡の補償法(ネットワーク,PLC,補償技術,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- IFDMA方式のためのIQ不均衡の補償法(ネットワーク,PLC,補償技術,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- サイクリックプレフィックスを用いたブロック伝送のための送信等化及び周波数ダイバーシチ合成法(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : 最適ウェイトの導出(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : 最適ウェイトの導出(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : 最適ウェイトの導出(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : 最適ウェイトの導出(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : 最適ウェイトの導出(移動通信ワークショップ)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析
- フィードバック系の適応フィルタの解析(プロセッサ,DSP,画像処理技術及び一般)
- 強化学習の収益最大化における漸近等分割性の役割
- マルチエージェント強化学習におけるエージェント間の制約の影響について(学習理論)
- Amplify-and-Forward法を用いたマルチホップ無線ネットワークコーディングのための分散リレーアルゴリズム(SIP:信号処理2,無題QoS,無線リソース制御,アドホックネットワーク,信号処理,無線通信一般)
- OFDMA下り回線のためのSLNR基準を用いた電力配分法(初めての研究会,鉄道,車々間・路車間通信,リソース制御,スケジューリング,無線通信一般)
- 忘却係数を持つサポートベクトルマシンの統計的解析
- SA-2-1 適応信号処理技術の新展開 : 21世紀への期待 (招待講演要旨)
- 情報幾何学の観点からみた準加法的アルゴリズム
- 強化学習の収益最大化における漸近等分割性の役割
- 典型系列を使った強化学習の解析
- 強化学習における漸近等分割性について
- 強化学習における典型系列について
- 強化学習における典型系列について(NC一般セッション(3))(認識と学習,模倣学習)
- 強化学習における典型系列について(NC一般セッション(3))(認識と学習,模倣学習)
- 強化学習における複雑さを評価するためのLempel-Ziv符号化(統計的学習理論及び一般)
- ABS-1-9 SLNRを最大にする送信ビーム形成ベクトルのパレート最適性(ABS-1. ブロードバンド通信のための信号処理技術,シンポジウムセッション)
- ABS-1-9 SLNRを最大にする送信ビーム形成ベクトルのパレート最適性(ABS-1.ブロードバンド通信のための信号処理技術,シンポジウムセッション)
- OFDMA方式のための送信ビームフォーミング法(ブロードバンド無線アクセス技術,信号処理,無線通信一般)
- OFDMA方式のための送信ビームフォーミング法(ブロードバンド無線アクセス技術,信号処理,無線通信一般)
- SA-3-2 Blind identification of multichannel systems by scalar-valued linear prediction
- アウテージ解析によるAF無線中継器の最適配置の検討(オーガナイズドセッション「局間連携及び分散アンテナに関する諸技術」,アダプティブアンテナ,等化,干渉キャンセラ,MIMO,無線通信,一般)
- サイクリックプレフィックスを用いたブロック伝送方式のための分数間隔等化法 : ビット誤り率特性解析
- 二次元拡散MC-CDMAのための電力配分法(ブロードバンド無線アクセス技術,無線信号処理,無線通信,一般)
- 二次元拡散MC-CDMAのための電力配分法(ブロードバンド無線アクセス技術,無線信号処理,無線通信,一般)
- AFプロトコルを用いた協調通信のためのリレー割り当てアルゴリズム(ブロードバンド無線アクセス技術,無線信号処理,無線通信,一般)
- AFプロトコルを用いた協調通信のためのリレー割り当てアルゴリズム(ブロードバンド無線アクセス技術,無線信号処理,無線通信,一般)
- 央代信号処理(ASP)研究分科会第2期活動報告
- 応用信号処理(ASP)研究分科会(第II期)活動報告
- 空間的相関を持つコーシー分布とガウス分布によるノイズが混在した画像修復について
- A-4-37 通過域外乱を低減した周期的ANCシステムの安定解析
- 正弦波信号に対する適応回り込みキャンセラシステムとその解析(音声・適応信号処理,信号処理,LSI,及び一般)
- 正弦波信号に対する適応回り込みキャンセラシステムとその解析(音声・適応信号処理,信号処理,LSI,及び一般)
- 正弦波信号に対する適応回り込みキャンセラシステムとその解析(音声・適応信号処理,信号処理,LSI,及び一般)
- 補聴器における音響フィードバック抑制のための適応アルゴリズム(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- 補聴器における音響フィードバック抑制のための適応アルゴリズム(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- 補聴器における音響フィードバック抑制のための適応アルゴリズム(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- 正弦波信号に対する能動騒音制御系の収束解析(サンプリング,信号,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 正弦波信号に対する能動騒音制御系の収束解析(サンプリング,信号,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- 正弦波信号に対する能動騒音制御系の収束解析(サンプリング,信号,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- サイクリックプレフィックスを用いたシングルキャリヤ無線通信システムのためのアダプティブアレーアンテナ(無線通信技術)
- サイクリックプリフィックスを用いた単一搬送波無線通信システムのためのアダプティブアレーに関する一検討(移動通信ワークショップ : 次世代ブロードバンド無線通信の実現に向けて)
- サイクリックプリフィックスを用いた単一搬送波無線通信システムのためのアダプティブアレーに関する一検討(移動通信ワークショップ : 次世代ブロードバンド無線通信の実現に向けて)
- サイクリックプリフィックスを用いた単一搬送波無線通信システムのためのアダプティブアレーに関する一検討(移動通信ワークショップ : 次世代ブロードバンド無線通信の実現に向けて)
- サイクリックプリフィックスを用いた単一搬送波無線通信システムのためのアダプテイブアレーに関する一検討(移動通信ワークショップ)(「次世代ブロードバンド無線通信の実現に向けて」)
- L1ノルム最小化を用いた部分空間法によるブラインドスパース通信路推定(移動通信ワークショップ)
- 無線中継伝送のための離散変調方式を用いた重畳符号化法の検討(データ転送方式)
- 確率システムの展望 : 信号処理の視点から(システム制御情報における確率論の先端応用)
- 周期性騒音に対する能動制御のための線形および非線形Filtered-X LMSアルゴリズムの解析(衛星を用いる移動体通信,無線通信一般)
- 周期性騒音に対する能動制御のための線形および非線形Filtered-X LMSアルゴリズムの解析(衛星を用いる移動体通信,無線通信一般)
- 周期性騒音に対する能動制御のための線形および非線形Filtered-X LMSアルゴリズムの解析(衛星を用いる移動体通信,無線通信一般)
- B-5-28 時空間ブロック符号の単一搬送波周波数領域等化システムへの適用
- 非同期OFDM干渉信号抑圧のためのPre-FFT型広帯域アダプティブアレーの検討(無線通信のための信号処理及び一般)
- 非同期OFDM干渉信号抑圧のためのPre-FFT型広帯域アダプティブアレーの検討(無線通信のための信号処理及び一般)
- 周波数領域等化システムのための単一周波数全二重無線中継(無線通信のための信号処理及び一般)
- 周波数領域等化システムのための単一周波数全二重無線中継(無線通信のための信号処理及び一般)
- 第40回ストカスティックシステムシンポジウム(SSS'08)(学会活動)
- 非同期OFDM干渉信号抑圧のためのPre-FFT型広帯域アダプティブアレーの検討
- 周波数領域等化システムのための単一周波数全二重無線中継
- 周波数領域等化システムのためのプレディストーションによる位相雑音対策(無線アクセス技術,一般)
- マルチキャリア変調方式を用いたマクロセル・フェムトセル共存環境のための送信電力割り当て法(無線アクセス技術,一般)
- 分割想起による連想記憶モデルの提案
- 分割想起による連想記憶モデルの提案
- ガウス過程の統計力学的解折(アナログ信号処理)
- ガウシャンプロセスの統計力学的解析
- 周波数領域等化システムのための単一周波数全二重無線中継
- 非同期OFDM干渉信号抑圧のためのPre-FFT型広帯域アダプティブアレーの検討
- 独立成分分析に基づく適応フィルタ(第40回確率システムシンポジウム記念)