未知パラメータを含むマルコフ決定過程に関する一考察
スポンサーリンク
概要
- 論文の詳細を見る
最近,人工知能の学習の分野においては強化学習の研究が盛んに行われている.その中の主だった問題設定として,未知パラメータを含むマルコフ決定過程がある.これに関しては人工知能に限らず,統計,確率過程,OR,制御等多くの分野においても研究がなされてきた.本論においては,過去の研究の内,収束性の視点によるQ-Learnigと収益性の視点によるMartinのアルゴリズムを紹介すると共に,それらの視点をふまえた上でその折衷案的な視点によるアルゴリズムを提案する.
- 1995-07-15
著者
-
松嶋 敏泰
早稲田大学理工学術院
-
平澤 茂一
早稲田大学理工学術院
-
松嶋 敏泰
早稲田大学
-
前田 康成
早稲田大学理工学部経営システム工学科:現在 Ntt情報通信研究所
-
平澤 茂一
早稲田大学
-
前田 康成
北見工大
関連論文
- 変動要因を考慮した非定常ポアソンモデルに関する一考察(トラヒック解析・制御(2),インターネットトラヒック,TCP/IP,性能解析・評価,ネットワークモデル及び一般)
- 複数の鍵配送センターを用いたランプ型鍵事前配布方式(情報セキュリティ基礎)
- KL情報量を制約としたResolvability問題における達成可能条件の評価(研究速報)
- A Note on a Sampling Theorem for Functions over GF(q)n Domain
- マルコフ決定過程の動作時間と受信バッファ容量が有限の選択再送ARQへの適用(研究速報)
- サービスの開始と終了を考慮したWebトラヒックの非定常Poisson過程によるモデル化について (情報ネットワーク)
- バースト消失訂正とLDPC符号に関する一考察
- 補助情報を伴う情報源符号化定理に関する一考察(一般/LDPC符号セッション,LDPC符号,一般)
- Fingerprinting Codes for Multimedia Data against Averaging Attack
- Generalization and Extension of XEX* Mode
- 複数のLDPC符号の交錯による有限状態マルコフ通信路に適した誤り訂正符号について(LDPC符号セッション(符号構成),LDPC符号,及び一般)
- 拡張された有本-Blahutアルゴリズムの大域的収束性について(情報理論)
- 確率伝搬法を用いたCDMAマルチユーザ検出アルゴリズムに関する一考察
- ユニバーサル情報源・通信路結合符号化に関する一考察
- A Combined Matrix Ensemble of Low-Density Parity-Check Codes for Correcting a Solid Burst Erasure
- Density Evolution Analysis of Robustness for LDPC Codes over the Gilbert-Elliott Channel
- 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム
- Reliability-Based Hybrid ARQ Scheme with Encoded Parity Bit Retransmissions and Message Passing Decoding(Information Theory and Its Applications)
- 複合情報源におけるε達成可能なオーバーフローしきい値に関する考察
- デジタル指紋技術のための結託耐性を持つ符号の連接符号化法
- ストリーム暗号における擬似乱数生成器の構成に関する一考察(研究速報)
- 無ひずみ情報源符号化におけるオーバフロー確率について(情報理論)
- ユニバーサル通信路符号化法における通信路容量について(ブロードバンドモバイル時代における基礎技術)(情報通信サブソサイエティ合同研究会)
- 決定木モデルにおける予測アルゴリズムについて
- 畳み込み符号の並列復号アルゴリズムの性能評価に関する一考察(一般,フレッシュマン,招待講演)
- メモリ量を低減した近似ベイズ符号化アルゴリズム(情報理論)
- (2,2;2)-MACの通信路容量を求める手法に関する一考察
- ウェーブレットパケット基底を用いた信号推定におけるベイズ決定理論の適用に関する一考察
- 低密度パリティチェック符号の復号アルゴリズムに関する一考察
- パラメータが時間変化する情報源とその符号化に関する一考察
- ウェーブレット・パケットを用いた雑音除去におけるベイズ法の応用に関する一考察
- IT2000-19 Ziv-Lempel符号の冗長度に関する一考察
- BW変換を用いたユニバーサル符号化アルゴリズムに関する研究
- Linear programming decoding of binary linear codes for multiple-access channel (情報理論)
- ベイズ統計学に基づくOn-line学習モデルと学習可能性
- HMM通信路に対するEM復号の復号誤り確率の評価法
- バースト消失訂正に適したLDPC符号の修正方法について(情報通信基礎サブソサイエティ合同研究会)
- 有限幾何に基づく Fingerprinting のための結託耐性符号
- トレリス符号を用いた有歪みデータ圧縮の一考察
- 対数線形モデルを用いた不確実な知識の推論法について
- A Note on Transmission Schemes with Unequal Error Protection Codes and a Feedback Channel
- A Note on Error Correction Schemes with a Feedback Channel(Coding Theory,Information Theory and Its Applications)
- The Reliability based Hybrid ARQ Scheme with both the Encoded Parity Bit Retransmissions and Message Passing Decoding(HISC2006)
- Transformation of a Parity-Check Matrix for a Message-Passing Algorithm over the BEC(Discrete Mathematics and Its Applications)
- A Note on HTTP Traffic Analysis of the Time Series Model with a Time Varying Density Parameter
- A Study of Reliability Based Hybrid ARQ Scheme with Bitwise Posterior Probability Evaluation from Message Passing Algorithm
- KL情報量を制約とした Resolvability 問題における達成可能条件の評価
- 未知パラメータを伴う隠れマルコフモデルの状態推定に関する一考察
- 統計的決定理論に基づく複数のクラスに属する文書の分類方法に関する一考察(情報通信基礎サブソサイエティ合同研究会)
- ベイズ統計学に基づく計算論的学習モデルと学習可能性
- ストリーム暗号への攻撃法の改良に関する一考察 : 多次元の相関を利用した攻撃(情報セキュリティ基礎)
- 直交計画と双対符号の関係に関する一考察(情報通信基礎サブソサイエティ合同研究会)
- 直交計画と双対符号の関係に関する一考察(情報通信基礎サブソサイエティ合同研究会)
- 直交計画と双対符号の関係に関する一考察(情報通信基礎サブソサイエティ合同研究会)
- 直交計画を用いたブール関数の学習に関する一考察
- ブール関数の逐次実験計画を用いた学習に関する一考察
- ベイス決定理論による定式化のもとで直交計画を用いたブール関数の学習に関する一考察
- フーリエ変換を用いたブール関数の学習に関する一考察
- 質問からの学習問題の決定理論による定式化に関する一考察
- マルコフ決定過程の計算アルゴリズムについて
- 矛盾を含む知識の取り扱いについての一考察
- 構成的帰納論理プログラミングに関する一考察
- PROLOGを対象とした帰納的学習の効率化
- 相互通信可能な情報源符号化に関する一研究
- ID情報に基づくランプ型分散鍵配送方式について
- ポアソン分布に従う非定常な時系列のモデル化に関する一考察(一般,フレッシュマン,招待講演)
- 多端子情報理論に基づく分散協調問題について
- 多端子モデルに基づく分散協調問題の定式化について
- 不確実な知識の演繹推論における二項述語への拡張に関する一考察
- 情報理論に基づく推論の体系化と不確実な知識表現への応用
- パネル討論「21世紀のAIのための数理モデル」 : 議論集(「21世紀のAIのための数理モデル」)
- 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム
- 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム
- バースト消失訂正に適したLDPC符号の修正方法について(情報通信基礎サブソサイエティ合同研究会)
- バースト消失訂正に適したLDPC符号の修正方法について(情報通信基礎サブソサイエティ合同研究会)
- 決定木の構成法に関する一考察
- 2元線形符号を用いた多重アクセス通信路に対する線形計画復号について(LDPC符号,一般)
- サービスの開始と終了を考慮したWebトラヒックの非定常Poisson過程によるモデル化について(トラヒック解析・制御)
- 多端子情報理論に基づくセンサネットワークのモデル化と信頼度評価
- バースト消失訂正とLDPC符号に関する一考察
- 多端子情報理論に基づくセンサネットワークのモデル化と信頼度評価
- 秘密情報を持つ Broadcast Channel の Secrecy Capacity 計算アルゴリズム
- 電子透かしにおける秘匿容量計算アルゴリズム(情報通信基礎サブソサイエティ合同研究会)
- 電子透かしにおける秘匿容量計算アルゴリズム(情報通信基礎サブソサイエティ合同研究会)
- 電子透かしにおける秘匿容量計算アルゴリズム(情報通信基礎サブソサイエティ合同研究会)
- 階層モデルにおけるベイズ予測の漸近評価に関する一考察
- 区間で一定なパラメータを持つ非定常情報源におけるベイズ符号の冗長度について
- 使用ユーザが変化するDS/CDMAシステムにおけるベイズ最適なマルチユーザ検出について
- 電子透かしにおける秘匿容量の計算手法に関する研究(フレッシュマン, 一般)
- 区間で定常なパラメータを持つ非定常情報源におけるベイズ符号の冗長度について(一般セッション)(フレッシュマン,一般)
- ベイズ決定理論に基づく予測における近似手法について
- 区間で一定なパラメータを持つ情報源におけるベイズ符号化法について
- 相関のある時系列の状態空間によるモデル化と予測(一般,フレッシュマン,招待講演)
- A Note on the ε-Overflow Probability of Lossless Codes(Information Theory)
- A Note on the overflow probability of lossless codes
- マルコフ決定過程の動作時間と受信バッファ容量が有限の選択再送ARQへの適用
- 質問応答回数最小をねらいとした効率的な知的インタフェイスの設計
- ランプ型鍵事前配布方式における参加者の記憶容量の下界と最適な構成法について (情報理論)
- 線形計画法に基づいたファクターグラフ上の推論アルゴリズムに関する一考察 (情報理論)
- 不均一誤り訂正符号を用いた直積ファイルのディスク配置 (情報理論)