BN混合モデルを用いたオンライン型方策改善システムの動的環境への適応(<特集>ベイジアンネット2 : ポスターセッション)
スポンサーリンク
概要
- 論文の詳細を見る
我々は,ベイジアンネット(Bayesian Network:BN)混合モデルを用いた強化学習エージェントの方策改善システムを提案した.BN混合モデルは,エージェントの存在する環境に対応する確率的知識表現と見なされる.本稿では,自律的に環境変化の認識とモデルの混合率学習を行う機構を上述のシステムに付加した,オンライン型方策改善システムを紹介する.エージェントナビゲーション問題を適用例として計算機実験を行い,複数環境に対応するBNを混合して方策改善に利用することで,未知環境を含む環境変化にエージェントが適応可能となることを示す.加えて,混合モデルを利用した方策改善法の特性について議論する.
- 社団法人電子情報通信学会の論文
- 2004-10-12
著者
-
中野 良平
名古屋工業大学知能情報システム学科
-
塩谷 浩之
室蘭工業大学工学部情報工学科
-
塩谷 浩之
室蘭工業大学工学部
-
塩谷 浩之
室蘭工大 工
-
中野 良平
名古屋工業大学大学院工学研究科情報工学専攻
-
中野 良平
中部大学情報工学科
-
北越 大輔
名古屋工業大学 大学院工学研究科
-
中野 良平
名古屋工業大学 知能情報システム学科
-
塩谷 浩之
室蘭工業大学
関連論文
- オンデマンドストリーミング映像を用いた学習支援教材システム
- MV正則化を用いたニューラルネットモデル簡素化
- 22pTC-6 電子回折イメージング(領域10シンポジウム主題:X線・電子線による回折イメージングの最前線,領域10,誘電体,格子欠陥,X線・粒子線,フォノン物性)
- 情報論的手法による回折イメージング(機械学習,一般)
- フーリエ反復位相回復法への角度拡がりデコンボリューションの適用(ニューラルネットワーク画像復元及び一般)
- 位相回復におけるアンサンブル手法の利用に関する一検討(ニューラルネットワーク画像復元及び一般)
- 一般化された位相回復アルゴリズムに関する一検討(ニューラルネットワーク画像復元及び一般)
- 複素情報理論の展開 : 物質構造解析への情報論的アプローチ(ニューラルネットワーク画像復元及び一般)
- フーリエ反復位相回復法への角度拡がりデコンボリューションの適用
- 一般化された位相回復アルゴリズムに関する一検討
- 位相回復への情報論的アプローチ(一般, 進化・発進の現象とモデル, 一般)
- 「ニューロラルな視点からの挑戦」へのコメントと回答
- 交差検証誤差最小化によるSV回帰ハイパーパラメータ最適化の高速化
- 教師なしアンサンブル学習に関する検討 : 集合知の情報論的モデル化(機械学習,一般)
- 教師無しアンサンブル学習の定式化とその評価
- アンサンブル学習における符号を保つ重み正規化手法に関する検討(研究速報)
- 指数混合による情報表現
- クラスタリングを用いた強化学習システムIPMBNの環境変化への適応について(ニューラルネットワーク画像復元及び一般)
- BN混合モデルを用いたオンライン型方策改善システムの動的環境への適応(ベイジアンネット2 : ポスターセッション)
- ベイジアンネットを利用した強化学習エージェントの方策改善(知識処理)(「インタラクション:理論,技術,応用,評価」)
- 1-105 強化学習エージェントの確率的知識を用いた方策改善法に関する研究
- 4層パーセプトロンを用いた質的条件付き重回帰(バイオサイバネティックス,ニューロコンピューティング)
- 社会ネットワーク上の情報伝搬における強影響力ノード抽出の効率化(データマイニング)
- 4層パーセプトロンを用いた名義空間自動分割型重回帰
- 重み双方向クラスタリング学習法 : 最適な共有重み構造をもつニューラルネットを求めて(バイオサイバネティックス, ニューロコンピューティング)
- ニューラルネットを用いたテキストの特徴語抽出(一般)(ニューロインフォーマティックスとは何か)
- 多層パーセプトロンを用いた区分的多項式回帰(一般)(ニューロインフォーマティックスとは何か)
- ニューラルネットを用いたテキストの特徴語抽出
- 多層パーセプトロンを用いた区分的多項式回帰
- 線形変数変換に不変な自乗値ペナルティ項の構成法(知識処理)
- 交差検証誤差最小化による重要重みの発見
- NC2000-44 質的条件付き数法則発見法 : RF6.2アルゴリズム
- 法則発見法RF6.2の生化学データへの適用と評価 (テーマ:「データマイニング--共通データからの知識発見」および一般)
- 質的条件付き数法則発見法のVQと決定木を用いた高速化 (小特集 「発見科学」及び一般演題)
- 線形変数変換に不変な自乗値ペナルティ項の構成法 (小特集 「発見科学」及び一般演題)
- 交差検証誤差最小化による重要重みの発見
- 2次学習アルゴリズムBPQによるリカレントネットワーク学習とガウス混合分布推定
- 2次学習アルゴリズムBPQの分類問題への適用法とその評価
- MDL 原理に基づく新正則化法
- ニュ-ラルネット法則発見法の大規模デ-タへの適用性
- 自乗値ペナルティ項を用いた2次学習アルゴリズム
- 量子通信路容量の超加法性の達成度に関する一考察
- 正解ニッチェ表現をめぐるルール間生存競争
- 3層ニューラルネットにおける2階導関数を用いた学習アルゴリズムの高速化
- 再帰型ニューラルネットワークによる蛋白質構造学習と状態空間表現
- サポートベクトル回帰におけるハイパーパラメータの最適化法
- Bayesian Networkと情報検索 : 統計的検索とニューラルネット (第10回日本計算機統計学会シンポジウム報告)
- Bayesian Networkと文献検索 : 統計的検索とニューラルネット
- f-divergence に関する新しい不等式と最大値および学習問題への応用
- 原始初期点とSubsamplingを用いたEM初期値生成法
- Loopy-BPにおける計算速度向上のためのネットワーク構造簡略化(ニューラルネットワーク画像復元及び一般)
- 混合システム的視点に基づく遺伝的アルゴリズムのモデリング
- 遺伝的アルゴリズムの混合モデル的解析に関する一検討
- 2-414 混合モデルを利用した遺伝的アルゴリズムの解析
- 混合システム的視点に基づく遺伝的アルゴリズムのモデリング
- 学習機械を利用した遺伝的アルゴリズムのモデリングに関する検討
- 拡張遺伝子型分布空間における最適化問題の解析
- 多点探索DAEMにおける効果的な温度スケジューリング
- リカレントネットを用いた力学系学習におけるモデル選択と局所最適性
- DAEMアルゴリズムを用いた多点探索
- ニューロナルな視点からの挑戦
- A-6-2 M元線形独立信号に対する量子最適受信機の一実現法
- コネクショニストアプローチによる数法則の発見
- HMEの構成的学習アルゴリズム
- 準ニュートン法に基づくElmanネットワークの学習アルゴリズム
- 不定性を用いた分布間情報量の拡張形式に関する検討(情報理論)
- アンサンブル学習モデルにおける重み付けに関する考察(研究速報)
- 不定性を利用した分布間情報量の拡張に関する一検討
- 拡張混合表現を用いた学習と遺伝子型分布
- α-ダイバージェンスを利用した一般化された2乗誤差最小学習
- アンサンブル学習の解析と拡張
- アンサンブル学習の理論的モデル化に関する一検討
- α尤度による損失関数の一般化とその学習
- エスコート分布とα尤度を用いたMLPの学習
- 非ベイズ的付加項を用いた多層パーセプトロンの学習
- MLPの正則化項に関する一検討
- ボルツマン機械の学習と擬距離最小規準
- MLPの正則化項に関する一検討
- 最大エントロピー原理を用いた文献検索システムのBayesian Networkによる実現
- Bayesian Network を用いた情報検索のおける不完全データの学習
- 凸関数の変換とダイバージェンスの関係不等式
- 学習経路と情報量の位相的性質との関係について
- 統計的学習と情報量の関係についての考察
- 位相回復--計算アルゴリズム (ミニ特集 回折イメージング--位相回復の新展開)
- 進化型多目的最適化に基づく少数方向投影からのCT画像再構成
- 事例からのルール抽出 : RF2アルゴリズム
- オンデマンドサービスを利用したコンピュータリテラシーのための学習支援システム
- N-017 映像ストリーミングを用いた学習支援情報システムに関する検討(N.教育・人文科学)
- 位相回復 : 計算アルゴリズム
- 知識表現・知識獲得基本技術 (知識処理技術)
- 将棋局面進行度の定量化法の比較評価
- ボンガルド問題と概念学習アルゴリズム
- Lin 情報量の一般化および新しい情報量の導出
- ニュ-ラルネットを用いた法則発見
- 自乗値ペナルティ項を用いた2次学習アルゴリズム
- 自乗値ペナルティ項を用いた2次学習アルゴリズム
- 回折イメージングにおける情報論的実像推定 (画像工学)
- 回折イメージングにおける情報論的実像推定 (メディア工学 映像表現&コンピュータグラフィックス)
- Bayesian Network と文献検索
- 回折イメージングにおける情報論的実像推定(高精細度画像処理・表示,一般)