コミュニケーションの強化学習におけるノイズ付加による連続値信号の離散化
スポンサーリンク
概要
- 論文の詳細を見る
筆者は,シンボルグラウンディング問題を解決するためには,シンボル処理とパターン処理を分けずに行う必要があり,そのためには,ニューラルネットを用いることが最良であると考えている.しかしながら,ニューラルネットはシンボル処理が苦手であると一般的に考えられている.本研究では,ニューラルネットを強化学習で学習させることによって必要に応じてシンボルが創発する可能性を探ることを目的とする.そこで,2エージェント間の一方向コミュニケーションを強化学習で学習する非常に単鈍なタスクを考え,発信側でのアナログコミュニケーション信号の生成と,受信側での受け取った信号からの行動生成をともにニューラルネットで行った.そして,信号伝達時にノイズを付加すると,単に強化学習に基づいてそのニューラルネットを学習させるだけで,学習可能なノイズレベルの範囲内において,ノイズレベルの増大とともに発信側では信号が離散化され,受信側でも受け取った信号から行動を離散化する傾向があり,結果的にノイズ付加による性能低下が抑えられることを示した.また,ニューラルネットをリカレントとすることで,信号の離散化がさらに促進されることを示した.
- 社団法人電子情報通信学会の論文
- 2004-03-12
著者
関連論文
- 巻頭言
- 強化学習とリカレントネットを用いた並列で柔軟な学習制御システムの枠組み (ニューロコンピューティング)
- 階層型ニューラルネットにおける中間層での適応的空間再構成と中間層レベルの汎化に基づく知識の継承
- 7-215 大分大学工学部におけるGPA制度の現状と課題((12)教育評価・自己点検・評価システム-IV)
- 隠れニューロンの分離を伴う成長型ニューラルネットワーク
- コミュニケーションの強化学習におけるノイズ付加による連続値信号の離散化
- 強化学習による個性・社会性の発現・分化モデル
- Direct-Vision-Based強化学習による視覚付き実移動ロボットの行動獲得
- 移動物体の捕獲行動学習におけるセンサ動作の比較
- 局所信号を入力としたニューラルネットにおける中間層での適応的空間再構成と汎化
- Actor-Qアーキテクチャに基づく能動認識学習システム
- 力学モデルによる大腿義足の関節粘弾性調整法
- 強化学習によるリーチング動作の獲得
- 連続値入力強化学習におけるGauss-Sigmoidニューラルネットワークの有効性
- ニューラルネットワークを用いたDirect-Vision-Based強化学習-センサからモータまで-
- 1337 力学モデルによるエネルギー蓄積型大腿義足のパラメータ調節
- 1335 トルク推定に基づく筋電義手の動作制御
- エネルギー蓄積型大腿義足の力学的解析と制御
- ニューラルネットワークを用いた人間-筋電義手インタフェース
- 認識の学習に基づく注意と連想記憶の形成
- 環境変動下における四足歩行パターンの生成と遷移
- 人間の動作特性を考慮したバイラテラル・マイクロテレオペレーション
- 強化学習とニューラルネットによる知能創発
- 巻頭言
- Direct-Vision-Based 強化学習に基づく Hand-Eye Coordination の形成
- 利害の衝突回避のための交渉コミュニケーションの学習-リカレントニューラルネットワークを用いたダイナミックコミュニケーションの学習-
- 利害の衝突回避のための交渉コミュニケーションの学習と個性の発現
- マルチエージェント系における個性・社会性の学習的生成
- モデル型TD強化学習による動的環境での行動獲得
- 短期記憶のためのリカレントネット簡易学習則の基本構想
- 時間軸スムージング学習
- 遅延強化信号による視点移動の学習
- 強化学習による能動認識能力の学習
- 時間軸スムージング学習による局所センサ信号の統合と空間情報の抽出
- 相関情報抽出ネットと空間認識能力の教師なし学習
- リカレントネットを用いた強化学習による探索行動と多値記憶の創発
- ニューラルネットを用いた強化学習による行動の学習を通した色恒常性の創発