強化学習型情報処理における人間の行動決定について
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, 強化学習研究における探索(exploration)と搾取(exploitation)のトレードオフ状況において, 人間がどのように行動決定を行っているか, そして行動決定に関わる学習要因は何かを探るため実験を行った.その結果, 個人により行動方略の違いがあること, また, 個人内に「これだけは確保しておきたい」という報酬の最低量の基準の存在が示唆された.学習者は自身の持つ「最低基準量」に現在までの報酬が達しているかどうかを確認しながら, 残り行動数を見て方略を決定していると考えられる.
- 2001-01-10
著者
関連論文
- クローンメトリックスを用いたfault-proneモジュール判別の追実験(研究速報)
- 開発者メトリックスに基づくソフトウェア信頼性の分析(ソフトウェア工学)
- ライトユーザを対象としたオンライン協調作曲支援システム (感性、感情、共感)
- 自主研究 ソフトウェア開発における適正工期に関する分析
- ブレークポイント使用履歴に基づくデバッグ行動の分析(デバッグ,モデル駆動開発)
- 使用クラスに基づくソフトウェアの機能面からの分類
- ホームネットワークシステムにおけるサービス開発へのペルソナシナリオ法の適用と評価(ホームネットワーク)
- ホームネットワークにおける家電連携サービスのユーザビリティ評価(ホームネットワーク)
- 対面コミュニケーションにおけるTree-Mapを用いた共著関係め視覚化の効用(セッション2:コミュニケーション)
- ソースコード流用のコードクローンメトリクスに基づく検出手法(ソフトウェア解析)