強化学習型情報処理における人間の行動決定について
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, 強化学習研究における探索(exploration)と搾取(exploitation)のトレードオフ状況において, 人間がどのように行動決定を行っているか, そして行動決定に関わる学習要因は何かを探るため実験を行った.その結果, 個人により行動方略の違いがあること, また, 個人内に「これだけは確保しておきたい」という報酬の最低量の基準の存在が示唆された.学習者は自身の持つ「最低基準量」に現在までの報酬が達しているかどうかを確認しながら, 残り行動数を見て方略を決定していると考えられる.
- 2001-01-04
著者
関連論文
- クローンメトリックスを用いたfault-proneモジュール判別の追実験(研究速報)
- 開発者メトリックスに基づくソフトウェア信頼性の分析(ソフトウェア工学)
- ライトユーザを対象としたオンライン協調作曲支援システム (感性、感情、共感)
- 自主研究 ソフトウェア開発における適正工期に関する分析
- ブレークポイント使用履歴に基づくデバッグ行動の分析(デバッグ,モデル駆動開発)
- 使用クラスに基づくソフトウェアの機能面からの分類
- ホームネットワークシステムにおけるサービス開発へのペルソナシナリオ法の適用と評価(ホームネットワーク)
- ホームネットワークにおける家電連携サービスのユーザビリティ評価(ホームネットワーク)
- 対面コミュニケーションにおけるTree-Mapを用いた共著関係め視覚化の効用(セッション2:コミュニケーション)
- ソースコード流用のコードクローンメトリクスに基づく検出手法(ソフトウェア解析)
- 脳波を利用したソフトウェアユーザビリティの評価 : 異なるバージョン間における周波数成分の比較
- ホームネットワークにおける家電連携サービス作成支援システムの開発(ホームネットワーク)
- 工数予測における類似性に基づく欠損値補完法の実験的評価
- 1B-2 テスト駆動開発におけるソースコードの循環的複雑度の計測(プログラム検証と品質管理,一般セッション,ソフトウェア科学・工学)
- 機能実行履歴を用いたソフトウェア機能の発見支援システム
- 未知機能の発見支援を目的としたソフトウェア機能実行履歴の提示
- 未知機能の発見支援を目的としたソフトウェア : 機能実行履歴の提示
- 協調フィルタリングを用いたソフトウェア開発工数予測方法(産学連携論文)
- コードクローンに基づくレガシーソフトウェアの品質の分析(システム評価・管理技術)
- 再帰やポインタを含むプログラムの効率的な依存関係解析法の提案
- D-CCFinder:超大規模ソースコード集合を対象とした分散処理型コードクローン検出・可視化システム
- 家電機器連携サービスにおけるサービス競合の検出(アクティブネットワーク,IP-VPN,ネットワークセキュリティ,超高速ネットワーク,P2P通信,ネットワークソフトウェア,一般)
- 家庭のエンドユーザを対象としたホームネットワーク機器連携サービス作成支援システム
- ビル管理システム連携におけるシステムとサービス競合の定式化(Webサービス・システム連携(学生セッション))
- 動的サービスバインディング機構を用いたマルチベンダホームネットワークシステムの一実現手法(ホームネットワーク)
- ビル管理システムにおけるサービス指向アーキテクチャの適用 : 異種システムの連携と安全性に関する考察(ユビキタス,情報配信,ユビキタス時代のネットワークサービス・システム,シームレス通信サービス,一般)
- ユーザの移動に伴う機器と環境の状態引き継ぎを実現するホームネットワークシステムの提案(ホームネットワーク)
- Webサービスを用いた従来家電のホームネットワークへの適応
- 注視情報に基づくネットワーク家電の状態提示システムの構築
- ホームネットワークシステムにおけるサービス競合の分類と解消について
- データ依存解析に基づくレガシーソフトウェアからのサービス抽出法
- 家電機器間の相互接続性を考慮した連携サービスを実現するサービス指向フレームワークの提案(テスト・評価)
- プログラマの視線を用いたレビュープロセスの分析
- 家電連携サービスにおけるサービス競合の動的な検出・解消法の設計と評価
- WS-PROVE を用いた Web サービスメトリクスの実験的評価
- Web サービスアプリケーションのプロトタイピングおよび性能評価のためのシステム開発
- WS-PROVEを用いた Web サービスメトリクスの実験的評価
- サービス指向アーキテクチャを用いたネットワーク家電連携サービスの開発(Webサービス)(新時代の分散処理とネットワーク(WebサービスとP2P))
- 不具合履歴に基づくソフトウェアIV&V活動の定量的見える化手法(ソフトウェア工学)
- ソフトウェアバグと変数名の関係の分析(ソフトウェア解析)
- 問題の早期発見・改善を支援するインプロセスプロジェクト管理手法の実プロジェクトへの適用(ソフトウェア工学)
- 問題の早期発見・改善を支援するインプロセスプロジェクト管理手法の実プロジェクトへの適用
- ソースコードの差分情報を用いたコードレビューコストの分析(レビュー,品質(学生セッション))
- 自主研究 ソフトウェア開発費に影響する要因の分析
- 生産性要因に基づいて層別されたソフトウェア開発工数見積りモデル
- コードクローンの長さに基づくプログラム盗用確率の実験的算出
- 5.産官学連携によるエンピリカルソフトウェア工学の実践 : データに基づく実証的アプローチ(第1部:高い生産性を持つ高信頼ソフトウェア作成技術の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- コードクローンの長さとソフトウェア信頼性の関係の分析
- 見逃し欠陥の回帰テスト件数を考慮したコードレビュー手法
- ソフトウェアオーバホール手法の実験的評価(テスト技法・保守技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
- ソフトウェアオーバーホール手法の評価実験
- ソースコードの並び替えによるソフトウェアの問題発見手法
- 保守工程におけるデバッグ作業者のバグ特定プロセス分析
- メールスレッドのクラスター分析によるOSSプロジェクトのアクティビティ予測手法
- BPELワークフローに着目した連携Webサービスの応答速度・稼働率の見積もり手法(webサービスとコンテキスト)
- 時間駆動型Webサービス呼び出しフレームワークWS-Schedule Managerの提案と実装(webサービスとコンテキスト)
- Webjig:ユーザ行動とユーザ画面の関連付けによる動的Webサイト利用者の行動可視化システムの開発および評価
- ライトユーザを対象としたオンライン協調作曲支援システム
- 群衆コミュニケーション支援のための理論的枠組とインタフェースの試作
- セキュリティ要件のレビューにおけるチェックリストの表記方法の比較
- バグ報告の単語出現頻度に着目したチェックリスト作成の試行
- デスクワークにおけるアウェアネス向上のための作業計測
- Marble: 遠隔協調楽曲編集による作曲支援システム
- 実証的ソフトウェア工学環境への取り組み
- Empirical Project Monitor : プロセス改善支援を目的とした定量的開発データ自動収集・分析システムの試作
- 一般的なGUIに適した視線・マウス併用型ターゲット選択方式次世代インタラクションのための情報技術
- レガシーな組込みソフトウェアの改良支援ツール
- Javaクラスファイルに対する電子透かし法(:電子化知的財産・社会基盤)
- 機能実行履歴を用いたソフトウェア利用知識の共有(:知識と情報の共有)
- 認知構造の違いによる生産性の変化を考慮したソフトウェア開発シミュレーションモデル
- 脳波データを用いたユーザビリティ評価実験の考察
- 脳波計測装置を用いたユーザインタフェースの評価
- 組込みソフトウェア改造時の作業配分を容易にする小規模な改造工数の見積もり尺度の提案
- デバッグ時間の短縮を目的とする二人によるデバッギングの実験的考察
- デバッグ時間の短縮を目的とする二人によるデバッギングの実験的考察
- 視線によるテキストウィンドウの自動スクロール (ヒューマンインタフェースとインタラクション)
- 学習習熟を考慮したソフトウエア開発シミュレーションモデルの評価
- 学習習熟を考慮したソフトウエア開発シミュレーションモデルの評価
- Fault-proneモジュール判別における外れ値除去法の比較(テスト技法・保守技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
- Fault-Proneモジュール判別モデルに対する外れ値除去法の適用効果(学生セッション C_開発プロセス)
- ジャクソンシステム開発法の代数的言語による記述の試み
- ソースコード中の識別子に基づくカテゴリ階層構築手法(ソースコード分析と可視化)
- ソースコード中の識別子に基づくカテゴリ階層構築手法(ソースコード分析と可視化)
- デスクトップ検索システムを用いたJavaソフトウェア部品リポジトリの自動更新機能の実現
- シーケンシャルパターンマイニングに基づくオブジェクト指向プログラムのための欠陥検出手法
- 強化学習型情報処理における人間の行動決定について
- ソフトウェアプロセス記述言語SPDLとその処理系の設計
- メソッド間の依存関係を利用した再利用支援システムの実装
- 開発履歴データのリアルタイム収集・分析システムEPMの拡張について : SRGMを用いた予測グラフの実現および既存解析システムとの連携
- 制限された動的情報を用いたブロック単位スライシング手法の提案
- 制限された動的情報を用いたブロック単位スライシング手法の提案
- 開発支援システムREFINEを用いたCプログラム依存関係解析ツールの試作
- モデル指向開発環境の提案(一般,学生セッション,一般)
- コードクローンを対象としたリファクタリングの有効性に関する調査
- ソースコードの差分を用いた関数呼び出しパターン抽出手法の提案(開発支援(1)(学生セッション))
- 類似メソッドの集約のための差分抽出支援
- 協同編集機能を持つメールアーカイブシステムの試作
- 更新履歴情報と静的情報を用いて同一機能を実装しているクラス群を抽出する手法の提案
- 履歴情報を用いたソースコードの変更危険度計測手法の提案
- 開発過程記述用図式エディタの作成