強化学習におけるオンラインセンサ選択
スポンサーリンク
概要
- 論文の詳細を見る
More sensors do not necessarily result in more appropriate state descriptions, so that a mobile robot has to select an appropriate set of sensors besides learning a state-action function in a reinforcement learning environment. We present a multi-armed bandit formulation of the problem and apply it to mobile robot navigation task. We modified the reinforcement comparison method to suit our problem and build a system where the selection of optimal set of sensors and the learning of state-action functions are done simultaneously. Our approach is evaluated on a Khepera robot simulator and the results reveal that our approach works well as an integrated learning system to identify the best set of sensors and reduce learning time.
- 社団法人 電気学会の論文
- 2005-06-01
著者
-
藤波 努
北陸先端科学技術大学院大学知識科学研究科
-
國藤 進
北陸先端科学技術大学院大学知識科学研究科
-
櫻井 彰人
慶應義塾大学大学院理工学研究科
-
國藤 進
北陸先端科学技術大学院大学
-
石川 浩一郎
慶應義塾大学理工学部
-
石川 浩一郎
北陸先端科学技術大学院大学 知識科学研究科
-
藤波 努
北陸先端科学技術大学院大学
関連論文
- 身体知研究会(SIG-SKL)(研究会総覧)
- ベイジアンネットワークを用いた画像解析による同期信号の判別(「人工知能的方法論を用いた知的画像処理」)
- プレゼンテーションスライド情報検索のためのスライドページからの要求関連情報抽出
- 日本の大学・大学院の創造性教育(準備委員会企画シンポジウム5)
- アウェア技術を駆使した見守り中心の介護支援システムの研究
- オブジェクト指向言語における変数とデータの関係を理解するためのワークベンチ
- 2B1-N2 生徒のデジタルペン筆記を利用したインタラクティブ学習環境とその実践(インタラクティブ学習環境:科学の学びを支援する新しい学習環境,自主企画課題研究,転換期の科学教育)
- 日本の大学院の創造性教育(日本の大学・大学院の創造性教育,準備委員会企画シンポジウム,I 日本教育心理学会第51回総会概要)
- ディジタルマルチメディアコンテンツの視聴履歴の効果的共有
- カメラとモニタ導入に伴うグループホーム介護者の負担感に関する研究(第2報)(肢体障害・介護,HCGシンポジウム)
- グループホームにおけるあったかい介護のためのインタラクション(セッション6,あったかいインタラクション)
- サイバー空間を活用した新しい学習環境の構築
- プレゼンテーションスライド情報の構造抽出(コンテンツ技術・Web情報システム,知識基盤社会を支える情報技術論文)
- 実世界での利用を考慮した図書推薦モデルの提案と評価(コンテキスト・実空間支援とネットワークサービス,社会システムと向き合うネットワークサービス)
- 共有インフォーマルスペースにおけるコミュニティ商店を利用した休憩情報提供システム(セッション3 : コミュニケーション支援)
- 継続的創造会議のための会議間コミュニケーション支援システムの開発(会議支援)
- 食材の持ち寄りによるコミュニケーション活性化支援システム(コミュニケーション)
- カンジルホウイ : 幼児が保護者を捜すことのできる迷子防止システムの提案(地図の利用)
- 4ZB-2 外国人研修生用工場ノウハウ取得のための研修支援システムの構築(語学教育・音楽教育・心理学教育,学生セッション,コンピュータと人間社会)
- 時系列データをもちいた形式概念分析法の提案
- 展示発表において展示の閲覧と議論への参加を促す Aware Topics の提案と運用
- 個々人のアイデアを組み合わせ・連想する能力を考慮したヒントサポート方法の提案と実装
- プレゼンテーションスライド情報の構造化(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- 3ZA-6 地図上での目的地選択を支援するルートの視覚化手法(ITSネットワーク・地図情報,学生セッション,ネットワーク)
- 発想支援と協調学習(協調学習とAI)
- 機能性高分子を用いた嗅覚ディスプレイの開発およびビデオへの応用(インタラクティブシステム,人間中心のユニバーサル/ユビキタス・ネットワークサービス)
- グループ意思決定支援のためのコミュニケーション支援機能の提案(コラボレーション・レコメンデーション,人間中心のユニバーサル/ユビキタス・ネットワークサービス)
- 状況情報の明度を抑えたプライバシ保護手法の提案と評価(ユニバーサルサービス,人間中心のユニバーサル/ユビキタス・ネットワークサービス)
- 学習知識フィルタリングを用いた協調ノートシステム(協調学習,情報教育〜理念・理論・実践〜)
- 隠れマルコフモデルを用いた論文とプレゼンテーションシートの対応付け(表理解,アライメント,抽出)
- 創造的活動における文献調査のためのドキュメントスキーミング支援環境 : 創造的研究活動の支援環境を目指して
- 実社会指向アプローチによる認知症高齢者のための協調型介護支援システムの研究開発(ユニバーサルサービス,人間中心のユニバーサル/ユビキタス・ネットワークサービス)
- 1E04 ハイアールの人的資源開発(研究人材・人材育成)
- ICカードを利用した教育環境における報奨システムの提案(e-Learningにおける学習評価/一般)
- プロジェクトマネジメントにおける経験知抽出方法
- KJ法における衆目評価法とAHP法の比較研究 : グループ意思決定に関するフィードバック効果について
- ホルダ内におけるスタイラスの動作量を利用した入力インタフェース(インタフェースデザイン,インタラクション技術の原理と応用)
- カメラとモニタ導入に伴うグループホーム介護者の負担感に関する研究(高齢者・肢体障害,HCGシンポジウム)
- グループホームにおける見守り支援システムのためのコンセプト提案
- Webコラボレーションを応用したWebコンテクストアウェアネスの一提案と実装(グループウェア,マルチメディア,分散,協調とモバイル(DICOMO2005))
- アウェアネス支援に基づくリアルタイムなWWWコラボレーション環境の構築
- コミックダイアリ : 漫画表現を利用した経験や興味の伝達支援(インタラクション技術の革新と実用化)
- グループ発想支援ツール「発想跳び」の試作と評価
- 研究室配属のためのシラバスシステムの提案と試作(セッション4 : 教育・学習支援)
- プレゼンテーションスライド情報の構造化(ライフログ活用技術とその課題,オフィス情報システム,デジタルドキュメント,一般)
- プロジェクトマネジメントにおける経験知抽出方法
- 身体知研究の潮流 : 身体知の解明に向けて
- AwareTable: 透過調光ガラスを用いたテーブルトップシステムの試作(セッション2:しっかり/かっちりインタラクション(2),テーマ:「しっかり/かっちりインタラクション」および一般)
- 高品位映像の評価 : 脳波を指標とする客観評価法
- 高品位画像の画質評価 : 脳波を指標とする客観的評価法と主観的評価法による
- 従来品位画像と高品位画像の脳波レベルでの比較評価
- 従来品位画像と高品位画像の脳波レベルでの比較評価
- デジタルペンとPDAを利用した実世界指向インタラクティブ授業支援システム(知的創造作業支援, マルチメディア, 分散, 協調とモバイル(DICOMO2004))
- 身体知研究会(SIG-SKL)
- 技能の科学と倫理
- 電子ブックリーダーにおける物理的ページング操作を可能にしたセンシング装置の開発
- 電子ブックリーダーにおける物理的ページング操作を可能にしたセンシング装置の開発
- アウェア技術を駆使した見守り中心の介護支援システムの研究
- 知識創造ビル内位置情報アウェアネスサーバーの設置とその応用 : 追跡型情報掲示板システム(Shadow Messenger)の構築
- プレゼンテーションスライド情報検索のためのスライドページからの要求関連情報抽出
- プレゼンテーションスライド情報検索のためのスライドページからの要求関連情報抽出
- 一般教室での日常的利用を考慮したデジタルペン授業システムの改良(教育システム開発論文,学習・教育支援のための技術開発)
- オブジェクト指向言語における変数とデータの関係を理解するためのワークベンチ
- 情報伝播と Arrow論理によるエージェント間コミュニケーションの形式化 (&特集>「記号論理とAI」)
- 相手を説得するメールは可能か
- 診断モデルを持つエージェントの協調による分散診断
- 教室の中の舞台:デジタルペンを用いた双方向型授業の提案
- 小画面地図上での画面外目的地選択におけるルートサムネイルの効果
- J-009 モバイルナビゲーションにおける目的地候補からの選択を容易にするインタフェースの提案(J分野:ヒューマンコミュニケーション&インタラクション)
- Webサイトに対する3ポイントタスク分析支援システムの開発(セッション4:Web応用)
- 非同期環境におけるコミュニケーションを触発する実世界指向らくがきメディアの構築と評価(セッション2 : 実世界志向)
- 友人ネットワークの状態遷移図による分析
- スポットライトを用いた屋内での捜し物発見支援システム(モバイルコンピューティング,インタラクションの理解とデザイン)
- スポットライトによる物探し支援システム(セッション2 : 実世界志向)
- 近距離モバイル情報サービスのための小型PDAを用いた反射率変調空間光通信(ネットワーク・通信(1))
- スプリングモデルを用いたアイデア触発のための思考支援システムの構築
- 組織情報共有におけるキーワード抽出法の検討
- 互恵性を用いたグループ意思決定支援機能の提案
- グループ意思決定におけるアウェアネス : 通信環境とGDSSの観点から(ユーザインタフェースとインタラクティブシステム, ユビキタス社会におけるコラボレーションサービス)
- グループ意思決定支援システムにおける効果的なアウェアネスと通信環境の利用に関する考察(セッション4 : アウェアネス)
- 身体技能の習得支援
- グループ間コミュニケーション支援のためのインターグループウェアの提案(組織・協調行動とネットワークサービス,社会システムと向き合うネットワークサービス)
- リズムで越える時間の壁 : 身体知へのアプローチ
- B7 加速度センサを用いたサンバダンスの解析(スキルサイエンス2)
- B6 竹馬乗り歩行の運動解析(スキルサイエンス2)
- 複数の状態行動価値表を用いたR学習の高速化
- 個人と組織に見られる巧みさの発達と進化(スキルサイエンス)
- 強化学習におけるオンラインセンサ選択
- 平均律クラヴィーア曲集第二巻の手稿譜に関するデータベース構築とその利用(セッション2 : 楽譜資料研究)
- 線型論理
- Verbmobilプロジェクト : 内側から見て
- 自動車製造業の生産改善にみる知識創造の促進要因
- 技の研究と人工知能 (テーマ:特集「スキルサイエンス」および一般)
- グループホームにおける認知症高齢者の見守りを支援するカメラシステム開発および導入に伴う問題
- サンバ演奏の動作解析(音楽演奏者の動作解析)
- 自動車製造業の生産改善にみる知識創造の促進要因
- スキルサイエンスラボラトリのご紹介
- 伝統技能におけるリズミカルな動作
- 音楽する脳
- 有限状態遷移の論理