報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析
スポンサーリンク
概要
- 論文の詳細を見る
- 2012-01-19
著者
-
麻生 英樹
独立行政法人産業技術総合研究所
-
赤穂 昭太郎
独立行政法人 産業技術総合研究所 脳神経情報研究部門
-
神嶌 敏弘
独立行政法人産業技術総合研究所
-
興梠 貴英
東京大学医学部附属病院
-
城 真範
独立行政法人産業技術総合研究所
-
赤穂 昭太郎
独立行政法人産業技術総合研究所
関連論文
- データマイニングと統計数理研究会(SIG-DMSM)(研究会総覧)
- 人工知能学会RSS/iCalendarファイルの利用法
- 転移学習
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 線形計算の数理, 杉原正顯,室田一雄(著), 岩波書店, 2009-08, A5判, 定価(本体6,000円+税)
- 文脈への意味の位置付けを用いた対話システムとその評価(言語,テキストの知能情報処理)
- 対話文脈を利用した構文意味解析
- 協調フィルタリングと属性ベースフィルタリングの統合について(ベイズ情報処理,ベイズ情報処理及び一般)
- 推薦システム-情報過多時代をのりきる(情報のフィルタリング)
- パーティクルフィルタを用いたベイズ推論のユーザインタフェースへの応用(一般, 脳・ヒューマンモデリング, 一般)
- 嗜好のモデル化におけるモデル適応について(ヒトの行動とモデル,神経ダイナミクス,一般)
- Guitarist Simulator : 演奏者の振舞いを統計的に学習するジャムセッションシステム(音楽情報科学)
- 1.仮想状況と現実状況における食事メニュー嗜好の差異について(一般セッション 認知・情報)
- 2.移動端末におけるユーザの状況を考慮した嗜好抽出技術(実世界上のユーザ行動に着目した嗜好抽出・情報推薦, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- 2.協調フィルタリングの課題 : プライバシー,サクラ攻撃,評価値のゆらぎ(嗜好抽出・情報推薦の基礎理論, 利用者の好みをとらえ活かす-嗜好抽出技術の最前線-)
- データマイニングと統計数理研究会(イベントだより)
- 変分ベイズ法を用いたモデル構造探索に基づく抽象的単語の学習(人工知能,認知科学)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマ関連セッション1)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習
- ユーザ嗜好の個人差と状況差を考慮した映画推薦システムの実現と評価(コラボレーション・レコメンデーション,人間中心のユニバーサル/ユビキタス・ネットワークサービス)
- 嗜好の個人差と状況依存性を考慮した映画推薦システムの評価方法の検討と基礎評価(セッション9-A:ユーザ指向,状況依存)
- 嗜好の個人差と状況依存性を考慮した映画推薦システムの評価方法の検討と基礎評価(セッション9-A:ユーザ指向,状況依存)
- ベイジアンネットワークモデルの構造学習におけるMDL規準の改善提案
- 嗜好の個人差と状況依存性を考慮した映画推薦方式の検討(ミドルウェア・アプリケーション)
- 嗜好の個人差と状況依存性を考慮した映画推薦方式の検討(ミドルウェア・アプリケーション)
- ベイジアンネットによる映画コンテンツ推薦方式の検討(好みの計量)
- 視聴覚センサ情報の統合による音源追跡
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- 転移学習に転移中(編集委員今年の抱負2009:経糸から横糸まで)
- ComPassビーコンを用いたスマートフォン上での屋内自律型測位システム(UBI-4【屋内測位システム/移動経路推定】)
- ComPassビーコンを用いたスマートフォン上での屋内自律型測位システム(UBI-4【屋内測位システム/移動経路推定】)
- 神経情報科学入門-初学者からITエンジニアまで-, 福田淳(監修), 高雄元晴,榊原学,内藤誠一郎,堀越哲郎,尾関智子(共著), コロナ社, 2009-04, A5判, 定価(本体3,000円+税)
- 電子情報通信レクチャーシリーズ D-3 非線形理論, 電子情報通信学会(編), 香田徹(著), コロナ社, 2009-03, B5判, 定価(本体3,600円+税)
- ベイジアンモデル選択に基づく知覚特徴量を用いた抽象的語意の学習(テーマセッション(1),CVのためのパターン認識・学習理論の新展開)
- D-9-8 携帯電話上での行動予測モデルに関する検討(D-9.ライフインテリジェンスとオフィス情報システム,一般セッション)
- 視覚情報から言語表現を生成するシステムの試作
- D-12-11 連続時間HMMによる携帯電話上でのイベント予測システムの提案(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- カスタム価格設定推薦システム : 簡単な実装と予備実験(一般講演(モデルとデータの統合),機械学習とその応用)
- 階層ベイズモデルによる協調フィルタリング(一般講演(モデルとデータの統合),機械学習とその応用)
- 想定状況と現実状況における食事メニュー嗜好の差異の分析(一般,生物模倣情報処理,機械学習,一般)
- クラスタ例からの学習 : クラスタ属性の利用
- クラスタ例からの学習 : 分類対象集合全体の属性の利用
- クラスタ例からの学習--クラスタに関する属性の利用
- クラスタ例からの学習--分類対象集合の全体に関わる特徴の利用
- おもてなしシステム(編集委員今年の抱負2011)
- 疎な位置情報履歴からの有意位置抽出方式に関する検討(IBIS2010(情報論的学習理論ワークショップ))
- 自律学習機能(「RWC-実世界知能」)
- 情報過多時代の情報利用 : 推薦システムと強調フィルタリング(Web2.0時代のビジネスモデル-検索エンジンと利用技術-)
- 2.ニューロコンピューティング研究から生まれたもの : 理論・応用的側面(ニューロコンピューティング研究の歴史とその将来)
- 確率モデルによる映画コンテンツ推薦方式の検討 (テーマ:特集「ベイジアンネットワーク」および一般)
- 参加システムの嗜好パターンが異なる場合の集団協調フィルタリング (「プリファレンスモデリングと推薦システム」及び一般)
- 自然言語処理の基礎, 奥村学(著), コロナ社, 2010-10, A5判, 定価(本体2,100円+税)
- D-20-1 通信履歴からの有意位置抽出方式の実験的評価(D-20.情報論的学習理論と機械学習,一般セッション)
- 情報・コンテンツのレコメンド技術と課題
- 推薦システムのアルゴリズム(3)
- 推薦システムのアルゴリズム(2)
- 推薦システムのアルゴリズム(1)
- シリーズ特集研究のツールボックス第6回
- 特集「研究のツールボックス」(第5回)にあたって(研究のツールボックス 第5回)
- まだまだあるクラスタリングの研究(編集委員2007年の抱負)
- シリーズ特集「研究のツールボックス」第4回にあたって(研究のツールボックス〔第4回〕)
- シリーズ特集 研究のツールボックス 第3回
- 機械学習の適用範囲の拡張(ようこそ人工知能の世界へ : 編集委員今年の初夢)
- マルチモーダル対話記述言語MILES
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- 時間関係と対話性を考慮したマルチモーダル対話記述用スクリプト
- 音響入門シリーズ A-1音響学入門, 日本音響学会(編), 鈴木陽一,赤木正人,伊藤彰則,佐藤洋,苣木禎史,中村健太郎(共著), コロナ社, 2011-03, A5判, 定価(本体3,200円+税)
- 階層ベイズモデルによるモデル適応(一般及び雑音を有効利用する神経系やそのモデル)
- 階層ベイズモデルによるモデル適応(一般及び雑音を有効利用する神経系やそのモデル)
- 情報幾何と機械学習
- 順序中の欠損対象の補完 (特集:「アクティブマイニング」および一般) -- (セッション4 クラスタリング,応用)
- 全体討論(第3部:学会の在り方を考える,人工知能学会25周年特集「四半世紀を越えて」)
- 学術分野のWebサービスと成果評価の現状(第3部:学会の在り方を考える,人工知能学会25周年特集「四半世紀を越えて」)
- なんとなく協調フィルタリング--順序応答に基づく推薦 (特集 「医療及び化学情報マイニング」および一般)
- 携帯電話通信時に得られる疎な位置情報履歴を用いた有意位置検出(データマイニング,ライフログ処理技術とその活用システム論文)
- ライフログ情報を利用する推薦サービス利用意向の分析(Web情報システム,ライフログ処理技術とその活用システム論文)
- D-4-1 順序列からの学習 : 潜在変数モデルによるランク付け
- D-20-1 通信履歴からの自宅職場推定手法の実験的評価(D-20.情報論的学習理論と機械学習,一般セッション)
- 特集「知識の転移」にあたって
- 報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析(一般,複雑系とニューロコンピューティング)
- 公正・差別配慮型マイニングのサーベイ (情報論的学習理論と機械学習)
- 公正・差別配慮型マイニングのサーベイ (パターン認識・メディア理解)
- ライフログ情報を利用する推薦サービス利用意向の分析
- 携帯電話通信時に得られる疎な位置情報履歴を用いた有意位置検出
- 機械学習の適用範囲の拡張
- シリーズ特集 研究のツールボックス第2回(研究のツールボックス(2))
- シリーズ特集 研究のツールボックス第1回
- 順序のクラスタリング : 順序平均の最適性について(テーマセッション(2))(データマイニングとパターン認識・メディア理解)
- データマイニング分野のクラスタリング手法(2) : 大規模データへの挑戦と次元の呪いの克服
- 報酬と行動決定を伴う時系列データの強化学習を用いたオフライン分析
- D-012 Twitter解析による通信品質低下傾向の早期検出手法の提案(マイクロブログ,D分野:データベース)
- 携帯電話通信時に得られる疎な位置情報履歴を用いた有意位置検出の実験結果の訂正
- 逆強化学習による医療臨床データの分析
- D-4-9 投稿傾向に着目したWebニュースへのコメント数予測手法(D-4.データ工学)
- 逆強化学習による医療臨床データの分析
- コトDBに基づく非定型業務の協創支援システムの構築
- F-036 階層構造を持つ連想記憶モデルの構造発見へのデータ駆動型アプローチ(F分野:人工知能・ゲーム)
- D-036 ソーシャルメディアの情動に着目した実世界事象予測手法の提案(D分野:データベース)