環境状況に応じて自己の報酬を操作する学習エージェントの構築
スポンサーリンク
概要
- 論文の詳細を見る
The authors aim at constructing an agent which learns appropriate actions in a Multi-Agent environment with and without social dilemmas. For this aim, the agent must have nonrationality that makes it give up its own profit when it should do that. Since there are many studies on rational learning that brings more and more profit, it is desirable to utilize them for constructing the agent. Therefore, we use a reward-handling manner that makes internal evaluation from the agents rewards, and then the agent learns actions by a rational learning method with the internal evaluation. If the agent has only a fixed manner, however, it does not act well in the environment with and without dilemmas. Thus, the authors equip the agent with several reward-handling manners and criteria for selecting an effective one for the environmental situation. In the case of humans, what generates the internal evaluation is usually called emotion. Hence, this study also aims at throwing light on emotional activities of humans from a constructive view. In this paper, we divide a Multi-Agent environment into three situations and construct an agent having the reward-handling manners and the criteria. We observe that the agent acts well in all the three Multi-Agent situations composed of homogeneous agents.
- 社団法人 人工知能学会の論文
- 2002-11-01
著者
-
森山 甲一
東京工業大学情報理工学研究科計算工学専攻
-
沼尾 正行
東京工業大学情報理工学研究科計算工学専攻
-
森山 甲一
大阪大 産科研
-
沼尾 正行
東京工業大学
-
森山 甲一
東京工業大学大学院情報理工学研究科
関連論文
- 社会的ジレンマを解決する内部評価生成法の分析
- 口コミ支援システムWAVEへのプッシュ型情報交換の導入
- 口コミ支援システムWAVEへのプッシュ型情報交換の導入(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- 口コミ支援システムWAVEの新機能
- 口コミ支援システムの実験
- 自動編曲システムにおけるコード進行の学習
- DS-2-7 共有メモリ型マルチエージェントプランニングにおけるプランニングエージェント間の格差の解消(DS-2.安全安心,センシングネットワークとAI,シンポジウムセッション)
- 多属性データに対する前処理の木構造を用いたモデル化
- 多属性データに対する前処理の木構造を用いたモデル化(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- XML変形を用いた前処理の事例研究
- F_034 CONCORによるリンク解析を反映したTF・IDFによるWeb文書の要約(F分野:人工知能・ゲーム)
- CONCORによるリンク解析を用いたWeb文書からの重要語抽出
- 時系列センサデータからのセンサ隣接関係の可視化(「ネットワークデータマイニング」「センサデータマイニング」)
- 時系列センサデータからのセンサ隣接関係の可視化(「ネットワークデータマイニング」「センサデータマイニング」)
- カーネルSOMによる損傷評価のための隣接性を考慮した分類性能評価
- 第2回マシンインテリジェンスに関する国際ワークショップ(International Workshop on Machine Intelligence 1993)の報告
- アクティブマイニングの構想と展開(アクティブマイニング)
- 小特集・論文特集「アクティブマイニング」にあたって(アクティブマイニング)
- 特集「アナロジー」の編集にあたって
- AAAI90
- 共存進化における決定木の学習に関する研究
- 階層化された知識の継承による情報フィルタリング
- 読者の評価に基づいて学習を行なう電子ニュースフィルタリングシステム
- カーネルSOMによる損傷評価のための隣接性を考慮した分類性能評価
- 遺伝的アルゴリズムを用いた対話型作文支援システム
- 2U-8 情報フィルタリングの手法を用いた転送先学習型メタ検索エンジン
- 自己評価により学習するエージェントに関する研究(エージェント・分散人工知能)(人工知能分野における博士論文)
- 図を用いた算術問題解決システムDIPS
- イメージを用いた推論のコンピュータモデル
- リテラル連関とMDL基準による相対最小汎化の計算法
- 実世界における多戦略学習・創発計算プロジェクト(総合報告)
- リテラル連関とMDL基準による相対最小汎化の計算法
- 算数の抽象概念獲得におけるアナロジー
- 複数の情報媒体を用いた学習の過程 : プログラミング言語Prologを題材として
- 2000-ICS-120-2 相互依存関係にある内部モジュールを持つ自律システムの構築について
- 情報検索を用いたアクティブマイニングの螺旋サイクル(「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
- パネル討論「機械学習の理論と実際」 : 1991年6月28日第5回人工知能学会全国大会(於:学習院大学大講堂)にて (「機械学習の理論と実際」)
- DS-2-6 ユビキタス環境下における非同期多目的達成のための実時間リアクティブプランニング法の提案(DS-2. 安全安心とセンシングネットワーク,シンポジウムセッション)
- リンク構造に基づいたWWW からのトピック抽出
- 感情への「キノコ喰いロボットアプローチ」 : 人工知能の見地から
- D-8-7 アフィリエイトサービスにおける効用向上のための自律コミュニティ形成技術(D-8. 人工知能と知識処理, 情報・システム1)
- 動的なネットワークを用いた述語論理表現の学習法
- 学習からのイメージ, 感性へのアプローチ
- 6. 人工知能と類推 (<特集> アナロジー)
- 説明構造の分解による類推
- 構造同値に基づいたWebページの分類の高速化技術の提案
- 構造同値に基づいたWebページの分類の高速化技術の提案
- リンク構造に基づいたWWWからのトピック抽出
- 構造同値に基づくWebページの分類(「社会システムにおける知能」および一般)
- 構造同値に基づくWebページの分類(一般,「社会システムにおける知能」および一般)
- D-10-3 分散データベースにおけるアシュアランス性向上のための自律マルチモバイルエージェント構成技術(D-10. ディペンダブルコンピューティング, 情報・システム1)
- D-10-1 信頼性と情報保持量を考慮した情報配布システム構造決定技術(D-10. ディペンダブルコンピューティング, 情報・システム1)
- 環境状況に応じて自己の報酬を操作する学習エージェントの構築
- プラスチック成形品における設計制約学習システム
- 平面幾何学の推論と学習への視覚的イメージの導入
- 帰納論理プログラミング過程を用いた射出成形品金型の自動設計
- 東京工業大学情報工学科志村研究室
- 説明の部分構造抽出による高速化学習
- 生物医学文献データベースを利用する医療データマイニング
- 遺伝子機能に基づくバイオ分野文献検索システム
- 知識流通における紙面レイアウトの役割とそれに基づく自動タグ付け
- メタ知識で制御した学習システム
- ユーザの感性に合わせた自動編曲及び作曲
- 多分木化による見やすい決定木の構築
- 弁別に基づく構成的帰納学習
- 非決定的,無弁別なリテラルを含む論理プログラムの学習
- マルチプル・インスタンス学習のための重み更新アルゴリズム : 実験による研究
- 情報検索を用いたアクティブマイニングの螺旋サイクル
- 正例と負例に弁別不能な例からの関係学習
- 帰納学習における帰納論理プログラミングと遺伝的プログラミングの統合
- 帰納学習への遺伝的アルゴリズムの適用
- 遺伝的アルゴリズムによる概念獲得
- 意外な勘違いへの対処が可能な学習者モデルの構築方法
- メタインタプリタによる帰納的プログラム合成規則の学習
- 例題による複数ステップタスクの学習法
- 目的主導の類推によるプログラム合成
- プロダクションシステムNatにおける学習機能