倒立振子の協調制御における言語の自発的形成
スポンサーリンク
概要
- 論文の詳細を見る
協調作業を行うエージェントに対し行動と通信の規則を同時にGAにより学習させた。具体的には、2体のエージェントに、協調して倒立振子を鉛直に保つというタスクをあたえた。ただしエージェント間で通信を行なうことのできるよう設定し、エージェントがその通信を有効に活用しなければ与えたタスクを遂行することが難しくなるよう、一定の制約条件を設けた。学習を続けた結果、振子を倒れないよう巧みに制御するような、行動と通信のアルゴリズムをエージェントは獲得した。さらに十分学習を行なったエージェントの通信内容と行動内容を分析したところ、言語の発生と呼ぶことができるような現象が確認された。
- 社団法人電子情報通信学会の論文
- 1999-05-27
著者
-
吉澤 修治
東京大学大学院工学系研究科機械情報工学専攻
-
村川 正宏
東京大学大学院工学系研究科
-
村川 正宏
電子技術総合研究所
-
森永 聡
NEC C&C メディア研究所
-
星野 攻
東京大学大学院工学系研究科
-
平岡 和幸
埼玉大学 工学部 情報システム工学科
-
吉澤 修治
玉川大学学術研究所
-
吉沢 修治
東大工
-
森永 聡
日本電気株式会社c&cメディア研究所
関連論文
- 聴覚認知に関与する海馬 - 皮質活動の解析
- 視覚認知における同一線分内の運動情報伝達
- 文字の心的回転の脳内過程
- 手の左右判別に伴う脳内活動
- Motor Imageryにおける脳内処理の時空間構造
- メンタルローテーションの情報処理モデル : 脳磁データからの推定
- 脳磁気計測による運動の想起と実行の比較
- 文字のメンタルローテーション課題遂行時の脳磁界
- 作業分担における情報交換ルールの強化学習による自動獲得
- 倒立振子の協調制御における言語の自発的形成
- 近傍モデル遺伝的アルゴリズムによる多目的最適化
- 線画呈示に伴う脳内活動部位の時間変化
- 連想記憶のイジングモデルへのαオーダーパラメータの提案 : 自由エネルギーの計算
- 適応デバイスの研究開発
- 進化するハードウェアを用いたパターン認識システム
- ニューロンクラスによるスパイク間隔統計の相違
- ニューロンクラスによるスパイク間隔統計の相違
- 13pTC-8 BVP モデルと LIF モデルの高次スパイク間隔統計量の相違(ニューラルネットワーク : 神経系のモデルを含む, 領域 11)
- 時空間構造をもつ入力に対するSTDPベースの自己組織化マップ
- LIFモデルとBVPモデルで見られる高次スパイク間隔統計の相違
- STDPによるシナプスパターンの競合と調節のメカニズム
- ニューロンモデルのクラス分類と入力の性質によるスパイク統計の相違
- 2P2-3F-B6 人とロボットの歩行同期のための視覚による踵追跡・歩行ピッチ抽出
- 2P1-3F-B8 パターン認識の前処理としての次元圧縮法
- 両眼競合知覚の神経機構
- 二次元動画像からの動作情報抽出
- A-2-23 カオス系列刺激によるBVPニューロンの応答とその統計的解析
- A-2-17 有色ノイズ入力を与えたBV ニューロンの応答
- BVPニューロンへの有色ノイズ刺激とその応答
- 進化型アナログLSI -遺伝的アルゴリズムによる製造誤差への適応-
- 1A1-77-110 逐次学習型線形判別分析アルゴリズムの性能比較
- 槌田 敦: 石油と原子力に未来はあるか; 資源物理の考えかた, 亜紀書房, 東京, 1978, iii+233ページ, 19×13cm, 980円.
- GAによるニューラルネットワークの構造学習用回路の実現
- フォールトトレラントシステムの領域分割モデル
- フォールトトレラントシステムの領域分割モデル
- フォールトトレラントシステムの領域分割モデル
- 連想記憶ニューラルネットワークへのαパラメータの提案 : 平衡状態・ダイナミックスの解析
- 反応曲線が既知なロブ-パス問題の最適解
- 砂時計型ネットを用いた多価関数の学習
- 砂時計型ネットの中間次元数選択について : AIC・MDLの不適切性と新しい基準量
- 多重化砂時計型ネットを用いた広いクラスの曲面によるデータフィッティング
- 砂時計型ニューラルネットの競合学習
- データ補正の教師無し学習 : 砂時計型ネットは何を学習しているのか
- RBFネットワークを用いた時変環境におけるQ-learning :遺伝的アルゴリズムによる有用度関数の構成法
- LF-003 分散・ヘテロなデータからのトピック全体構造の学習(F分野:人工知能・ゲーム)
- 筋肉のHodgkin-Huxley方程式における周期倍分岐の連鎖
- 筋肉のHodgkin-Huxley方程式の2パラメータ分岐
- 筋細胞膜のHodgkin-Huxleyモデルでの周期倍分岐の連鎖
- 筋肉のHodgkin-Huxley方程式の周期解の分岐
- アナログ進化型ハードウェアの研究開発
- 時変環境に対する2倍体染色体を用いた遺伝的アルゴリズム
- 自己連想ニューラルネットワークにおける誤想起の抑制 : 入力パターンへのノイズ付加による想起能力の向上
- 自己連想記憶ニューラルネットワークの引き込み領域 : 誤想起を減らす手法の提案
- 自己連想記憶ニューラルネットワークのダイナミクス
- F-043 計量学習を用いたユーザー意図学習システム(人工知能・ゲーム,一般論文)
- E-007 構文グラフ集合を用いたKey Semanticsマイニング(E.自然言語・文書・ゲーム)
- 進化型ハードウェアと産業応用
- 近傍モデル遺伝的アルゴリズムによる多目的最適化
- 遺伝的アルゴリズムを用いた光ファイバの自動調芯システム
- フォールトトレラントシステムの領域分割モデル : 冗長性固定信頼度最大化問題の定式化と解析
- pバージョン・コンフィギュレーションの信頼度最大化
- pバージョン・コンフィギュレーションの信頼度最大化
- pバージョン・コンフィギュレーションの信頼度最大化
- ICONIP'97 参加報告
- RBFを用いた進化型ハードウェアによる適応等化器
- RBFを用いた進化型ハードウェアによる適応等化器
- 遺伝的アルゴリズムを用いた時変環境におけるQ-learning
- Key semanticsマイニング、動的トピック分析によるKnowledge Organization : テキストマイニング技術の動向(テキストマイニング-最新技術動向と応用事例-)
- 銀行ネットワークの破綻リスク