524 強化学習によるロボット移動経路の探索(GS-15・16 移動ロボット)
スポンサーリンク
概要
- 論文の詳細を見る
The purpose of this paper is to discuss path search of robots by reinforcement learning in the variable environment. Conventional reinforcement learning is assumed that the environment on where a robot works does not change. Therefore, a robot has to learn from scratch if it encounters new environments. An empirical study on the process of reinforcement learning is method.
- 一般社団法人日本機械学会の論文
- 2001-03-16
著者
-
大橋 美奈子
大阪産業大学工学部
-
竹口 知男
大阪産業大学工学部
-
能勢 和夫
大阪産業大学
-
今井 弘之
摂南大学
-
竹口 知男
大産大
-
小尻 一憲
大産大院
-
大橋 美奈子
大産大
-
能勢 和夫
大産大
-
竹口 知男
大阪産業大学
-
能勢 和夫
大阪産大
関連論文
- 状態方程式に基づく市街地幹線道路の旅行時間予測
- 車庫入れ操作最適化のための多段階探索ACO法
- モザイク標本化とSOMによる被塗装物形状識別法
- 進化的計算法による被塗装物形状識別法 : 第1報, 遺伝的アルゴリズムと2段階ニューラルネットワークの組み合わせ
- 討 17 新しい制御技術を用いた圧延板厚制御方法(III 圧延における計測制御, 第 111 回 講演大会討論会講演概要)
- A-16-51 インターネットを利用した遠隔操作ロボットシステムの構築
- システム工学的手法によるバッチ炉炉温パタ-ンの最適化
- 鋼塊内部温度推定とそれに基づく均熱炉最適炉温パターンの検討(温度計測・推定技術)(鉄鋼製造のための新しい計測技術)
- 111 伝達部にコンプライアンスのあるシステムにおける摩擦補償について
- 繰り返し工程を有するジョブショップスケジューリング問題への遺伝的アルゴリズムの適用
- 演題8. 離散フィードバック情報の効果に関する研究(第23回日本バイオフィードバック学会総会演題抄録)(一般発表)
- 1524 進化アルゴリズムによる摩擦補償
- 524 強化学習によるロボット移動経路の探索(GS-15・16 移動ロボット)
- エア制御を用いたモノ作り : ロボットハンドの製作
- 1010 聴覚障害者支援システムに関する研究 : 警報音携帯通知システム
- 8A11 聴覚障害者に対する支援システムの研究 : 聴覚的情景分析を用いた生活必要音の識別
- 4107 異常時における石油生産・物流システムの運用最適化(OS4 環境適応型知的人工システム)
- 分散エージェントによる清涼飲料水製造のスケジューリング
- システム制御理論の連鋳湯面レベル制御への応用
- 圧延プロセスの制御理論の応用
- 高速道路の最適流入制御への進化計算手法の適用
- 6N-1 アントコロニー最適化法による生産スケジューリングの最適化(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 音楽配信サービスにおける購買行動意思決定モデル
- 環境音識別のための特徴量抽出方法の検討
- 3V-2 限定的同意語を用いたアンケート自由回答分類(文章・感情,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 6N-2 グリッド環境下における処理順制約を考慮したタスクスケジューリングの最適化(群知能と複雑ネットワーク,学生セッション,ソフトウェア科学・工学,情報処理学会創立50周年記念)
- 技術受容モデルに基づく動画サイト利用者の意識調査
- 限定的同意語特定によるアンケート自由記述分類システム
- ニューラルネットによる環境音識別のための音源データ抽出方法の検討
- B-7-35 データグリッドシステムの最適設計に関する研究 : ファイル複製配置とジョブスケジューリングの最適化(B-7. 情報ネットワーク,一般セッション)
- デッドビ-ト制御 (ディジタル制御)
- 大阪産業大学工学部情報システム工学科
- 制御系における状況認識と行動判断に関する研究 (長期的共同研究組織中間報告(2000年度))
- 制御系における状況認識と行動判断に関する研究 (長期的共同研究組織中間報告)
- 制御系における状況認識と行動判断に関する研究 (長期的共同研究組織中間報告)
- D-2-17 ソフトコンピューティングを用いた2足歩行制御システム構築の試み
- 長期的共同研究組織成果報告(平成13年度)制御系における状況認識と行動判断に関する研究
- GA&ニューラルネットを用いた加工対象物の形状識別システム
- 遺伝的アルゴリズムとニューラルネットワークを用いた被塗装物の形状識別
- 動画共有サイト利用者の意思決定モデルの検討
- 3次元画像流体計測法におけるトモグラフィ再構成法の適用