方策勾配に基づく効率の良い課題非依存な強化学習法(創発システム,<特集>人工知能分野における博士論文)