An Online Policy Gradient Algorithm for Markov Decision Processes with Continuous States and Actions
['Yao Ma', 'Tingting Zhao', 'Kohei Hatano', 'Masashi Sugiyama']
/
Neural Computation
/ Vol. 28
/ No. 3
まだレビューは投稿されていません。あなたが最初のレビューを書きませんか?