Powered by Engineering Brain, Japan | What is PKV? | PKV Methodology | KnowledgeRank v4.0.0: PKV Trends of My Authored Papers Are Now Available on My Page

An Online Policy Gradient Algorithm for Markov Decision Processes with Continuous States and Actions

['Yao Ma', 'Tingting Zhao', 'Kohei Hatano', 'Masashi Sugiyama']   /   Neural Computation / Vol. 28 / No. 3
0.0 / 5
0 件のレビュー
レビュー投稿、編集、削除にはログインが必要です。
ログイン
評価の内訳
5
0%
4
0%
3
0%
2
0%
1
0%

まだレビューは投稿されていません。あなたが最初のレビューを書きませんか?