热门标签
更多>
搜索结果
查询Tags标签: MCTS,共有 2条记录-
Learning and Planning in Complex Action Spaces
发表时间:2021 文章要点:文章想说,在动作空间很大或者连续的时候,想要枚举所有动作来做MCTS是不现实的。作者提出了sample-based policy iteration framework,通过采用的方式来做MCTS(Sampled MuZero)。大概思路就是说,在MCTS里面扩展动作的时候,并不枚举所有动作…
2021/8/19 6:06:23 人评论 次浏览 -
Learning and Planning in Complex Action Spaces
发表时间:2021 文章要点:文章想说,在动作空间很大或者连续的时候,想要枚举所有动作来做MCTS是不现实的。作者提出了sample-based policy iteration framework,通过采用的方式来做MCTS(Sampled MuZero)。大概思路就是说,在MCTS里面扩展动作的时候,并不枚举所有动作…
2021/8/19 6:06:23 人评论 次浏览