热门标签
更多>
搜索结果
查询Tags标签: BCQ,共有 2条记录-
Benchmarking Batch Deep Reinforcement Learning Algorithms
发表时间:2019 文章要点:这篇文章主要是针对batch RL做了一个离散动作空间的benchmark,对比了DQN和一些batch RL算法的性能(DQN,REM,QR-DQN,KL-Control,BCQ)。并且把BCQ从连续动作空间改成适用离散动作空间,取得了SOTA的效果。作者得出的结论是,要想batch RL效…
2021/9/4 6:05:58 人评论 次浏览 -
Benchmarking Batch Deep Reinforcement Learning Algorithms
发表时间:2019 文章要点:这篇文章主要是针对batch RL做了一个离散动作空间的benchmark,对比了DQN和一些batch RL算法的性能(DQN,REM,QR-DQN,KL-Control,BCQ)。并且把BCQ从连续动作空间改成适用离散动作空间,取得了SOTA的效果。作者得出的结论是,要想batch RL效…
2021/9/4 6:05:58 人评论 次浏览