RL · Exploration | ETD:使用时序距离构造 intrinsic reward,鼓励 agent 探索
[*]论文标题:Episodic Novelty Through Temporal Distance.
[*]ICLR 2025,8 8 6 5 poster。
[*]arxiv:https://arxiv.org/abs/2501.15418
[*]pdf:https://arxiv.org/pdf/2501.15418
[*]html:https://arxiv.org/html/2501.15418
[*]open review:https://openreview.net/forum?id=I7DeajDEx7
目录<ul>01 论文主要内容<ul>
1.1 这篇论文关注什么,想解决什么任务
1.2 先前方法一般怎么做,有什么问题
1.3 这篇论文的 motivation,它希望解决什么 gap
1.4 这篇论文的主要 method 是什么,算法流程是什么<ul>
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页:
[1]