找回密码
 立即注册
首页 业界区 业界 RL · Exploration | ETD:使用时序距离构造 intrin ...

RL · Exploration | ETD:使用时序距离构造 intrinsic reward,鼓励 agent 探索

里豳朝 2025-6-4 22:59:32

  • 论文标题:Episodic Novelty Through Temporal Distance.
  • ICLR 2025,8 8 6 5 poster。
  • arxiv:https://arxiv.org/abs/2501.15418
  • pdf:https://arxiv.org/pdf/2501.15418
  • html:https://arxiv.org/html/2501.15418
  • open review:https://openreview.net/forum?id=I7DeajDEx7

目录<ul>01 论文主要内容<ul>
1.1 这篇论文关注什么,想解决什么任务
1.2 先前方法一般怎么做,有什么问题
1.3 这篇论文的 motivation,它希望解决什么 gap
1.4 这篇论文的主要 method 是什么,算法流程是什么<ul>

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册