咫噎 发表于 2026-1-30 06:16:55

谢谢分享,辛苦了

劳怡月 发表于 2026-2-4 09:37:17

前排留名,哈哈哈

醋辛 发表于 2026-2-7 04:08:18

新版吗?好像是停更了吧。

煞赶峙 发表于 2026-2-8 07:47:56

分享、互助 让互联网精神温暖你我

恶凝毛 发表于 2026-2-8 15:17:36

谢谢楼主提供!

湄圳啸 发表于 2026-2-8 17:46:49

热心回复!

峰襞副 发表于 2026-2-10 22:08:19

懂技术并乐意极积无私分享的人越来越少。珍惜

嶝扁 发表于 2026-2-13 05:16:53

谢谢分享,试用一下

表弊捞 发表于 2026-2-13 19:26:05

新版吗?好像是停更了吧。

迭婵椟 发表于 2026-2-25 04:14:05

东西不错很实用谢谢分享

表弊捞 发表于 2026-2-26 02:57:46

鼓励转贴优秀软件安全工具和文档!

迎脾 发表于 2026-2-26 08:02:38

很好很强大我过来先占个楼 待编辑

徙办 发表于 2026-3-8 04:52:31

这个有用。

虾氲叱 发表于 2026-3-9 19:20:47

热心回复!

老僻贞 发表于 2026-3-11 05:55:50

东西不错很实用谢谢分享

瞧厨 发表于 昨天 22:55

感谢分享,下载保存了,貌似很强大

阮蓄 发表于 昨天 23:01

过来提前占个楼
页: 1 [2]
查看完整版本: RL | 如何推导 MaxEnt RL(最大熵 RL)的策略形式 π(a|s) ∝ exp(Q(s, a))