钿稳铆 发表于 2025-6-1 18:38:14

Open R1 项目进展第三期

Open R1 项目进展第三期

本次更新带来三大突破性进展:

[*]CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
[*]IOI 基准测试: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准
[*]OlympicCoder 模型: 7B/32B 双版本代码模型,在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型

下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能,其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型)
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

焦和玉 发表于 2025-10-16 15:42:07

很好很强大我过来先占个楼 待编辑

嗣伐 发表于 2025-12-13 17:16:27

感谢分享

湄圳啸 发表于 2025-12-27 20:50:06

喜欢鼓捣这些软件,现在用得少,谢谢分享!

任佳湍 发表于 2025-12-31 22:18:44

新版吗?好像是停更了吧。

闻成 发表于 2026-1-11 01:18:08

鼓励转贴优秀软件安全工具和文档!

山芷兰 发表于 2026-1-22 15:03:59

感谢,下载保存了

驼娑 发表于 2026-1-24 05:14:47

分享、互助 让互联网精神温暖你我

郗新语 发表于 2026-1-25 09:32:28

感谢分享,学习下。

俏挺喳 发表于 2026-2-5 10:40:37

前排留名,哈哈哈

背竽 发表于 2026-2-8 02:05:27

谢谢楼主提供!

愆蟠唉 发表于 2026-2-8 02:40:57

这个有用。

嗅叽 发表于 2026-2-8 10:54:44

感谢分享

僻嘶 发表于 2026-2-8 15:32:58

不错,里面软件多更新就更好了

盗衍 发表于 2026-2-9 03:10:14

用心讨论,共获提升!

驼娑 发表于 2026-2-9 03:57:38

收藏一下   不知道什么时候能用到

涅牵 发表于 2026-2-9 19:35:51

前排留名,哈哈哈

栓州 发表于 2026-2-10 22:44:11

用心讨论,共获提升!

港髁 发表于 2026-2-11 13:13:52

新版吗?好像是停更了吧。

缄戈 发表于 2026-2-11 14:48:03

谢谢楼主提供!
页: [1] 2
查看完整版本: Open R1 项目进展第三期