登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
签到
每天签到奖励2-10圆
导读
排行榜
TG频道
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
VIP申请
VIP网盘
网盘
联系我们
发帖说明
每日签到
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
Open R1 项目进展第三期
Open R1 项目进展第三期
[ 复制链接 ]
钿稳铆
2025-6-1 18:38:14
Open R1 项目进展第三期
本次更新带来三大突破性进展:
CodeForces-CoTs 数据集
: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
IOI 基准测试
: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准
OlympicCoder 模型
: 7B/32B 双版本代码模型,在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型
下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能,其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型)
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
Open
R1
项目进展
三期
相关帖子
open webui 可扩展、功能丰富且用户友好的本地部署 AI 平台
DeepSeek-R1满血版性能飙升四倍,成本大降,竟是因为……
百度正式上线 DeepSeek-R1 满血版,免费使用、免下载、免登录,百度这次良心了!
DeepSeek-R1源码解读
DeepSeek-R1详解
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
[JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
P6071 『MdOI R1』Treequery
高通QCS8550开发板 + DeepSeek-R1:打造智能化商场导购实践
Open JDK 和 Oracle JDK傻傻分不清楚
vip免费申请,1年只需15美金$
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
open webui 可扩展、功能丰富且用户友好的本地部署 AI 平台
1
236
喙审
2025-06-07
科技
DeepSeek-R1满血版性能飙升四倍,成本大降,竟是因为……
0
779
毡轩
2025-06-07
业界
百度正式上线 DeepSeek-R1 满血版,免费使用、免下载、免登录,百度这次良心了!
0
787
翁谌缜
2025-06-09
科技
DeepSeek-R1源码解读
0
407
濮阳雅爱
2025-06-20
业界
DeepSeek-R1详解
0
143
刘凤
2025-08-01
业界
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
0
495
蒙飘
2025-09-04
安全
[JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
0
72
郗新语
2025-09-19
安全
P6071 『MdOI R1』Treequery
0
231
鲫疹
2025-09-24
安全
高通QCS8550开发板 + DeepSeek-R1:打造智能化商场导购实践
0
299
仇华乐
2025-09-26
业界
Open JDK 和 Oracle JDK傻傻分不清楚
0
548
秦欣艷
2025-09-28
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
钿稳铆
2025-6-1 18:38:14
关注
0
粉丝关注
33
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994888
dage888
999994
3934307807
993690
4
富账慕
10007
5
柴古香
9992
6
匝抽
9986
7
筒濂
9980
8
孙淼淼
9989
9
凌彦慧
9985
10
崔瑜然
9984
查看更多