魁睥 发表于 2026-1-11 10:10:00

大模型榜单周报(2026/01/10)

1. 本周概览

本周大模型领域多项技术突破引人注目,包括NVIDIA发布Rubin平台大幅降低成本、OpenAI推出健康垂直领域功能,以及上海AI Lab开源Yume1.5世界模型实现效率飞跃。同时,OpenRouter模型调用量排名出现显著变化,Claude Sonnet 4.5超越Grok Code Fast 1成为整体调用量冠军,行业格局正在发生微妙调整。
2. 重点关注事件


[*]NVIDIA于1月5日发布Rubin平台,对六款全新芯片采用软硬件极致协同设计,将推理token成本最多降低至NVIDIA Blackwell平台的十分之一,在MoE模型训练中使用的GPU数量仅为Blackwell平台的四分之一,大幅提升了AI计算经济性。
[*]OpenAI于1月7日发布ChatGPT健康功能,在ChatGPT中拥有独立空间,对话、已连接的应用和文件均与其他聊天内容隔离存储,标志着AI在垂直领域应用的进一步深化。
[*]DeepSeek R1论文于1月8日更新,增加64页内容,v2版本论文披露了R1训练全路径、「Aha Moment」的数据化验证、自适应算力分配、失败总结等核心技术细节。
[*]上海AI Lab于1月9日联合多家机构开源Yume1.5世界模型,在长视频生成中实现了近似恒定计算成本的全局记忆访问,模型推理效率提升70倍,推动了世界模型技术发展。
3. 榜单变化


[*]OpenRouter模型调用量排名:整体调用量方面,Claude Sonnet 4.5超越Grok Code Fast 1排名第一;Gemini 3 Flash Preview由第6名上升2名到第4名;MiMo-V2-Flash(free)下降两名,排名第5。编程调用量方面,Grok Code Fast 1保持第1;Claude Opus 4.5排名第2,上升2名;MiniMax M2.1新上榜排名第3。
[*]OpenRouter公司市占率排名:Google继续保持第1;Anthropic市占率上升4.3%(12.9% → 17.2%),排名升至第2;xAI、OpenAI分别位列第3、4名,OpenAI市占率上升3.1%(8.0% → 11.1%);DeepSeek份额下降4.5%(13.3% → 8.8%),排名相应下降3名位列第5;小米、MistralAI、z-AI保持第6、7、9名;MiniMax上升到第8名,替代上周Qwen的位置。
[*]图像编辑能力榜单:在Image Edit Arena中,qwen-image-edit-2511新上榜排名第9;在Artificial Analysis Image Editing Leaderboard中,Wan 2.6超过Nano Banana到榜单第5位。
[*]GPQA榜单:GPT-5.1 High、GPT-5 Medium新上榜,并列第6位。
[*]GAIA榜单:Nvidia的Nemotron-ToolOrchestra-0106和Nemotron-ToolOrchestra-0107新上榜,排名前两位。
4. OpenRouter排行榜

测评类型第一名第二名第三名模型调用量Claude Sonnet 4.5Grok Code Fast 1Gemini 2.5 Flash公司市占率GoogleAnthropicxAI编程模型调用量Grok Code Fast 1Claude Opus 4.5MiniMax M2.1各公司按不同能力领域排名汇总

测评类型领先公司大语言模型 Text ArenaGoogle、xAI、Anthropic、OpenAI、百度、智谱、阿里巴巴、月之暗面编程能力 LMArenaAnthropic、OpenAI、Google编程能力 LiveCodeBenchOpenAI、Anthropic、Google代码工程任务能力 SWE-benchLite基于Claude、Gemini、GPT、Qwen、DeepSeek开发的开源系统图像编辑和生成能力 Image Edit ArenaOpenAI、Google、字节、Reve文生图能力 Text-to-Image ArenaOpenAI、Google、Black Forest Labs、腾讯、字节图像编辑和生成能力 Image Editing LeaderboardOpenAI、Google、字节、Black Forest Labs、阿里巴巴、Reve文生图能力 Text to Image LeaderboardOpenAI、Google、Black Forest Labs、字节、ImagineArtGPQAOpenAI、Google、xAI、Anthropic、阿里巴巴FrontierMathOpenAI、Google、月之暗面、Anthropic、xAIHumanity's Last ExamGoogle、OpenAI、AnthropicGAIANvidia、Suzhou AI Lab&Shuqian Tech、Microsoft AI Asia -Ads、LR AILab of Lenovo CTO Org等关注我,第一时间掌握更多AI前沿资讯!

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

泡市 发表于 2026-1-13 21:38:32

感谢,下载保存了

敕码 发表于 2026-1-16 08:15:06

感谢分享,学习下。

步雪卉 发表于 2026-1-18 15:49:59

这个有用。

端木茵茵 发表于 2026-1-22 12:02:32

热心回复!

印萍 发表于 2026-1-23 04:36:40

感谢分享

晾棋砷 发表于 2026-1-26 02:27:31

不错,里面软件多更新就更好了

咚獭 发表于 2026-1-26 08:58:50

鼓励转贴优秀软件安全工具和文档!

兜蛇 发表于 2026-1-29 08:19:27

喜欢鼓捣这些软件,现在用得少,谢谢分享!

思矿戳 发表于 2026-1-30 02:46:36

喜欢鼓捣这些软件,现在用得少,谢谢分享!

乱蚣 发表于 2026-1-30 07:14:19

前排留名,哈哈哈

湄圳啸 发表于 2026-1-30 14:44:04

谢谢分享,辛苦了

史华乐 发表于 2026-2-7 03:00:36

这个好,看起来很实用

坪钗 发表于 2026-2-9 04:48:10

谢谢分享,试用一下

抑卞枯 发表于 2026-2-9 07:17:18

这个有用。

侧胥咽 发表于 2026-2-10 02:27:16

感谢分享,下载保存了,貌似很强大

沃盼盼 发表于 2026-2-10 09:31:52

前排留名,哈哈哈

史华乐 发表于 2026-2-10 16:25:03

感谢分享,下载保存了,貌似很强大

悯拄等 发表于 2026-2-22 04:36:11

过来提前占个楼

怀陶宁 发表于 2026-2-25 00:17:26

谢谢分享,辛苦了
页: [1] 2
查看完整版本: 大模型榜单周报(2026/01/10)