找回密码
 立即注册
首页 业界区 科技 Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI ...

Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI 诞生

锷稠 4 天前
论“卷”编程,还得看 Claude —— 一段 AI 进化史

今天给大家讲点新鲜事。Anthropic 家刚刚又“放大招”了,发布了 Claude Sonnet 4.5。这名字听着像诗人,实际上是个超级能肝的 AI,肝到让人类程序员都自愧不如。
1.webp
编程能力,直接封神

先来看看 Claude 4.5 的成绩单。在 SWE-bench Verified 这个考验“真本事”的编程测试里,Claude 4.5 直接冲到第一名。你说卷不卷?
2.webp
更离谱的是,这家伙能连续专注干活 30 多小时。你见过哪个程序员能连续敲一天一夜的代码还不困?AI 现在真是要把人类卷到天上去了。
比如让它写个 Slack 或 Teams 那样的聊天应用,Claude 4.5 能一口气敲出 1.1 万行代码。之前的 Claude Opus 4 和 Codex,最多也就能撑七小时。现在,AI 的“肝”已经不是人类能比的了。
Anthropic 也很自信,说 Claude 4.5 是全球最强编程模型,复杂智能体、操作电脑、推理、数学,样样都行。
3.webp
比如 OSWorld 这个测试真实计算机任务的基准,Claude 4.5 拿下了 61.4% 的高分。四个月前 Sonnet 4 还只有 42.2%,这进步速度,堪比火箭。
而且,Claude Chrome 插件还能自己在浏览器里导航、填表、处理任务,简直像个“数字劳模”。推理、金融等领域也都更强了,分数蹭蹭往上涨。
4.webp
新功能,卷出新高度

有了这么强的能力,Anthropic 当然不止发个模型就完事,还带来一堆新功能。
5.webp
具体来说:

  • Claude Code 加了“检查点”功能,随时保存进度,回退历史一键搞定
  • 终端界面焕然一新,还发布了原生 VS Code 插件
  • Claude API 增加了上下文编辑和记忆工具
  • 代码执行和文件创建直接整合到对话里
更有意思的是,Anthropic 把自家用来搭建 Claude Code 的底层基础设施也开放了,叫 Claude Agent SDK。这下,大家都能用它来造自己的“AI 小工人”了。
6.gif
今天起,开发者可以通过 Claude API 调用 claude-sonnet-4-5,价格和之前一样,每百万 tokens $3/$15,能力更强还不涨价,良心啊。
网友体验:又爱又恨

有网友 @vasumanmoza 体验后发帖:
“Claude 4.5 Sonnet 一次调用就重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个新文件。所有东西都模块化了,巨石式结构没了,意大利面条代码也清理了。结果完全跑不通,但天啊真的很优雅。”
这评价,真是“爱恨交加”。
Cursor 也说,Claude 4.5 在长周期任务上表现特别好,难怪很多用户都选它来解决最复杂的问题。
知名测评博主 Dan Shipper 也表示,新版 Sonnet 4.5 响应更快、可控性更强、也更稳定。
7.webp
安全性也得跟上

性能强是一方面,安全性也不能落下。
据说,Claude 4.5 是 Anthropic 目前对齐度最高的模型。通过更强的能力和安全训练,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。防御提示注入和减少内容误判也有了大提升。
8.webp
Imagine with Claude:AI 现场造软件

最有趣的是,Anthropic 还搞了个临时研究预览功能,叫「Imagine with Claude」。在这里,Claude 会现场生成软件,所有功能和代码都是“现炒现卖”,不是提前写好的。
不过,这功能只对 Max 订阅用户开放五天。想体验的可以去 claude.ai/imagine 逛逛。
9.gif
AI 赛道,卷无止境

今年的 AI 赛道依然是“卷王争霸”。Anthropic 估值已经 1830 亿美元,年化营收 50 亿美元,靠的就是编程软件的普及。但 OpenAI、Google Gemini 也在疯狂推新工具,程序员用户成了兵家必争之地。
再过一周就是 OpenAI 年度开发者大会,Anthropic 这时候抢先发 Claude 4.5,明摆着要给对手上压力。
联合创始人 Jared Kaplan 还透露,更先进的 Opus 模型今年晚些时候就要来了:“Anthropic 在大小模型上都能占优势。”
10.webp
争议与挑战

不过,Anthropic 也不是没有烦恼。
过去两个月,Claude 系列模型刚经历了一场“降智”风波。 用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑,连 Max 用户都中招。
虽然 Anthropic 紧急回滚了 Opus 4.1 更新,也承认了两个独立 Bug,声明“绝非为省成本故意降智”,但没补偿也没退款,GitHub 和 X 上还是出现了退订潮,不少用户转投 Codex。
这次 Claude 4.5 的发布,显然是想用硬实力挽回流失的用户。至于能不能成功,就看接下来几周的表现了。
AI 的进化史就是一部“卷王争霸史”。Claude 4.5 这波操作,怎么看都像是 AI 圈的“肝帝”上线。你要是觉得自己够卷,不妨和它比比?

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册