找回密码
 立即注册
首页 业界区 科技 Claude 封杀中国后,我终于找到了平替!

Claude 封杀中国后,我终于找到了平替!

任俊慧 前天 03:20

大家好,我是程序员鱼皮。国庆节本来想好好休息的,结果因为 AI 圈的疯狂内卷被迫加班。

就在这两天,AI 大模型界像约好了一样,扎堆发布新模型。9 月 29 日 DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价;9 月 30 日 Claude 4.5 紧随其后发布;而同样是 9 月 30 日,号称 “国内最好的编程模型” 智谱 GLM-4.6 也跟着发布了!

这下好了,整个 AI 圈又又又又沸腾了。

1.png

作为一个天天用 AI 写代码的中毒患者,看到这么多新模型发布,我也是有点儿小激动。

到底新模型的编程能力怎么样?谁才是目前最好的编程模型呢?

我一向不喜欢空谈理论,不妨直接从项目实战的角度,给大家来个横向对比测试,看看 DeepSeek 3.2、Claude-4.5-sonnet、GLM-4.6 这三个模型的编码能力到底谁更强!

 

3 大模型争霸赛

这次我从程序员的主要工作出发,设计了 3 个不同角度的实验,全方位考验这些模型的编程能力:

  1. 第一轮:从 0 开始新项目 - 测试模型从零构建完整项目的能力,包含前后端开发

  2. 第二轮:给老项目新增功能 - 测试模型理解现有代码并扩展功能的能力

  3. 第三轮:Bug 排查与修复 - 测试模型在复杂项目中定位和解决问题的能力

为了保证测试的公平性,我统一使用 Claude Code 作为 AI 编程工具来进行测试,可以通过修改环境变量的方式指定使用的大模型。

比如想要使用智谱的 GLM-4.6,可以参考官方的接入文档,在打开 Claude Code 前执行下列命令修改环境变量:

接入文档:https://docs.bigmodel.cn/cn/guide/develop/claude

  1. export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic<br>export ANTHROPIC_AUTH_TOKEN=YOUR API Key
复制代码

 

然后进入项目目录并执行 claude 命令就可以了,国内也可以愉快地使用 Claude Code~

2.png

 

我给每轮测试、每种大模型单独准备了一个目录,防止互相干扰:

3.png

 

好了,准备工作做完,下面进入正式测试环节。

 

第一轮:从 0 开始新项目

几个月前我测试 Claude 4 的时候,AI 大模型生成后端代码的本事还不强,这次我决定加大难度,测试纯用 AI 一次性生成包含完整前后端的网站。

就让 AI 做个实用的图片压缩小工具吧,提示词如下:

  1. 请生成一个《图片压缩工具》网站,实现图片压缩处理功能。需要包含完整的前端和后端代码,要求项目可以正常运行。<br>​<br>需要实现的功能:<br>1. 支持常见图片格式(JPG、PNG、WebP 等)的上传与压缩<br>2. 可设置压缩质量(如高 / 中 / 低或自定义百分比)<br>3. 显示原始图片与压缩后图片的对比(尺寸、大小、预览图)<br>4. 压缩完成后提供下载按钮,支持批量处理<br>​<br>设计要求:<br>1. 现代简约风格,主色调使用绿色<br>2. 响应式布局,在手机和桌面设备上均有良好体验<br>3. 上传区域有明显的拖放提示,操作流程直观清晰
复制代码

 

点击执行后,3 个大模型都很快给出了任务规划,思路都差不多,都是先搭建后端、再实现前端、前后端联调、最后测试运行:

4.png

 

但是执行速度差别就很明显了。GLM-4.6 最快,5 分钟内就完成了任务,而且还自动帮我安装好了依赖,贴心~

5.png

 

Claude 4.5 虽然花了 7 分钟才完成,但仔细一看,它有 3 分钟在生成各种文档,属于是把简单的事情搞复杂了,而且也没有自动安装依赖。

DeepSeek V3.2 就比较慢了,足足花了 10 分钟!

6.png

 

下面我们将分别从生成 代码结构、界面样式、网站功能 这 3 个角度来对比大模型的代码生成效果。

从代码结构来看,DeepSeek 最简单,就是基础的前后端文件;GLM 额外整理了前端代码结构,并且提供了启动脚本;而 Claude 的项目结构最规范,前后端分别放在了不同的目录中,前端还用了 React 框架,也提供了启动脚本,光文档就生成了 7 个!

7.png

 

我把 3 个项目都运行起来,先看看界面:

8.png

 

显然 Claude 做的确实更精致一些,页面看起来更专业。但能不能正常使用才是关键,我选了同一张图片来测试压缩效果:

9.png

 

选择图片后,我认为 Claude 的体验最好,已选中的文件就在选择图片按钮的下方,很自然;GLM 的样式也不错,布局合理;DeepSeek 就有点儿敷衍了,放了个照相机的 Emoji
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册