AI一周资讯 250906-250912

峰邑 · 2025-9-12 06:54:51

原文：AI一周资讯 250906-250912
Anthropic 限制对中、俄等国相关公司 AI 服务，或损数亿美元收入

9月5日，Claude背后开发商Anthropic发布《更新对不受支持地区的销售限制》公告，首次做出此类政策改变，立即停止向多数股权由中国资本持有的集团或其子公司提供Claude等AI服务。限制范围包括直接或间接由中国公司持股超50%的企业，无论运营地在哪，以及俄罗斯、伊朗、朝鲜等被美国视为“对手国家”的实体，直接客户和通过云服务访问的团体也受影响，预计对其全球收入影响达“数亿美元”，部分针对中国大陆公司在新加坡子公司访问美国技术情况。原因是涉及法律、监管和安全风险，担心这些公司利用技术推进自身AI研发并参与全球竞争。Anthropic原服务条款有地区限制但被绕过，现加强区域限制，还倡导严格出口管制等政策。

公告来源：https://www.anthropic.com/news/updating-restrictions-of-sales-to-unsupported-regions
相关报道：https://www.ft.com/content/12b8e10b-b55d-4824-817f-a3c9cfe9f779

腾讯混元游戏2.0版本发布，多项能力升级全面开放！

腾讯混元游戏视觉生成平台“混元游戏”发布2.0版本并全面开放。新增游戏图生视频、自定义模型训练、角色一键精修等能力，还提升了2D生图模型能力，文生图达游戏行业SOTA级别。平台面向所有用户，登录腾讯混元官网即可使用。混元游戏今年5月发布，是依托混元大模型的工业级AIGC游戏内容生产引擎，大幅优化游戏制作流程，提升美术设计效率。

官网介绍：https://hunyuan.tencent.com/game/

阿里超万亿参数模型Qwen3 - Max - Preview（Instruct）震撼上线

阿里首个超万亿参数模型Qwen3 - Max - Preview（Instruct）昨夜官宣上线。该模型在全球主流权威基准测试中表现卓越，占据非推理模型「C」位，碾压Claude - Opus 4等模型，各项评测成绩优异，如知识推理评测（SuperGPQA）64.6分等。其亮点众多，性能更强、知识更广，更擅长对话等，支持100 + 语言，针对RAG、工具调用进行优化。实测前端能力超越DeepSeek - V3.1。目前已正式上线阿里云百炼平台，可通过API直接调用，Qwen Chat同步上线新模型支持免费使用，在百炼平台最大支持256k上下文，依token数阶梯计费，如0 - 32k token输入0.006元/千token等。

官方链接：https://x.com/Alibaba_Qwen/status/1963991502440562976
体验地址：https://chat.qwen.ai/
Meta超级智能实验室REFRAG框架：革新RAG，高效处理长上下文

Meta超级智能实验室首篇论文提出的REFRAG框架重新定义了RAG（检索增强生成）。RAG虽能利用外部知识库辅助大型语言模型（LLM）生成答案，但处理长上下文时存在LLM处理负担重、计算冗余等问题。REFRAG是选择性压缩解码方案，通过“压缩、感知、扩展”流程优化LLM处理外部知识方式，如压缩时引入轻量级编码器生成“块嵌入”，感知时用强化学习策略网络判断关键文本块，扩展时输入含“块嵌入”和关键“原始文本块”的混合序列。该框架表现出色，推理速度TTFT最高加速30.85倍，相比先进方法提升3.75倍，在困惑度和下游任务准确率上无损失，上下文窗口等效扩大16倍，适用于RAG及多轮对话等任务，为开发高效AI应用提供重要方案。

论文：https://arxiv.org/abs/2509.01092
参考链接：https://www.reddit.com/r/singularity/comments/1nai17r/new_research_from_meta_superintelligence_labs_big/

微软开源rStar2 - Agent：小参数大能量，三大突破引领AI Agent新高度

本周微软开源AI Agent推理模型rStar2 - Agent，该模型采用创新智能体强化学习方法，仅140亿参数却在多项测试中超越高参数模型，展现强大泛化能力。它有三大技术突破：训练基础上，有隔离式高吞吐代码执行服务和动态负载均衡滚出调度器，分别保障代码执行和降低GPU空闲时间；算法上，基于GRPO提出GRPO - RoC算法，降低工具错误率、缩短推理响应长度；训练流程上，设计“非推理微调 + 多阶段强化学习”流程，降低算力成本，仅用64台MI300X GPU，1周内完成510步强化学习迭代达性能峰值。

Github：https://github.com/microsoft/rStar

OpenAI GPT - 5黑客马拉松：各团队成果大揭秘

OpenAI在发布GPT - 5后举办了GPT - 5黑客马拉松挑战赛，于8月9日上午10点至下午5点进行，500多位黑客、95支队伍参赛，角逐5万美元奖金，韩国AI初创公司Gentoo团队获大赛第一。各团队成果丰富，Gentoo团队将GPT - 5用于电商营销活动模拟，有创建“数字分身”等功能；Fashion AI团队结合扩散模型与GPT - 5为3D虚拟形象搭配造型；电子表格团队开发后台智能体编排工具；BeFreed团队开发知识可视化工具将书籍论文转化为教育视频；Serena Delarry团队开发“计算机使用模型”实现游戏与应用自动化交互；智能电网团队开发智能体式电网编排系统模拟电网运行，但关键指标表现待优化。

参考资料1：https://threadreaderapp.com/user/AlexReibman
参考资料2：http://threadreaderapp.com/
参考资料3：https://threadreaderapp.com/user/AlexReibman
参考资料4：https://x.com/jihyuk_gentoo/status/1954791809382518972

OpenAI进军电影圈，AI动画长片《Critterz》明年戛纳首映

OpenAI进军电影圈，为动画长片《Critterz》提供工具和算力支持，预计明年5月在戛纳电影节首映。该片讲述一群森林小生物在陌生人打扰村庄后踏上冒险的故事，其角色雏形由OpenAI创意专家Chad Nelson三年前用DALL - E制作短片时开始设计。制作由Nelson与伦敦和洛杉矶制片公司合作，伦敦Vertigo Films联合Native Foreign工作室完成，计划约9个月完成，预算控制在3000万美元以内。制作方式是将真人配音、艺术家绘制的概念草图等人工创作素材输入OpenAI工具（含GPT - 5和图像生成模型）进行AI化处理，剧本由曾参与《帕丁顿熊3：秘鲁大冒险》的编剧团队部分成员完成，已进入正式制作阶段，配音演员名单未来几周确定。AI生成内容本身无版权，但人类创作与AI工具结合的混合形式可能受版权保护。OpenAI希望借此片证明AI技术能支撑院线级作品制作，推动好莱坞更广泛采用AI技术、降低创作门槛。

原报道地址：https://www.wsj.com/tech/ai/openai-backs-ai-made-animated-feature-film-389f70b0?mod=tech_lead_story

国产AI图像生成工具Vidu Q1“参考生图”功能：实力强劲，解锁多场景应用

国产AI图像生成工具Vidu Q1全球上线「参考生图」功能，号称PS终结者，效果直逼谷歌Nano Banana且完胜Flux Kontext。其核心优势显著，支持单次最多7张参考图，主体一致性表现出色，还原度高；创意玩法丰富，可实现万物合成、替换及多种花样操作；还解锁了AI生产级应用，在「一致性」赛道不断进化，能适配电商广告等多行业，降低人力成本，提升创作效率。
原报道地址：不到10天，国产「香蕉」突袭！一次7图逼真还原，合成大法惊呆歪果仁
阿里新语音识别模型Qwen3 - ASR - Flash，多项性能超越竞品！

2025年9月8日，阿里发布最新语音识别模型Qwen3 - ASR - Flash，该模型基于Qwen3基座模型训练，支持11种语言和多种口音。在ASR多项基准测试中，它在方言、多语种等方面识别错误率明显低于谷歌Gemini - 2.5 - Pro等竞品。其基于海量多模态和千万小时规模ASR数据构建，能自动分辨语种、过滤非语音片段，用户还可定制结果。官方放出5个演示示例展示其复杂场景识别能力，歌词识别错误率低于8%。后续研究人员将提升通用识别精度，降低使用门槛。用户可通过ModelScope、HuggingFace和阿里云百炼API免费体验。

huggingface: https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
体验地址：https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
阿里云百炼API调用地址：https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031

百度开发者大会发布多项AI成果，实力惊艳业界

9月9日上午，百度在Wave Summit深度学习开发者大会上发布文心大模型X1.1、飞桨框架V3.2、文心快码3.5S及一系列开发组件更新。文心大模型X1.1基于文心大模型4.5训练，多项能力提升，基准测试表现佳，采用特定训练框架，可用于客服和电商直播场景，可在文心一言官网、文小言APP使用，已上线百度智能云千帆平台。飞桨文心生态发布核心框架3.2版本，升级相关套件，发布新套件和数据集，开发者达2333万位，服务企业76万家。文心快码3.5S代码生成准确率提升，已服务众多开发者与企业。飞桨与文心联合优化有重要意义，为AI与实体经济融合提供参考路径。
豆包图像创作模型 Seedream 4.0：超越 Nano Banana 的国产之光

本周豆包·图像创作模型 Seedream 4.0，它被视为 Nano Banana 的平替且部分能力更优。该模型是首个支持 4K 高清多图创作的模型，具备 4K 多模态生图等多种功能，主体一致性显著增强。可在豆包、即梦和火山方舟体验中心体验，火山方舟体验中心预计今晚上线 4K 版，企业能通过火山引擎 API 接入。其实测效果出色，在主体一致性、多图融合、连续生图方面表现优秀，能满足电商、建筑、影视、品牌设计等多领域需求。技术上采用联合训练与多模态感知，实现生成和编辑任务闭环，推理快、秒级出图且画质满足商用。它是国内唯一具备“4K 画质 + 多图合影 + 连续分镜 + 中文商用图 + 秒级出图”的一站式模型，堪称“中国版的 Nano Banana”。

体验地址：https://seed.bytedance.com/seedream4_0

字节发布 UI-TARS-2：多功能 AI 表现卓越

本周字节发布了多功能 AI 产品 UI-TARS-2，它集成操作 GUI、游戏控制、写代码、工具使用等多种功能，可协同完成复杂任务，相比 UI-TARS-1.5 在多方面能力有显著提升。其应用场景广泛，可辅助办公，也能用于玩游戏、写代码、搜索信息等。在多个评测平台上得分优于 Claude 和 OpenAI Agent，在游戏环境 15 个游戏套件中平均标准化分数达 59.8，相当于人类水平的 60%。演示中能理解指令搜索信息并构建基本可用网站，但设计和交互较单一。UI-TARS-1.5 已开源，而 UI-TARS-2 暂未开源。

论文：https://arxiv.org/pdf/2509.02544
体验地址：https://seed-tars.com/showcase/ui-tars-2/

阿里发布全新智能体开发框架 AgentScope 1.0，开启智能体开发新范式

阿里推出全新智能体开发框架 AgentScope 1.0，将智能体开发、部署、监控打包成生产线。该框架深度融合实时介入控制、智能上下文管理、高效工具调用能力。具体特性包括基于异步架构支持实时中断与自定义处理，可实现安全中断与任务流无缝续接；通过长短记忆协同重构上下文管理，运用压缩技术提炼语义主干并支持三种长期记忆管理模式；构建高效可靠的工具管理体系，采用统一接口处理工具调用并异步流式返回。其由核心框架、运行时、可视化开发工具三层架构组成，各层可独立使用，运行时和可视化工具还能兼容其他框架，且提供开箱即用示例，支持按需定制。

Github：https://github.com/agentscope-ai/agentscope

Claude新功能来袭：可直接生成办公文档！

2025年9月9日，Claude推出新功能，能直接生成Excel、PPT和PDF文档，用户可下载或存到Google Drive，变身定向办公顾问。该功能可分析上传文件数据生成报告，创建各类文件模板，支持文件格式转换，原理是利用私有计算机环境写代码、运行程序来生成文件和分析。目前此功能以预览版提供给Max、Team及Enterprise用户，Pro用户需等待几周。

官网介绍：https://www.anthropic.com/news/create-files

阿里上线超万亿参数量Qwen3 - Max预览版，大模型实力再突破

9月5日晚，阿里上线Qwen3系列最强模型Qwen3 - Max的Preview版本，这是阿里迄今最大模型，参数量超1万亿，已登陆阿里百炼平台，在通义千问应用及Qwen Chat上免费可用。该模型相较2.5系列整体通用能力大幅提升，在多项评测中超越多个竞品及阿里此前开源最佳模型；实测中其文本理解、数学、编程能力出色，响应快；API支持256k上下文，按输入token数阶梯计费，比Qwen - Max - 0919定价更有层次、性能更高且价格更实惠。此模型在内部测试和早期用户测评中表现良好，证明规模化扩展效果，其突破成为阿里AI转型王牌，代表中国大模型技术新高度。

体验地址：https://chat.qwen.ai
官网介绍：https://bailian.console.aliyun.com/?tab=model#/model-market

低成本推理模型K2 - Think开源，小参数大性能！

2025年9月10日上午，阿布扎比穆罕默德·本·扎耶德人工智能大学（MBZUAI）联合AI创企G42推出低成本推理模型K2 - Think，相关论文已发表在arXiv预印本平台，当日下午在Hugging Face、GitHub上开源。该模型有320亿参数，基于Qwen 2.5构建，性能超参数规模20倍的OpenAI和DeepSeek旗舰推理模型。在数学、编程、科学推理等性能测试中表现优异，有六大技术创新，全训练用开源数据集。部署在Cerebras晶圆级芯片WSE系统性能提升10倍。320亿参数的K2 - Think经训练可与大参数模型媲美，能缩短研究人员时间，扩大先进AI应用范围。

Github：https://github.com/MBZUAI-IFM/K2-Think-SFT 、https://github.com/MBZUAI-IFM/K2-Think-Inference
huggingface: https://huggingface.co/LLM360/K2-Think
官网介绍：https://www.k2think.ai/
论文：https://arxiv.org/abs/2509.07604

中国科学院自动化所发布类脑脉冲大模型“瞬悉1.0”，开启大模型国产自主可控新征程

中国科学院自动化研究所发布类脑脉冲大模型“瞬悉1.0”（SpikingBrain - 1.0），这是我国首次提出大规模类脑线性基础模型架构，且首次在国产GPU算力集群上构建训练和推理框架，训练和推理在国产沐曦曦云C550 GPU集群完成，连续运行2周未中断。该模型优势显著，如SpikingBrain - 7B用少量预训练数据实现高性能，推理效率高且能耗降低。其独特的架构设计包括混合高效注意力、混合专家模块和脉冲神经元。模型转换含三个环节并适配国产GPU。性能评测显示在下游任务、推理速度、计算效率和能耗方面表现出色，不过模型体验发现SpikingBrain - 76B存在一些问题。国内探索非Transformer模型架构，该模型结合国产算力有望走出大模型国产自主可控新路径。

Github：https://github.com/BICLab/SpikingBrain-7B
论文：https://github.com/BICLab/SpikingBrain-7B/blob/main/SpikingBrain_Report_Chi.pdf
体验地址：https://controller-fold-injuries-thick.trycloudflare.com/

腾讯发布CodeBuddy Code：引领AI编程迈入L4时代

9月9日，腾讯发布AI CLI工具CodeBuddy Code，同时CodeBuddy IDE开启公测，面向所有用户开放，且IDE和CLI区分国内外版本，支持不同模型。CodeBuddy Code被视为腾讯版“Claude Code”，定位于专业工程师用的CLI Agent，基于npm安装，支持自然语言驱动开发运维生命周期。AI编程工具发展分五个层次，腾讯认为2025 - 2026年将向L4级演进，2027年向L5级迈进，CLI将成下一代AI编程底层基础设施。CLI模式适用于企业级团队，有易于集成等优势，腾讯内部超90%工程师使用CodeBuddy后编码等效率显著提升。CodeBuddy Code是CLI驱动的智能编程平台，有自然语言交互等核心功能亮点。其典型工作流涵盖项目初始化等环节，未来将通过生态扩展确保企业级安全，代表企业级AI编程新方向，助开发者升级为AI协作架构师。

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

党新苗 · 2025-11-10 05:06:26

这个有用。

龙正平 · 2025-11-30 13:36:44

鼓励转贴优秀软件安全工具和文档！

姜删懔 · 2025-12-9 15:14:12

前排留名，哈哈哈

讲怔 · 5 天前

感谢发布原创作品，程序园因你更精彩

账号		自动登录	找回密码
密码			立即注册

AI一周资讯 250906-250912

相关帖子

回复

浏览过的版块

签约作者

AI一周资讯 250906-250912

相关帖子

相关推荐

回复

浏览过的版块

签约作者