找回密码
 立即注册
首页 业界区 安全 AI一周资讯 250906-250912

AI一周资讯 250906-250912

峰邑 5 小时前
1.png

原文:AI一周资讯 250906-250912
Anthropic 限制对中、俄等国相关公司 AI 服务,或损数亿美元收入

9月5日,Claude背后开发商Anthropic发布《更新对不受支持地区的销售限制》公告,首次做出此类政策改变,立即停止向多数股权由中国资本持有的集团或其子公司提供Claude等AI服务。限制范围包括直接或间接由中国公司持股超50%的企业,无论运营地在哪,以及俄罗斯、伊朗、朝鲜等被美国视为“对手国家”的实体,直接客户和通过云服务访问的团体也受影响,预计对其全球收入影响达“数亿美元”,部分针对中国大陆公司在新加坡子公司访问美国技术情况。原因是涉及法律、监管和安全风险,担心这些公司利用技术推进自身AI研发并参与全球竞争。Anthropic原服务条款有地区限制但被绕过,现加强区域限制,还倡导严格出口管制等政策。

  • 公告来源:https://www.anthropic.com/news/updating-restrictions-of-sales-to-unsupported-regions
  • 相关报道:https://www.ft.com/content/12b8e10b-b55d-4824-817f-a3c9cfe9f779
腾讯混元游戏2.0版本发布,多项能力升级全面开放!

腾讯混元游戏视觉生成平台“混元游戏”发布2.0版本并全面开放。新增游戏图生视频、自定义模型训练、角色一键精修等能力,还提升了2D生图模型能力,文生图达游戏行业SOTA级别。平台面向所有用户,登录腾讯混元官网即可使用。混元游戏今年5月发布,是依托混元大模型的工业级AIGC游戏内容生产引擎,大幅优化游戏制作流程,提升美术设计效率。

  • 官网介绍:https://hunyuan.tencent.com/game/
2.gif

阿里超万亿参数模型Qwen3 - Max - Preview(Instruct)震撼上线

阿里首个超万亿参数模型Qwen3 - Max - Preview(Instruct)昨夜官宣上线。该模型在全球主流权威基准测试中表现卓越,占据非推理模型「C」位,碾压Claude - Opus 4等模型,各项评测成绩优异,如知识推理评测(SuperGPQA)64.6分等。其亮点众多,性能更强、知识更广,更擅长对话等,支持100 + 语言,针对RAG、工具调用进行优化。实测前端能力超越DeepSeek - V3.1。目前已正式上线阿里云百炼平台,可通过API直接调用,Qwen Chat同步上线新模型支持免费使用,在百炼平台最大支持256k上下文,依token数阶梯计费,如0 - 32k token输入0.006元/千token等。
3.jpeg

官方链接:https://x.com/Alibaba_Qwen/status/1963991502440562976
体验地址:https://chat.qwen.ai/
Meta超级智能实验室REFRAG框架:革新RAG,高效处理长上下文

Meta超级智能实验室首篇论文提出的REFRAG框架重新定义了RAG(检索增强生成)。RAG虽能利用外部知识库辅助大型语言模型(LLM)生成答案,但处理长上下文时存在LLM处理负担重、计算冗余等问题。REFRAG是选择性压缩解码方案,通过“压缩、感知、扩展”流程优化LLM处理外部知识方式,如压缩时引入轻量级编码器生成“块嵌入”,感知时用强化学习策略网络判断关键文本块,扩展时输入含“块嵌入”和关键“原始文本块”的混合序列。该框架表现出色,推理速度TTFT最高加速30.85倍,相比先进方法提升3.75倍,在困惑度和下游任务准确率上无损失,上下文窗口等效扩大16倍,适用于RAG及多轮对话等任务,为开发高效AI应用提供重要方案。

  • 论文:https://arxiv.org/abs/2509.01092
  • 参考链接:https://www.reddit.com/r/singularity/comments/1nai17r/new_research_from_meta_superintelligence_labs_big/
微软开源rStar2 - Agent:小参数大能量,三大突破引领AI Agent新高度

本周微软开源AI Agent推理模型rStar2 - Agent,该模型采用创新智能体强化学习方法,仅140亿参数却在多项测试中超越高参数模型,展现强大泛化能力。它有三大技术突破:训练基础上,有隔离式高吞吐代码执行服务和动态负载均衡滚出调度器,分别保障代码执行和降低GPU空闲时间;算法上,基于GRPO提出GRPO - RoC算法,降低工具错误率、缩短推理响应长度;训练流程上,设计“非推理微调 + 多阶段强化学习”流程,降低算力成本,仅用64台MI300X GPU,1周内完成510步强化学习迭代达性能峰值。
4.webp


  • Github:https://github.com/microsoft/rStar
OpenAI GPT - 5黑客马拉松:各团队成果大揭秘

OpenAI在发布GPT - 5后举办了GPT - 5黑客马拉松挑战赛,于8月9日上午10点至下午5点进行,500多位黑客、95支队伍参赛,角逐5万美元奖金,韩国AI初创公司Gentoo团队获大赛第一。各团队成果丰富,Gentoo团队将GPT - 5用于电商营销活动模拟,有创建“数字分身”等功能;Fashion AI团队结合扩散模型与GPT - 5为3D虚拟形象搭配造型;电子表格团队开发后台智能体编排工具;BeFreed团队开发知识可视化工具将书籍论文转化为教育视频;Serena Delarry团队开发“计算机使用模型”实现游戏与应用自动化交互;智能电网团队开发智能体式电网编排系统模拟电网运行,但关键指标表现待优化。

  • 参考资料1:https://threadreaderapp.com/user/AlexReibman
  • 参考资料2:http://threadreaderapp.com/
  • 参考资料3:https://threadreaderapp.com/user/AlexReibman
  • 参考资料4:https://x.com/jihyuk_gentoo/status/1954791809382518972
OpenAI进军电影圈,AI动画长片《Critterz》明年戛纳首映

OpenAI进军电影圈,为动画长片《Critterz》提供工具和算力支持,预计明年5月在戛纳电影节首映。该片讲述一群森林小生物在陌生人打扰村庄后踏上冒险的故事,其角色雏形由OpenAI创意专家Chad Nelson三年前用DALL - E制作短片时开始设计。制作由Nelson与伦敦和洛杉矶制片公司合作,伦敦Vertigo Films联合Native Foreign工作室完成,计划约9个月完成,预算控制在3000万美元以内。制作方式是将真人配音、艺术家绘制的概念草图等人工创作素材输入OpenAI工具(含GPT - 5和图像生成模型)进行AI化处理,剧本由曾参与《帕丁顿熊3:秘鲁大冒险》的编剧团队部分成员完成,已进入正式制作阶段,配音演员名单未来几周确定。AI生成内容本身无版权,但人类创作与AI工具结合的混合形式可能受版权保护。OpenAI希望借此片证明AI技术能支撑院线级作品制作,推动好莱坞更广泛采用AI技术、降低创作门槛。

  • 原报道地址:https://www.wsj.com/tech/ai/openai-backs-ai-made-animated-feature-film-389f70b0?mod=tech_lead_story
国产AI图像生成工具Vidu Q1“参考生图”功能:实力强劲,解锁多场景应用

国产AI图像生成工具Vidu Q1全球上线「参考生图」功能,号称PS终结者,效果直逼谷歌Nano Banana且完胜Flux Kontext。其核心优势显著,支持单次最多7张参考图,主体一致性表现出色,还原度高;创意玩法丰富,可实现万物合成、替换及多种花样操作;还解锁了AI生产级应用,在「一致性」赛道不断进化,能适配电商广告等多行业,降低人力成本,提升创作效率。
原报道地址:不到10天,国产「香蕉」突袭!一次7图逼真还原,合成大法惊呆歪果仁
阿里新语音识别模型Qwen3 - ASR - Flash,多项性能超越竞品!

2025年9月8日,阿里发布最新语音识别模型Qwen3 - ASR - Flash,该模型基于Qwen3基座模型训练,支持11种语言和多种口音。在ASR多项基准测试中,它在方言、多语种等方面识别错误率明显低于谷歌Gemini - 2.5 - Pro等竞品。其基于海量多模态和千万小时规模ASR数据构建,能自动分辨语种、过滤非语音片段,用户还可定制结果。官方放出5个演示示例展示其复杂场景识别能力,歌词识别错误率低于8%。后续研究人员将提升通用识别精度,降低使用门槛。用户可通过ModelScope、HuggingFace和阿里云百炼API免费体验。

  • huggingface: https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
  • 体验地址:https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
  • 阿里云百炼API调用地址:https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031
百度开发者大会发布多项AI成果,实力惊艳业界

9月9日上午,百度在Wave Summit深度学习开发者大会上发布文心大模型X1.1、飞桨框架V3.2、文心快码3.5S及一系列开发组件更新。文心大模型X1.1基于文心大模型4.5训练,多项能力提升,基准测试表现佳,采用特定训练框架,可用于客服和电商直播场景,可在文心一言官网、文小言APP使用,已上线百度智能云千帆平台。飞桨文心生态发布核心框架3.2版本,升级相关套件,发布新套件和数据集,开发者达2333万位,服务企业76万家。文心快码3.5S代码生成准确率提升,已服务众多开发者与企业。飞桨与文心联合优化有重要意义,为AI与实体经济融合提供参考路径。
豆包图像创作模型 Seedream 4.0:超越 Nano Banana 的国产之光

本周豆包·图像创作模型 Seedream 4.0,它被视为 Nano Banana 的平替且部分能力更优。该模型是首个支持 4K 高清多图创作的模型,具备 4K 多模态生图等多种功能,主体一致性显著增强。可在豆包、即梦和火山方舟体验中心体验,火山方舟体验中心预计今晚上线 4K 版,企业能通过火山引擎 API 接入。其实测效果出色,在主体一致性、多图融合、连续生图方面表现优秀,能满足电商、建筑、影视、品牌设计等多领域需求。技术上采用联合训练与多模态感知,实现生成和编辑任务闭环,推理快、秒级出图且画质满足商用。它是国内唯一具备“4K 画质 + 多图合影 + 连续分镜 + 中文商用图 + 秒级出图”的一站式模型,堪称“中国版的 Nano Banana”。

  • 体验地址:https://seed.bytedance.com/seedream4_0
字节发布 UI-TARS-2:多功能 AI 表现卓越

本周字节发布了多功能 AI 产品 UI-TARS-2,它集成操作 GUI、游戏控制、写代码、工具使用等多种功能,可协同完成复杂任务,相比 UI-TARS-1.5 在多方面能力有显著提升。其应用场景广泛,可辅助办公,也能用于玩游戏、写代码、搜索信息等。在多个评测平台上得分优于 Claude 和 OpenAI Agent,在游戏环境 15 个游戏套件中平均标准化分数达 59.8,相当于人类水平的 60%。演示中能理解指令搜索信息并构建基本可用网站,但设计和交互较单一。UI-TARS-1.5 已开源,而 UI-TARS-2 暂未开源。

  • 论文:https://arxiv.org/pdf/2509.02544
  • 体验地址:https://seed-tars.com/showcase/ui-tars-2/
阿里发布全新智能体开发框架 AgentScope 1.0,开启智能体开发新范式

阿里推出全新智能体开发框架 AgentScope 1.0,将智能体开发、部署、监控打包成生产线。该框架深度融合实时介入控制、智能上下文管理、高效工具调用能力。具体特性包括基于异步架构支持实时中断与自定义处理,可实现安全中断与任务流无缝续接;通过长短记忆协同重构上下文管理,运用压缩技术提炼语义主干并支持三种长期记忆管理模式;构建高效可靠的工具管理体系,采用统一接口处理工具调用并异步流式返回。其由核心框架、运行时、可视化开发工具三层架构组成,各层可独立使用,运行时和可视化工具还能兼容其他框架,且提供开箱即用示例,支持按需定制。
5.webp


  • Github:https://github.com/agentscope-ai/agentscope
Claude新功能来袭:可直接生成办公文档!

2025年9月9日,Claude推出新功能,能直接生成Excel、PPT和PDF文档,用户可下载或存到Google Drive,变身定向办公顾问。该功能可分析上传文件数据生成报告,创建各类文件模板,支持文件格式转换,原理是利用私有计算机环境写代码、运行程序来生成文件和分析。目前此功能以预览版提供给Max、Team及Enterprise用户,Pro用户需等待几周。

  • 官网介绍:https://www.anthropic.com/news/create-files
阿里上线超万亿参数量Qwen3 - Max预览版,大模型实力再突破

9月5日晚,阿里上线Qwen3系列最强模型Qwen3 - Max的Preview版本,这是阿里迄今最大模型,参数量超1万亿,已登陆阿里百炼平台,在通义千问应用及Qwen Chat上免费可用。该模型相较2.5系列整体通用能力大幅提升,在多项评测中超越多个竞品及阿里此前开源最佳模型;实测中其文本理解、数学、编程能力出色,响应快;API支持256k上下文,按输入token数阶梯计费,比Qwen - Max - 0919定价更有层次、性能更高且价格更实惠。此模型在内部测试和早期用户测评中表现良好,证明规模化扩展效果,其突破成为阿里AI转型王牌,代表中国大模型技术新高度。

  • 体验地址:https://chat.qwen.ai
  • 官网介绍:https://bailian.console.aliyun.com/?tab=model#/model-market
低成本推理模型K2 - Think开源,小参数大性能!

2025年9月10日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G42推出低成本推理模型K2 - Think,相关论文已发表在arXiv预印本平台,当日下午在Hugging Face、GitHub上开源。该模型有320亿参数,基于Qwen 2.5构建,性能超参数规模20倍的OpenAI和DeepSeek旗舰推理模型。在数学、编程、科学推理等性能测试中表现优异,有六大技术创新,全训练用开源数据集。部署在Cerebras晶圆级芯片WSE系统性能提升10倍。320亿参数的K2 - Think经训练可与大参数模型媲美,能缩短研究人员时间,扩大先进AI应用范围。

  • Github:https://github.com/MBZUAI-IFM/K2-Think-SFT 、https://github.com/MBZUAI-IFM/K2-Think-Inference
  • huggingface: https://huggingface.co/LLM360/K2-Think
  • 官网介绍:https://www.k2think.ai/
  • 论文:https://arxiv.org/abs/2509.07604
中国科学院自动化所发布类脑脉冲大模型“瞬悉1.0”,开启大模型国产自主可控新征程

中国科学院自动化研究所发布类脑脉冲大模型“瞬悉1.0”(SpikingBrain - 1.0),这是我国首次提出大规模类脑线性基础模型架构,且首次在国产GPU算力集群上构建训练和推理框架,训练和推理在国产沐曦曦云C550 GPU集群完成,连续运行2周未中断。该模型优势显著,如SpikingBrain - 7B用少量预训练数据实现高性能,推理效率高且能耗降低。其独特的架构设计包括混合高效注意力、混合专家模块和脉冲神经元。模型转换含三个环节并适配国产GPU。性能评测显示在下游任务、推理速度、计算效率和能耗方面表现出色,不过模型体验发现SpikingBrain - 76B存在一些问题。国内探索非Transformer模型架构,该模型结合国产算力有望走出大模型国产自主可控新路径。

  • Github:https://github.com/BICLab/SpikingBrain-7B
  • 论文:https://github.com/BICLab/SpikingBrain-7B/blob/main/SpikingBrain_Report_Chi.pdf
  • 体验地址:https://controller-fold-injuries-thick.trycloudflare.com/
腾讯发布CodeBuddy Code:引领AI编程迈入L4时代

9月9日,腾讯发布AI CLI工具CodeBuddy Code,同时CodeBuddy IDE开启公测,面向所有用户开放,且IDE和CLI区分国内外版本,支持不同模型。CodeBuddy Code被视为腾讯版“Claude Code”,定位于专业工程师用的CLI Agent,基于npm安装,支持自然语言驱动开发运维生命周期。AI编程工具发展分五个层次,腾讯认为2025 - 2026年将向L4级演进,2027年向L5级迈进,CLI将成下一代AI编程底层基础设施。CLI模式适用于企业级团队,有易于集成等优势,腾讯内部超90%工程师使用CodeBuddy后编码等效率显著提升。CodeBuddy Code是CLI驱动的智能编程平台,有自然语言交互等核心功能亮点。其典型工作流涵盖项目初始化等环节,未来将通过生态扩展确保企业级安全,代表企业级AI编程新方向,助开发者升级为AI协作架构师。


来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册