登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
1
2
/ 2 页
下一页
返回列表
首页
›
业界区
›
安全
›
DeepSeek-V3.2的DSA稀疏注意力技术:在TPU平台上的效能 ...
DeepSeek-V3.2的DSA稀疏注意力技术:在TPU平台上的效能革命与适配实践
[ 复制链接 ]
郁兰娜
2025-10-12 15:15:00
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
9 月 29 日,DeepSeek 最新发布的 DeepSeek-V3.2-Exp 模型引入了自主研发的 DeepSeek Sparse Attention(DSA)稀疏注意力机制,在几乎不影响模型性能的前提下,实现了长文本训练和推理效率的大幅提升。本文旨在深入解析 DSA 的技术原理,并重点探讨中昊芯英「刹那®」TPU 平台如何凭借其片上缓存与高度并行矩阵计算单元,在 Lightning Indexer 键缓存管理、突破「内存墙」瓶颈、提升长文本处理效率及降低推理成本等方面取得的显著收益与适配成果。
1.DSA稀疏注意力机制的技术突破
1.1 背景:如何突破传统注意力机制的瓶颈
标准自注意力(Self-Attention)机制是 Transformer 架构的核心,但其计算和内存复杂度均与序列长度 L 的平方 O(L²) 成正比。当处理长文本时,这种二次方增长的复杂度会迅速成为性能瓶颈,导致显存耗尽和计算延迟过高,限制了模型处理长序列的能力。为克服这一限制,学术界与工业界提出了多种稀疏注意力方案(即仅对部分 token 进行注意力计算),如滑动窗口注意力、块稀疏注意力、可学习稀疏模式、低秩近似等。稀疏注意力可以显著减少计算、内存开销,并提升吞吐或降低成本。DeepSeek-V3.2-Exp的核心武器DeepSeek 稀疏注意力(DSA),首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
论文地址:https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
1.2 DeepSeek稀疏注意力(DSA)核心架构
DeepSeek-V3.2-Exp 与上一版本DeepSeek-V3.1-Terminus相比,核心创新在于引入了DeepSeek 稀疏注意力(DSA)。DSA 通过筛选与当前任务高度相关的文本,而非对全部历史 token 进行全量注意力计算,从而显著提升运算效率。
DSA 主要包含两项关键技术:闪电索引器(Lightning Indexer)和细粒度稀疏注意力(Fine-grained Sparse Attention)。整体实现基于 MLA 架构,主要流程可参考 Fig.1:
Fig.1 DeepSeek-V3.2-Exp 基于MLA的注意力架构图,其中绿色部分显示了DSA如何根据索引器选择top-k键值条目
1.3 DSA两大核心组件
1.闪电索引器(Lightning Indexer)
闪电索引器负责快速、高效地为每个查询(Query)从海量候选的键(Key)中,识别出最可能相关的 Top-k 个键。闪电索引器的核心目标是以极低的计算开销完成相关键的「海选」。其实现方式如下:
低维投影:将原始高维度的 Query 和 Key 向量,通过一个独立的、可学习的线性层投影到极低的维度(例如128维)。这使得后续的相似度计算变得异常高效。
高效相似度计算:使用低维投影后的向量 qI 和 kI 计算索引分数,这也是索引器的核心作用,也即为每个查询 token(query token)计算「与前文每个 token 的相关性得分」,即索引得分 Iₜ,ₛ,公式如下:
论文指出:选择 ReLU 激活函数的主要考量是其计算上的高吞吐量(throughput),因为与 Softmax 等需要全局归一化的函数相比,ReLU 仅需进行一次简单的阈值操作,计算成本低。
2.细粒度稀疏注意力(Fine-grained Sparse Attention)
基于索引器输出的分数,token选择机制仅保留 Top-k 索引分数对应的键值对(KV),再通过注意力机制计算最终输出 uₜ(仅基于这些筛选后的「关键键值对」计算注意力)。具体工作流程为:
1). 为每个查询token ht计算索引分数{
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
DeepSeek
适配
革命
效能
台上
相关帖子
Microsoft Agent Framework 取出 DeepSeek 思考内容
tauri2.10+deepseek+vite7客户端ai系统|Tauri2+Vue3.5桌面AI程序Exe
DeepSeek 接入微信项目全纪录:从踩坑到跑通
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
Electron41+Vite8.0+DeepSeek桌面端AI助手|electron+vue3本地ai系统
Electron41+Vite8.0+DeepSeek桌面端AI助手|electron+vue3流式ai系统
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
Microsoft Agent Framework 取出 DeepSeek 思考内容
6
770
奄蜊
2026-02-25
业界
tauri2.10+deepseek+vite7客户端ai系统|Tauri2+Vue3.5桌面AI程序Exe
3
456
人弧
2026-03-09
业界
DeepSeek 接入微信项目全纪录:从踩坑到跑通
0
34
肿抢
2026-03-13
安全
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
0
89
蜴间囝
2026-03-16
安全
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
0
893
归筠溪
2026-03-16
安全
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
0
448
埤兆
2026-03-16
安全
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
0
389
飧沾
2026-03-16
安全
Jenkins 版本选型(适配 Ubuntu 22.04 + GitLab CE 17.11.7)
0
685
雨角
2026-03-16
安全
Electron41+Vite8.0+DeepSeek桌面端AI助手|electron+vue3本地ai系统
0
8
吁寂
2026-03-26
安全
Electron41+Vite8.0+DeepSeek桌面端AI助手|electron+vue3流式ai系统
0
199
巩芷琪
2026-03-26
回复
(29)
馏栩梓
2025-10-17 08:02:42
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
很好很强大 我过来先占个楼 待编辑
谭皎洁
2025-11-30 11:55:23
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢楼主提供!
呵烘稿
2025-12-22 05:10:44
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢楼主提供!
滑清怡
2025-12-26 20:49:52
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
凳舒
2026-1-10 21:19:37
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,下载保存了,貌似很强大
觞刈
2026-1-19 14:44:25
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
很好很强大 我过来先占个楼 待编辑
扎先
2026-1-21 12:53:28
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
yyds。多谢分享
啦汇
2026-1-22 12:25:42
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
不错,里面软件多更新就更好了
兑谓
2026-1-26 14:46:32
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,下载保存了,貌似很强大
跟尴
2026-1-27 08:47:54
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
这个好,看起来很实用
段干叶农
2026-1-28 03:58:01
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
过来提前占个楼
赶塑坠
2026-1-28 18:11:11
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
新版吗?好像是停更了吧。
姚望舒
2026-1-30 07:14:27
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
呵桢
2026-2-3 14:54:47
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
分享、互助 让互联网精神温暖你我
嗅叽
2026-2-4 05:22:06
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
热心回复!
甦忻愉
2026-2-4 06:38:30
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
yyds。多谢分享
劳暄美
2026-2-5 08:30:12
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,下载保存了,貌似很强大
艋佰傧
2026-2-6 12:50:36
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
前排留名,哈哈哈
党新苗
2026-2-10 20:53:10
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢分享
下一页 »
1
2
/ 2 页
下一页
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
代码
科技
签约作者
程序园优秀签约作者
发帖
郁兰娜
2026-2-10 20:53:10
关注
0
粉丝关注
22
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991125
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9522
6
韶又彤
9916
7
宋子
9878
8
荪俗
9018
9
闰咄阅
9995
10
蓬森莉
9870
查看更多
今日好文热榜
292
38岁程序员的接单平台踩坑史:从被骗到月入
141
MySQL优化全攻略:索引、SQL与分库分表的最
1
《HelloGitHub》第 120 期
247
自动类型推导
400
C# 面试高频题:装箱和拆箱是如何影响性能
450
《DNESP32P4开发指南_V1.0》第十一章 LED实
614
《DNESP32P4开发指南_V1.0》第十一章 LED实
229
《DNESP32P4开发指南_V1.0》第十一章 LED实
193
《DNESP32P4开发指南_V1.0》第十一章 LED实
213
构建企业级智能知识库:Vue3 + TypeScript
501
读2025世界前沿技术发展报告24其他飞行器
784
读2025世界前沿技术发展报告24其他飞行器
748
读2025世界前沿技术发展报告24其他飞行器
435
读2025世界前沿技术发展报告24其他飞行器
279
读2025世界前沿技术发展报告24其他飞行器
642
读2025世界前沿技术发展报告24其他飞行器
517
读2025世界前沿技术发展报告24其他飞行器
472
读2025世界前沿技术发展报告24其他飞行器
813
读2025世界前沿技术发展报告24其他飞行器
282
读2025世界前沿技术发展报告24其他飞行器