登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
博客
发1篇日志+1圆
记录
发1条记录+2圆币
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
VIP网盘
VIP申请
网盘
联系我们
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
大模型 Token 究竟是啥:图解大模型Token
大模型 Token 究竟是啥:图解大模型Token
[ 复制链接 ]
茹静曼
2025-6-3 10:46:39
前几天,一个朋友问我:“
大模型
中的
Token
究竟是什么?”
这确实是一个很有代表性的问题。许多人听说过 Token 这个概念,但未必真正理解它的作用和意义。思考之后,我决定写篇文章,详细解释这个话题。
我说:像
DeepSeek
和
ChatGPT
这样的超大语言模型,都有一个“刀法精湛”的小弟——
分词器(
Tokenizer
)
。
当
大模型
接
收到一段文字
。
会让
分词器
把它
切成很多个小块
。
这切出来的每一个小块就叫做一个
Token
。
比如这段话(
我喜欢唱、跳、Rap和篮球
),在大模型里可能会被切成这个样子。
像
单个汉字
,可能是一个
Token
。
两个汉字
构成的
词语
,也可能是一个
Token
。
三个字
构成的
常见短语
,也可能是一个
Token
。
一个标点符号
,也可能是一个
Token
。
一个单词
,或者是
几个字母
组成的一个
词缀
,也可能是一个
Token
。
大模型在输出文字的时候,也是一个 Token 一个 Token 的往外蹦,所以看起来可能有点像在打字一样。
朋友听完以后,好像更疑惑了:
于是,我决定换一个方式,给他通俗解释一下。
大模型的Token究竟是啥,以及为什么会是这样。
首先,请大家快速读一下这几个字:
是不是有点没有认出来,或者是需要愣两秒才可以认出来?
但是如果这些字出现在
词语
或者
成语
里,你
瞬间
就可以念出来。
那之所以会这样,是因为我们的
大脑在日常生活中
,
喜欢
把这些有含义的
词语
或者
短语
,优先作为
一个整体
来对待。
不到万不得已,不会去一个字一个字的抠。
这就导致我们对这些
词语还挺熟悉
,
单看
这些字(旯妁圳侈邯)的时候,反而会觉得
有点陌生
。
而大脑
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
茹静曼
2025-6-3 10:46:39
关注
0
粉丝关注
13
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
敖可
9984
黎瑞芝
9990
杭环
9988
4
猷咎
9988
5
凶契帽
9988
6
氛疵
9988
7
恐肩
9986
8
虽裘侪
9986
9
接快背
9986
10
里豳朝
9986
查看更多