找回密码
 立即注册
首页 业界区 业界 大模型 Token 究竟是啥:图解大模型Token

大模型 Token 究竟是啥:图解大模型Token

茹静曼 2025-6-3 10:46:39
前几天,一个朋友问我:“大模型中的 Token 究竟是什么?”
这确实是一个很有代表性的问题。许多人听说过 Token 这个概念,但未必真正理解它的作用和意义。思考之后,我决定写篇文章,详细解释这个话题。
1.gif

我说:像 DeepSeekChatGPT 这样的超大语言模型,都有一个“刀法精湛”的小弟——分词器(Tokenizer
2.png

大模型收到一段文字
3.png

会让分词器把它切成很多个小块
4.png

这切出来的每一个小块就叫做一个 Token
5.png

比如这段话(我喜欢唱、跳、Rap和篮球),在大模型里可能会被切成这个样子。
6.png

单个汉字,可能是一个 Token
7.png

两个汉字构成的词语,也可能是一个 Token
8.png

三个字构成的常见短语,也可能是一个 Token
9.png

一个标点符号,也可能是一个 Token
10.png

一个单词,或者是几个字母组成的一个词缀,也可能是一个 Token
11.png

大模型在输出文字的时候,也是一个 Token 一个 Token 的往外蹦,所以看起来可能有点像在打字一样。
12.gif

朋友听完以后,好像更疑惑了:
13.png

于是,我决定换一个方式,给他通俗解释一下。
大模型的Token究竟是啥,以及为什么会是这样。
首先,请大家快速读一下这几个字:
14.png

是不是有点没有认出来,或者是需要愣两秒才可以认出来?
但是如果这些字出现在词语或者成语里,你瞬间就可以念出来。
15.png

那之所以会这样,是因为我们的大脑在日常生活中喜欢把这些有含义的词语或者短语,优先作为一个整体来对待。
16.png

不到万不得已,不会去一个字一个字的抠。
17.png

这就导致我们对这些词语还挺熟悉单看这些字(旯妁圳侈邯)的时候,反而会觉得有点陌生

而大脑
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册