AI知识分享
✿导航
基础
基础
人工智能
神经网络
机器学习
深度学习
强化学习
自然语言处理
计算机视觉
读书笔记
读书笔记
大模型基础
动手学深度学习
文章
文章
理论理解
工程实践
应用开发
课程
课程
AI For Everyone
AIGC_2024大会
AIGC_2025大会
框架
框架
Transformer
Pytorch
HuggingFace
技术
技术
蒸馏
RAG
目标检测
MCP
方法论
方法论
概念
应用
应用
意图识别
工具
Transformer - Tokenizers
语境化嵌入
每个输入标记一个嵌入,但处理时考虑所有其他标记。
输出可以是语境化嵌入,也可以由模型用来创建输出。
对于生成模型,此输出可以是标记。
标记化级别
注意符号用多个字节表。
大多数语言模型使用SubWord标记。
Prev
Transformer - Encoding and Decoding Context with Attention
Next
Transformer - 架构