会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
奔跑的蜗牛·老牛同学
奔跑的蜗牛,记录的点滴:
https://ntopic.cn
博客园
首页
新随笔
联系
订阅
管理
2024年11月1日
深入解析 Transformers 框架(三):Qwen2.5 大模型的 AutoTokenizer 技术细节
摘要:
本文是 Transformers 推理大语言模型技术细节的第 3 篇,基于 Qwen2.5 大模型,通过源代码走读,详细介绍了 AutoTokenizer 的分词器初始化、存储流程和技术细节。文章涵盖分词器的配置解析、字节对编码(BPE)分词算法,以及分词、编码、解码和添加 Token 等常用操作……
阅读全文
posted @ 2024-11-01 20:24 老牛啊
阅读(288)
评论(0)
推荐(0)
编辑
公告
奔跑的蜗牛
博客:
https://ntopic.cn