会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading
戴墨镜的长颈鹿
博客园
首页
管理
2022年11月18日
transformer 中 tokenizer 的那些事
摘要: 我们使用bert的时候经常会用到huggingface中的tokenizers 进行文本分词,其中有很多函数,tokenizer.tokenize、tokenizer,convert_tokens_to_ids、tokenizer.encode、tokenizer、tokenizer.encode_
阅读全文
posted @ 2022-11-18 15:33 戴墨镜的长颈鹿
阅读(1900)
评论(0)
推荐(0)
编辑
公告