会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Luke_Ye
博客园
首页
新随笔
联系
管理
订阅
2021年6月15日
huggingdace tokenizer踩坑
摘要: tokenizer有个私有方法_convert_token_to_id,但这个方法是不会考虑added的词表的,如果用这个函数获取额外添加的词,会返回unk的id,正确的方法是采用_convert_token_to_id_with_added_voc这个函数。
阅读全文
posted @ 2021-06-15 20:44 Luke_Ye
阅读(155)
评论(0)
推荐(0)
编辑
公告