2019 年 8月 28 日随笔档案 - 不著人间风雨门

2019年8月28日

摘要：之前我写过一篇文章，利用bert来生成token级向量（对于中文语料来说就是字级别向量），参考我的文章：《使用BERT模型生成token级向量》。但是这样做有一个致命的缺点就是字符序列长度最长为512（包含[cls]和[sep]）。其实对于大多数语料来说已经够了，但是对于有些语料库中样本的字符序列长阅读全文

posted @ 2019-08-28 12:22 不著人间风雨门阅读(12558) 评论(4) 推荐(1) 编辑

周晓松的博客

文章已全部搬迁到个人csdb主页：blog.csdn.net/real_cactus；此外，个人站点-www.iamzxs.com（毕业后没时间管理可能会废弃），上面有联系方式，如果有问题或者建议想要和我交流而我不小心没看到博客消息，请联系我

公告