摘要: Byte Pair Encoding is Suboptimal for Language Model Pretraining 主要比较bpe算法和unigram LM tonkenize算法的优劣,主要结论是LM tonkenize算法更优 Author2Vec: A Framework for 阅读全文
posted @ 2020-04-19 22:37 kangheng 阅读(167) 评论(0) 推荐(0) 编辑