摘要: NLP 中 Embedding(词嵌入) 和 Tokenizer(分词器) 分别是什么? Embedding(词嵌入)和Tokenizer(分词器)是在自然语言处理中常用的两种技术,用于将文本转换为计算机可以处理的数字表示。 Tokenizer(分词器) 是将文本转换为单词或子词序列的过程。在自然语 阅读全文
posted @ 2023-05-06 11:02 michaelchengjl 阅读(3654) 评论(0) 推荐(0) 编辑