摘要: 1、nlp数据增强 同义词替换:就是在文本中随机抽取一个单词,然后再同义词库里将其替换为同义词 词嵌入替换:采取已经预训练好的单词嵌入向量,将嵌入空间中最近的邻接词作为句子中某些单词的替换。 基于TF-IDF的单词替换:TF-IDF得分低的单词是没有信息量的的词,因此可以替换,不大影响句子的原本含义 阅读全文
posted @ 2022-04-25 19:31 Jary霸 阅读(356) 评论(0) 推荐(0) 编辑