摘要: 为什么要预处理? 我们知道,大部分NLP任务都是以文本形式输入的,然鹅language is compositional!我们理解文本通常能够把文本拆分成多个构成的部分去理解,那么机器也可以这么做,而预处理就是第一步操作! 常规步骤 1. 去除不需要的格式信息 如HTML 2. 把文本拆分成句子 可 阅读全文
posted @ 2020-06-18 23:15 MrDoghead 阅读(704) 评论(0) 推荐(0) 编辑