会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
MrDoghead
一只小白的自我修炼
博客园
首页
新随笔
联系
订阅
管理
2020年6月18日
文本预处理 Text Preprocessing
摘要: 为什么要预处理? 我们知道,大部分NLP任务都是以文本形式输入的,然鹅language is compositional!我们理解文本通常能够把文本拆分成多个构成的部分去理解,那么机器也可以这么做,而预处理就是第一步操作! 常规步骤 1. 去除不需要的格式信息 如HTML 2. 把文本拆分成句子 可
阅读全文
posted @ 2020-06-18 23:15 MrDoghead
阅读(704)
评论(0)
推荐(0)
编辑
公告