会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
wei_hu
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2018年2月8日
3.非结构化数据与结构化数据提取
摘要: 页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据 和 结构化的数据。 非结构化数据:先有数据,再有结构, 结构化数据:先有结构、再有数据 不同类型的数据,我们需要采用不同的方式来处理。 非结构化的数据处理 正则表达式
阅读全文
posted @ 2018-02-08 15:28 wei_hu
阅读(15159)
评论(0)
推荐(0)
编辑