会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
三分天涯
博客园
首页
新随笔
联系
订阅
管理
2019年10月26日
数据挖掘笔记(二)
摘要: 三、数据提取方法 1、基本概念 数据提取就是从响应中获取我们想要的的数据的过程 数据分类: 非结构化数据:HTML等 处理方法:正则表达式、xpath 结构化数据:json、xml等 处理方法:转化为Python数据类型 2、正则表达式复习 . 匹配 \n: In [2]: re.findall("
阅读全文
posted @ 2019-10-26 16:28 三分天涯
阅读(201)
评论(0)
推荐(0)
编辑