会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
要努力成为别人的依赖 弱弱一枚 halfyarn
半根毛线 计数er:
位小伙伴来看过~
半根毛线code
halfyarn 心若不动
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2017年8月23日
假装会python--爬取贴吧正文
摘要: 贴吧的老历史想存下来,强行python爬取一波 队友太强,躺好别动,偶尔做点副业 假装会python 基本流程: 1.爬取页面,获取页面的html源码 2.分析源码 通过正则表达式 匹配到想要的内容 3.去掉不需要的 python中 re模块 提供对正则表达式的支持
阅读全文
posted @ 2017-08-23 17:13 半根毛线
阅读(363)
评论(0)
推荐(0)
编辑
halfyarn@gmail.com