会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
大大黄小菜鸟
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2018年3月7日
python爬取糗事百科段子
摘要: 今天尝试了一下用python3加正则表达式爬取糗事百科的内容,让我们一起来看一下: 我们的目标是爬取用户名和所对应的段子内容 首先来观察网站,进入糗事百科首页。 (1)鼠标放在用户名上右键点“检查”: 通过观察可以得到用户名的正则表达式:userpart为'target="_blank" oncli
阅读全文
posted @ 2018-03-07 17:15 大大黄小菜鸟
阅读(183)
评论(0)
推荐(0)
编辑
python爬取京东手机图片
摘要: 关于爬取京东手机图片:之前一直使用python2加xpath来完成这个任务。本篇介绍如何使用python3加正则表达式来完成。使用的书籍《精通Python网络爬虫》中的案例代码不太适用了,在这里稍作改进。 首先来观察网站,进入京东首页,点击“手机/运营商/数码”中的手机,再点击“热门分类”中的“全部
阅读全文
posted @ 2018-03-07 11:22 大大黄小菜鸟
阅读(277)
评论(0)
推荐(0)
编辑