摘要: Import urllib.request 正常爬取网页: url=网址 +代表 下面测试一下: 结果我就不显示了 令html为读取后的对象 先用正则表达式抓取数据 Import re 令rule是抓取的规则 测试一下: 阅读全文
posted @ 2018-01-21 16:14 我爱在伊甸园吃苹果 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 请求浏览器分为两种一种是不需要用户登录验证直接请求 另一种是需要用户登陆验证请求,现在说一下利用COOKIE实现,COOKIE在前端开发时有很多的作用,要熟练使用, 直接上代码了: 第一步:访问页面,得到COOKIE值 结果为: 第二步:让程序自动去登陆:准备下账号用于登录 结果如下: 第三步:登陆 阅读全文
posted @ 2018-01-21 12:42 我爱在伊甸园吃苹果 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 个人来讲我不是很喜欢REQURST这个第三方模块,一点不好用不如URLLIB,但身为技术人员,模块你可以不用但是你得会,就像生活质量我这个东西我不用但是我得有 先拿百度做个案例: 看下代码 结果为: 输出的值为状态码 表示请求成功 那么如何获取网页内容呢 现在给大家个案例网址 内容很简单就是个简单的 阅读全文
posted @ 2018-01-21 10:14 我爱在伊甸园吃苹果 阅读(150) 评论(0) 推荐(0) 编辑