该文被密码保护。 阅读全文
posted @ 2018-05-10 13:54 左正 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 前段时间写了 爬取美团商家信息的博客 爬虫抓取美团网上所有商家信息 ,这次说说爬取糯米网,由于某些原因无法提供源代码,但是,代码不是关键,最关键的是思想,懂了思想,代码是很容易写的. 爬虫最重要的是分析请求过程,按照实际请求过程去请求数据. 分析是否需要处理cookie,有些网站比较严格请求某些接口 阅读全文
posted @ 2018-05-10 13:51 左正 阅读(784) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-05-10 13:50 左正 阅读(0) 评论(0) 推荐(0) 编辑
摘要: proxy简介 proxy即为代理,我们爬虫的时候肯定会有频繁访问某一网站的情况,这个时候有些服务器会识别到我们是非正常访问,就会把我们的IP禁掉,这个时候就需要用代理了。 就好比现实生活中,我需要向A借一件东西,但是我跟A是仇人,直接向他借的话他不会借给我,这个时候我就让B帮我像A借,就说他要用, 阅读全文
posted @ 2018-05-10 12:05 左正 阅读(1188) 评论(1) 推荐(0) 编辑