随笔分类 - 爬虫
摘要:scrapy框架 scrapy介绍 scrapy是爬虫的一个框架,其重要程度相当于python中的django scrapy把爬虫所用的东西都封装好了,使用的时候只需在固定的位置写固定的代码即可 scrapy介绍 Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所
阅读全文
摘要:爬虫——selenium、 xpath的使用 目录 xpath的使用 selenium动作链 自动登录12306 打码平台 的使用 使用打码平台自动登录 使用selenium爬取京东商品信息 scrapy介绍 xpath 的使用 在html中选择标签,可使用的通用方式 css选择 xpath选择 什
阅读全文
摘要:爬虫初识 爬虫介绍 爬虫(spider)又称网络蜘蛛 爬虫的本质 目前所有的软件的原理都是基于http请求发送和获取数据的,如PC端的网页,移动端的app 爬虫可以模拟发送http请求,从别人的服务端获取数据。对于不同的程序,都会有不同的反扒措施。 爬虫原理 模拟发送http请求【requests,
阅读全文