摘要: 一 Scrapy框架--cookie的获取/传递/本地保存 1. 完成模拟登陆2. 登陆成功后提取出cookie,然后保存到本地cookie.txt文件中3. 再次使用时从本地的cookie.txt中读取cookie,省略模拟登陆. Cookie的传递和提取 from scrapy.http.coo 阅读全文
posted @ 2020-04-06 22:17 秋华 阅读(679) 评论(0) 推荐(0) 编辑
摘要: pass 阅读全文
posted @ 2020-04-06 12:22 秋华 阅读(274) 评论(0) 推荐(0) 编辑
摘要: 1. scrapy有三种方法模拟登陆 1.1直接携带cookies 1.2找url地址,发送post请求存储cookie 1.3找到对应的form表单,自动解析input标签,自动解析post请求的url地址,自动带上数据,自动发送请求 2. scrapy携带cookies直接获取需要登陆后的页面 阅读全文
posted @ 2020-04-06 12:21 秋华 阅读(575) 评论(0) 推荐(0) 编辑
摘要: scrapy-redis简介 scrapy-redis是scrapy框架基于redis数据库的组件,用于scrapy项目的分布式开发和部署。 有如下特征:  分布式爬取 您可以启动多个spider工程,相互之间共享单个redis的requests队列。最适合广泛的多个域名网站的内容爬取。  分布 阅读全文
posted @ 2020-04-06 12:19 秋华 阅读(546) 评论(0) 推荐(0) 编辑
摘要: 转载布客飞龙 最后发布于2018-11-25 17:44:43 阅读数 15777 收藏 展开 译者:szcf-weiya ESL 指的是 The Elements of Statistical Learning。因为(译者)自己也是统计学专业,所以想研读这本书,同时实现书中的算法及其例子,并尝试解 阅读全文
posted @ 2020-04-06 10:46 秋华 阅读(79) 评论(0) 推荐(0) 编辑