摘要: Web项目测试通过标准 启动jemter BadBoy录制(模拟浏览器工具) 把jemter设置成中文 阅读全文
posted @ 2019-03-22 10:42 IndustriousHe 阅读(406) 评论(0) 推荐(0) 编辑
摘要: 分布式爬虫的原理 scrapy分布式爬取的实现 搭建redis服务器 部署代理池和cookie池 配置scrapy redis Bloom Filter(判断一个元素是否存在集合中) scrapy去重 阅读全文
posted @ 2018-12-26 14:29 IndustriousHe 阅读(294) 评论(0) 推荐(0) 编辑
摘要: 猫眼电影简单的分析实例 python coding: utf 8 """ Created on Sat Apr 14 14:45:49 2018 @author: Administrator """ ''' 爬猫眼网站TOP100的电影数据: http://maoyan.com/board/4?of 阅读全文
posted @ 2018-12-23 11:04 IndustriousHe 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 爬虫基础 URL&&URI 请求方法:GET&&POST 响应 基本库的使用 urllib urlopen(传递参数data) urlopen(设置超时timeout) 打开网站需要验证账号密码可以借助HTTPBasicAuthHandler完成 代理IP,ProxyHandler Cookie 解 阅读全文
posted @ 2018-12-09 10:15 IndustriousHe 阅读(1222) 评论(0) 推荐(0) 编辑
摘要: 1.在windows下载好文件(ubuntu下载太慢了) 2.把下载好的包放入到downloads(路径只要自己喜欢就好) 3.使用终端cd到downloads文件夹 4.终端输入bash ana.........sh 5.一直按回车阅读,然后输入yes,最后添加环境变量就可以用了 阅读全文
posted @ 2018-12-09 10:01 IndustriousHe 阅读(383) 评论(0) 推荐(0) 编辑
摘要: anaconda安装 打开浏览器的开发者模式 设置 更多工具 扩展程序 安装xpath解析工具到浏览器扩展程序 使用xpath插件查询元素ctrl+shif+x 获取url地址并获取源码 把获取的URL响应内容从字节转换成字符decode 创建一个新的User Agent 返回url的影响码getc 阅读全文
posted @ 2018-12-04 11:26 IndustriousHe 阅读(1008) 评论(0) 推荐(0) 编辑
摘要: 创建一个本地仓库 在本地仓库修改文件 把本地仓库上传到github上 查看上传后的仓库 阅读全文
posted @ 2018-12-03 12:06 IndustriousHe 阅读(286) 评论(0) 推荐(0) 编辑
摘要: 新建项目仓库 新建一个文件 查看版本分支 阅读全文
posted @ 2018-12-03 11:15 IndustriousHe 阅读(349) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2018.cnblogs.com/blog/1532113/201812/1532113-20181202202650987-297162304.png) 阅读全文
posted @ 2018-12-02 20:27 IndustriousHe 阅读(329) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2018.cnblogs.com/blog/1532113/201812/1532113-20181202174929154-295148209.png) 阅读全文
posted @ 2018-12-02 17:50 IndustriousHe 阅读(270) 评论(0) 推荐(0) 编辑