IndustriousHe

2019年3月22日

全栈性能测试

摘要： Web项目测试通过标准启动jemter BadBoy录制（模拟浏览器工具）把jemter设置成中文阅读全文

posted @ 2019-03-22 10:42 IndustriousHe 阅读(427) 评论(0) 推荐(0)

2018年12月26日

分布式爬虫

摘要：分布式爬虫的原理 scrapy分布式爬取的实现搭建redis服务器部署代理池和cookie池配置scrapy redis Bloom Filter(判断一个元素是否存在集合中) scrapy去重阅读全文

posted @ 2018-12-26 14:29 IndustriousHe 阅读(321) 评论(0) 推荐(0)

2018年12月23日

数据分析

摘要：猫眼电影简单的分析实例 python coding: utf 8 """ Created on Sat Apr 14 14:45:49 2018 @author: Administrator """ ''' 爬猫眼网站TOP100的电影数据： http://maoyan.com/board/4?of 阅读全文

posted @ 2018-12-23 11:04 IndustriousHe 阅读(320) 评论(0) 推荐(0)

2018年12月9日

《爬虫网络开发实战》

摘要：爬虫基础 URL&&URI 请求方法：GET&&POST 响应基本库的使用 urllib urlopen(传递参数data) urlopen(设置超时timeout) 打开网站需要验证账号密码可以借助HTTPBasicAuthHandler完成代理IP,ProxyHandler Cookie 解阅读全文

posted @ 2018-12-09 10:15 IndustriousHe 阅读(1267) 评论(0) 推荐(0)

ubuntu安装anaconda

摘要： 1.在windows下载好文件（ubuntu下载太慢了） 2.把下载好的包放入到downloads(路径只要自己喜欢就好) 3.使用终端cd到downloads文件夹 4.终端输入bash ana.........sh 5.一直按回车阅读，然后输入yes，最后添加环境变量就可以用了阅读全文

posted @ 2018-12-09 10:01 IndustriousHe 阅读(407) 评论(0) 推荐(0)

2018年12月4日

爬虫的基本操作

摘要： anaconda安装打开浏览器的开发者模式设置更多工具扩展程序安装xpath解析工具到浏览器扩展程序使用xpath插件查询元素ctrl+shif+x 获取url地址并获取源码把获取的URL响应内容从字节转换成字符decode 创建一个新的User Agent 返回url的影响码getc 阅读全文

posted @ 2018-12-04 11:26 IndustriousHe 阅读(1050) 评论(0) 推荐(0)

2018年12月3日

github客户端的操作

摘要：创建一个本地仓库在本地仓库修改文件把本地仓库上传到github上查看上传后的仓库阅读全文

posted @ 2018-12-03 12:06 IndustriousHe 阅读(309) 评论(0) 推荐(0)

github浏览器的操作

摘要：新建项目仓库新建一个文件查看版本分支阅读全文

posted @ 2018-12-03 11:15 IndustriousHe 阅读(372) 评论(0) 推荐(0)

2018年12月2日

把两个列表使用字典关联起来zip

摘要： ![](https://img2018.cnblogs.com/blog/1532113/201812/1532113-20181202202650987-297162304.png) 阅读全文

posted @ 2018-12-02 20:27 IndustriousHe 阅读(346) 评论(0) 推荐(0)

集合并集，交集

摘要： ![](https://img2018.cnblogs.com/blog/1532113/201812/1532113-20181202174929154-295148209.png) 阅读全文

posted @ 2018-12-02 17:50 IndustriousHe 阅读(289) 评论(0) 推荐(0)

公告