zzzzzhangrui

[置顶] scrapy爬虫踩的坑

摘要： 1.scrapy创建爬虫，cd进入爬虫的项目文件夹，输入：scrapy genspider zhihu03 www.zhihu.com 打开pycharm发现新增一个zhihu03.py 2.爬取网页时，当我们爬取(table)中的内容时，用xpath解析不到表格中td的值原因:浏览器会在tabl 阅读全文

posted @ 2018-04-01 17:50 zzzzzhangrui 阅读(946) 评论(0) 推荐(0)

2018年5月27日

Python虚拟环境

摘要： 1.virtualenvwrapper安装指定版本的python mkvirtualenv --python=D:\python3.5\python.exe testenv 阅读全文

posted @ 2018-05-27 18:08 zzzzzhangrui 阅读(100) 评论(0) 推荐(0)

2018年4月26日

Elasticsearch使用

摘要： github下载安装Elasticsearch-rtf，安装head和kibana插件，head安装好后修改Elasticsearch-rtf的配置文件elasticsearch.yml，增加如下内容，连接head和Elasticsearch： 1.启动Elasticsearch：进入Elastic 阅读全文

posted @ 2018-04-26 17:03 zzzzzhangrui 阅读(129) 评论(0) 推荐(0)

2018年4月20日

爬虫和反爬虫

摘要：基本概念爬虫：自动获取网站数据的程序，关键是批量的获取反爬虫：使用技术手段防止爬虫程序的方法误伤：反爬虫技术将普通用户识别为爬虫，如果误伤过高，效果再好也不能用成本：反爬虫需要的人力和机器成本拦截：成功拦截，一般拦截率越高，误伤率越高反爬虫的目的：初级爬虫：简单粗暴，不管对服务器造成了阅读全文

posted @ 2018-04-20 10:04 zzzzzhangrui 阅读(244) 评论(0) 推荐(0)

2018年4月18日

scrapy爬虫-爬取拉勾网职位信息

摘要： 1.创建spider，scrapy genspider -t crawl lagou lagou.com 阅读全文

posted @ 2018-04-18 17:04 zzzzzhangrui 阅读(332) 评论(0) 推荐(0)

python+selenium常见坑

摘要： 1.出现'geckodriver' executable needs to be in PATH错误，将下载下来的浏览器驱动（geckodriver.exe）放在浏览器的安装目录之下，我的firefox安装目录：C:\Program Files (x86)\Mozilla Firefox，再将安装目阅读全文

posted @ 2018-04-18 15:52 zzzzzhangrui 阅读(158) 评论(0) 推荐(0)

2018年4月15日

scrapy模拟登录2018新版知乎

摘要：由于2018知乎改版，增加了几个登录所需要的post_data，让我这个初出茅庐的小白头疼了几天，经过一番search（github和各种大佬的博客），最终成功的模拟登录的2018新版知乎。方法如下： 1.谷歌浏览器，打开知乎登录页面，F12打开调试，F5刷新，选中Network，输入账号，错误的阅读全文

posted @ 2018-04-15 15:15 zzzzzhangrui 阅读(3710) 评论(2) 推荐(3)

2017年11月6日

Sublime Text3搭建Python环境

摘要： New Build System: 插件： Package Control A File Icon SideBarEnhancements Theme Flatland 阅读全文

posted @ 2017-11-06 17:07 zzzzzhangrui 阅读(179) 评论(0) 推荐(0)

2017年9月5日

Java中的==和equals

摘要： 1.基本数据类型 byte ,short ,int ,long ,double ,float,boolean,char 他们之间的比较，应用双等号（==），比较的是他们的值。 2.复合数据类型（类）当他们用（==）进行比较的时候，比较的是他们在内存中的存放地址，所以，除非是同一个new出来的对象，阅读全文

posted @ 2017-09-05 22:13 zzzzzhangrui 阅读(168) 评论(0) 推荐(0)

|和||，&和&&

摘要： |和&：按位或和与运算。会判断每一个条件的真伪。在再做运算。 ||和&&：逻辑或和与运算。遇到第一个条件为true或者为false就不再判断后面的条件（会短路）阅读全文

posted @ 2017-09-05 14:20 zzzzzhangrui 阅读(308) 评论(0) 推荐(0)

积跬步，以至千里

公告