posted @ 2019-02-26 10:26
02 2019 档案
摘要:经验: 1.猫眼的网页版只显示极少数热门短评,只有在APP端才能看到所有评论,所以笔者所用的url ='http://m.maoyan.com/mmdb/comments/movie/1235560.json?_v_=yes&offset='+ str(i*15)就是在网上看到别人用的,可以记一下,
阅读全文
摘要:笔者最近在看scrapy爬虫实战,在scrapy入门案例中遇到了许多问题,特别是在scrapy中使用css和xpath,遇到实际应用无法实现,只能做到基础的功能 于是笔者摆脱scrapy框架,按照requests这些基础知识来重做项目,发现运行速度远远低于scrapy框架! 下面是代码,代码也存在较
阅读全文
posted @ 2019-02-25 23:37
摘要:1、创建一个scrapy的开发环境 下载scrapy,但是由于pip版本等问题,所以没有最终成功,但是更改pycharm中的环境,使用anaconda就可以了,因为包含了scrapy环境! 2、使用 scrapy 来创建 ArticleSpider项目 打开cmd界面,输入scrapy startp
阅读全文
posted @ 2019-02-24 12:08
摘要:''' selenium操作主要分两大类: -得到UI元素 -find_element_by_id -find_elements_by_name -find_elements_by_xpath -find_elements_by_link_text -find_elements_by_tag_name -find_elements_by_class_name -基于UI元...
阅读全文
posted @ 2019-02-23 20:33
摘要:本文章主要是lxml库的etree解析抽取与xpath解析的应用,还使用了os库写文件
阅读全文
posted @ 2019-02-20 22:39
摘要:由于在微信公众号CSDN上看到一篇拉勾网招聘信息爬取及分析的文章,觉得非常不错,于是也copy一下,但是却出现了许多文章中没有提到的错误,正是一失足成千古恨啊! 首先插入代码: 在爬取拉勾网招聘信息时,需要进行许多分析,但是网络上已经有了许多分析,所以也就不再多说,总之登陆后输入python职位,找
阅读全文
posted @ 2019-02-20 22:08
浙公网安备 33010602011771号