摘要:
安装selenium 网页元素定位 节点交互: 动作链 执行js 例如下拉进度条,可以直接模拟运行JavaScript,适用execute_script()即可实现 获取节点信息 获取文本值 输出id、位置、标签名、大小 界面切换 延时等待(隐式等待) 显式等待 Cookies 阅读全文
摘要:
scrapy是一个python爬虫框架,爬取的效率极高,具有高度的定制性,但是不支持分布式。而scrapy-redis是一套基于redis库,运行在scrapy框架之上的组件,可以让scapy支持分布式策略 Slaver端共享Master端redis数据库里的item 队列、请求队列和请求指纹集合。 阅读全文