摘要: 爬虫主要有三类:纯代码(模拟浏览器),纯浏览器(直接操作浏览器),浏览器控件 摘自园子大佬majianguo { 爬虫靠演技,表演得越像浏览器,抓取数据越容易 一,分析HTTP协议,构造请求; 二,利用浏览器控件,获取cookie、页面元素、调用js脚本等;phantomjs、webloop属于此类 阅读全文
posted @ 2019-10-11 11:21 hcjavascript 阅读(477) 评论(0) 推荐(0) 编辑