jacksplwxy

2019年4月11日

爬虫利器 Puppeteer 实战

摘要: Puppeteer 介绍 Puppeteer 翻译是操纵木偶的人,利用这个工具,我们能做一个操纵页面的人。Puppeteer是一个Nodejs的库,支持调用Chrome的API来操纵Web,相比较Selenium或是PhantomJs,它最大的特点就是它的操作Dom可以完全在内存中进行模拟既在V8引 阅读全文

posted @ 2019-04-11 11:28 jacksplwxy 阅读(659) 评论(0) 推荐(0) 编辑

爬虫(爬虫原理与数据抓取)

摘要: 通用爬虫和聚焦爬虫 根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. 通用爬虫 通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 通用搜索引擎(Search Engine)工作 阅读全文

posted @ 2019-04-11 11:07 jacksplwxy 阅读(2762) 评论(0) 推荐(0) 编辑

导航