摘要: 废话不多说,上代码 阅读全文
posted @ 2019-07-25 21:12 默默扫地僧 阅读(2120) 评论(0) 推荐(0) 编辑
摘要: (一)、爬虫初识 1、什么是爬虫? 爬虫就是通过编写程序模拟浏览器上网,然后让其去互联网上抓取数据的过程。 2、爬虫分类: 通用爬虫:抓取的是一整张页面源码数据聚焦爬虫:抓取的是一张页面中的局部数据增量式爬虫:监测网站数据更新的情况。将最新更新出来的数据进行爬取。 3、robots.txt协议 如果 阅读全文
posted @ 2019-07-25 15:35 默默扫地僧 阅读(801) 评论(0) 推荐(0) 编辑