摘要: 基本原理 爬虫的本质是模拟浏览器打开网页,获取网页中我们想要的那部分数据。爬虫就是获取网页并提取和保存信息的自动化程序,其主要有如下三个步骤: 获取网页:爬虫首先要做的工作就是获取网页,这里就是获取网页的源代码。源代码里包含了网页的部分有用信息,所以只要把源代码获取下来,就可以从中提取想要的信息了。 阅读全文
posted @ 2020-06-30 00:39 冰河入梦~ 阅读(896) 评论(0) 推荐(0) 编辑