2020 年 6月 30 日随笔档案 - 冰河入梦~

2020年6月30日

摘要：基本原理爬虫的本质是模拟浏览器打开网页，获取网页中我们想要的那部分数据。爬虫就是获取网页并提取和保存信息的自动化程序，其主要有如下三个步骤：获取网页：爬虫首先要做的工作就是获取网页，这里就是获取网页的源代码。源代码里包含了网页的部分有用信息，所以只要把源代码获取下来，就可以从中提取想要的信息了。阅读全文

posted @ 2020-06-30 00:39 冰河入梦~ 阅读(922) 评论(0) 推荐(0) 编辑

冰河入梦

公告