随笔分类 - 爬虫

PythonP爬虫，网页爬取

摘要：在学会了抓包，接口请求(如requests库）和Selenium的一些操作方法后，基本上就可以编写爬虫，爬取绝大多数网站的内容。在爬虫领域，Selenium永远是最后一道防线。从本质上来说，访问网页实际上就是一个接口请求。请求url后，返回的是网页的源代码。我们只需要解析html或者通过正则匹配阅读全文

posted @ 2019-09-07 20:44 韩志超阅读(1238) 评论(0) 推荐(1)

...

临渊

随笔分类 - 爬虫

公告