...

随笔分类 -  爬虫

PythonP爬虫,网页爬取
摘要:在学会了抓包,接口请求(如requests库)和Selenium的一些操作方法后,基本上就可以编写爬虫,爬取绝大多数网站的内容。 在爬虫领域,Selenium永远是最后一道防线。从本质上来说,访问网页实际上就是一个接口请求。请求url后,返回的是网页的源代码。 我们只需要解析html或者通过正则匹配 阅读全文
posted @ 2019-09-07 20:44 韩志超 阅读(1236) 评论(0) 推荐(1)