摘要:
首先要了解一下什么是Urllib 库,它是 Python 内置的 HTTP 请求库,它包含四个模块: 第一个模块 request,它是最基本的 HTTP 请求模块,我们可以用它来模拟发送一请求,就像在浏览器里输入网址然后敲击回车一样,只需要给库方法传入 URL 还有额外的参数,就可以模拟实现这个过程 阅读全文
摘要:
1、首先想到的爬取百度百科,获取相关信息,但是会出现一个问题,百度百科只会收录一些大的单位,如各大学、研究所等,存在部分获取不到, 2、想到了使用scrapy+selenium爬取百度地图的的地址信息,还是存在一些地址爬取不到 3、了解到使用百度地图的API可以获取,就进行了相关的学习,明天补充详细 阅读全文