None

生命就像一条蜿蜒的河流

导航

随笔分类 -  爬虫

爬虫学习笔记-urllib库
摘要:urllib库是python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。 urlopen函数:在python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块下面了 urlopen函数基本的使用: ur 阅读全文

posted @ 2018-07-12 10:46 我睡着了 阅读(182) 评论(0) 推荐(0)

爬虫从入门到放弃
摘要:网络爬虫,又称为网络蜘蛛(WebSpider),就是把整个互联网想象成一个蜘蛛网,这只爬虫在上面爬来爬去,来捕获我所需要的资源。也就是请求网站并提取数据的自动化过程。 爬虫的基本流程 简单的来说分为四步 1、发起请求: 通过HTTP库向目标站点发起请求,即发送一个request,请求可以包含额外的h 阅读全文

posted @ 2018-05-03 10:10 我睡着了 阅读(484) 评论(0) 推荐(0)