2018 年 3月 9 日随笔档案 - EagleSour

2018年3月9日

摘要：性能相关在编写爬虫时，性能的消耗主要在IO请求中，当单进程单线程模式下请求URL时必然会引起等待，从而使得请求整体变慢。 import requests def fetch_async(url): response = requests.get(url) return response url_l 阅读全文

posted @ 2018-03-09 22:00 EagleSour 阅读(318) 评论(0) 推荐(0) 编辑

爬虫基础(BeautifulSoup库的使用)--04

摘要：上一篇文章的正则，其实对很多人来说用起来是不方便的，加上需要记很多规则，所以用起来不是特别熟练，而这节我们提到的beautifulsoup就是一个非常强大的工具，爬虫利器。 beautifulSoup “美味的汤，绿色的浓汤” 一个灵活又方便的网页解析库，处理高效，支持多种解析器。利用它就不用编写正阅读全文

posted @ 2018-03-09 18:47 EagleSour 阅读(193) 评论(0) 推荐(0) 编辑

爬虫基础(正则的使用)--03

摘要：什么是正则表达式正则表达式是对字符串操作的一种逻辑公式，就是事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符”，这个“规则字符” 来表达对字符的一种过滤逻辑。正则并不是python独有的，其他语言也都有正则python中的正则，封装了re模块 python正则的详细讲解常用阅读全文

posted @ 2018-03-09 16:16 EagleSour 阅读(307) 评论(0) 推荐(0) 编辑

爬虫基础(requests库的基本使用)--02

摘要：什么是Requests Requests是用python语言基于urllib编写的，采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用，你会发现，其实urllib还是非常不方便的，而Requests它会比urllib更加方便，可以节约我们大量的工作阅读全文

posted @ 2018-03-09 00:02 EagleSour 阅读(257) 评论(0) 推荐(0) 编辑

EagleSour

公告