摘要: 队列是一种只允许在一端进行插入操作,而在另一端进行删除操作的线性表。 在Python文档中搜索队列(queue)会发现,Python标准库中包含了四种队列,分别是queue.Queue / asyncio.Queue / multiprocessing.Que... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(1729) 评论(0) 推荐(0) 编辑
摘要: 队列是一种只允许在一端进行插入操作,而在另一端进行删除操作的线性表。 在Python文档中搜索队列(queue)会发现,Python标准库中包含了四种队列,分别是queue.Queue / asyncio.Queue / multiprocessing.Que... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 先给大家分享点鸡汤: “Don’t think of the overwhelming majority of the impossible.” “不要去想不可能之事” “Grew up your bliss and the world.” ... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 先给大家分享点鸡汤: “Don’t think of the overwhelming majority of the impossible.” “不要去想不可能之事” “Grew up your bliss and the world.” ... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓取百度贴吧发帖记录中的邮箱与手机号的爬虫,于是开源分享给大家学习与参考。 需求分析: 本爬虫主要是对百度贴吧中各种帖子的内容进行抓取,并且分析帖子内容将其中的手机号和邮箱地址抓取出... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓取百度贴吧发帖记录中的邮箱与手机号的爬虫,于是开源分享给大家学习与参考。 需求分析: 本爬虫主要是对百度贴吧中各种帖子的内容进行抓取,并且分析帖子内容将其中的手机号和邮箱地址抓取出... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(129) 评论(0) 推荐(0) 编辑
摘要: Python中字符串分割的常用方法是直接调用字符串的str.split方法,但是其只能指定一种分隔符,如果想指定多个分隔符拆分字符串需要用到re.split方法(正则表达式的split方法)。 str.split 字符串的split方法函数原型如下,其中sep... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(14975) 评论(0) 推荐(0) 编辑
摘要: Python中字符串分割的常用方法是直接调用字符串的str.split方法,但是其只能指定一种分隔符,如果想指定多个分隔符拆分字符串需要用到re.split方法(正则表达式的split方法)。 str.split 字符串的split方法函数原型如下,其中sep... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(1477) 评论(0) 推荐(0) 编辑
摘要: 1.startswith()和endswith()参数可以是元组 当检测字符串开头或结尾时,如果有多个检测值,可以用元组作为startswith()和endswith()参数: 1 # bad 2 if image.endswith('.jpg') or i... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 1.startswith()和endswith()参数可以是元组 当检测字符串开头或结尾时,如果有多个检测值,可以用元组作为startswith()和endswith()参数: 1 # bad 2 if image.endswith('.jpg') or i... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 两个字典如下: >>> d1 = {'name' : 'revotu', 'age' : 99}>>> d2 = {'age' : 24, 'sex' : 'male'} 合并后的结果如下(即,key相同时后面字典值覆盖前面字典): >>> d{'sex': ... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 两个字典如下: >>> d1 = {'name' : 'revotu', 'age' : 99}>>> d2 = {'age' : 24, 'sex' : 'male'} 合并后的结果如下(即,key相同时后面字典值覆盖前面字典): >>> d{'sex': ... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 本文的标题是『完整』。所谓『完整』,大意是想表达:提炼出一组最小的经验组合,并且能够快速应用于工程中,能 work,甚至能完美地 work。这篇文章就是想要做到『如何能完美地work』。 初衷 最原始的初衷就是:『现在的,是不完美的,不系统的』。 一是:Pyt... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 本文的标题是『完整』。所谓『完整』,大意是想表达:提炼出一组最小的经验组合,并且能够快速应用于工程中,能 work,甚至能完美地 work。这篇文章就是想要做到『如何能完美地work』。 初衷 最原始的初衷就是:『现在的,是不完美的,不系统的』。 一是:Pyt... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 『动态类型一时爽,代码重构火葬场』,说的是:动态语言在初期开发比较爽,但是到后期维护起来比较困难。Python 作为动态语言之一,自然也会有这样的缺点。其实说『火葬场』,也没有那么严重,只要严格的遵守一组规范,也能做到『重构的时候,也一样爽』。 不以规矩不成方... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 『动态类型一时爽,代码重构火葬场』,说的是:动态语言在初期开发比较爽,但是到后期维护起来比较困难。Python 作为动态语言之一,自然也会有这样的缺点。其实说『火葬场』,也没有那么严重,只要严格的遵守一组规范,也能做到『重构的时候,也一样爽』。 不以规矩不成方... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 提到自动化测试,少不了自动化生成测试报告,其实也少不了漂亮的测试报告呀! 刚好看到在github上有个 大神 分享了BeautifulReport,与unittest测试框架完美的结合起来,就能生成BeautifulReport了。下面来小小实践一把: 一、首... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 提到自动化测试,少不了自动化生成测试报告,其实也少不了漂亮的测试报告呀! 刚好看到在github上有个 大神 分享了BeautifulReport,与unittest测试框架完美的结合起来,就能生成BeautifulReport了。下面来小小实践一把: 一、首... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 大家在读 爬虫系列 的帖子时常常问我怎样写出不阻塞的爬虫,这很难,但可行。通过实现一些小策略可以让你的网页爬虫活得更久。那么今天我就将和大家讨论这方面的话题。 用户代理 你需要关心的第一件事是设置用户代理。 用户代理是用户访问的工具,并告知服务器用户正在使用... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 大家在读 爬虫系列 的帖子时常常问我怎样写出不阻塞的爬虫,这很难,但可行。通过实现一些小策略可以让你的网页爬虫活得更久。那么今天我就将和大家讨论这方面的话题。 用户代理 你需要关心的第一件事是设置用户代理。 用户代理是用户访问的工具,并告知服务器用户正在使用... 阅读全文
posted @ 2022-10-07 20:57 I'm_江河湖海 阅读(77) 评论(0) 推荐(0) 编辑