摘要:
在 Python 众多原生特性中,描述符可能是最少被自定义的特性之一,但它在底层实现的方法和属性却无时不刻被使用着,它优雅的实现方式体现出 Python 简洁之美。 阅读全文
摘要:
在使用爬虫中,经常会遇到网页请求数据是经过 JS 处理的,特别是模拟登录时可能有加密请求。而目前绝大部分前端 JS 代码都是经过混淆的,可读性极低,想理解代码逻辑需要花费大量时间。这时不要着急使用 Selenium 暴力解决,毕竟 Selenium 严重拖慢爬虫效率,我们可以尝试使用一些第三方库,来直接执行前端 JS 代码得到处理过后的结果。 阅读全文
摘要:
理解面向对象,首先理解要它的基础概念: 面向对象 ( Object Oriented ) 是将现实问题构建关系,然后抽象成 类 ( class ),给类定义属性和方法后,再将类实例化成 实例 ( instance ) ,通过访问实例的属性和调用方法来进行使用。 在不同的语言中,对象的定义范围不同。在 阅读全文
摘要:
最近项目中用到了简单的简繁转换,如果用OpenCC太重了,于是搜到了 zhconv 这个库。 zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。 支持以下地区词转换: zh-tw 台灣正體 zh-hk 香港繁體 zh-sg 马新简体 zh-han 阅读全文
摘要:
pprint 这是 Python 标准库模块,全称 pretty printer,可以让各种数据结构更美观地输出。 >>> print(game) {'players': [{'name': 'player_1', 'hp': 3}, {'name': 'player_2', 'hp': 5}]} 阅读全文
摘要:
1. 语法基础 书籍类(任选) Python 编程:从入门到实践Python 编程快速上手“笨办法”学 PythonPython 核心编程(第二版)— 适合有编程基础 视频类(任选) 小甲鱼零基础入门 PythonPython 语言程序设计_北京理工大学_中国大学 MOOC 文档类(任选) 菜鸟教程 阅读全文
摘要:
一个简单易用的第三方库是:progress 作者提供了动图很直观地展现了实现的所有输出。 这个库实现了两类样式,一类是有终点的进度条样式,另一类是多用于加载的转圈样式。 import time from progress.bar import Bar bar = Bar('Processing' 阅读全文
摘要:
configparser 简介 configparser 是 Pyhton 标准库中用来解析配置文件的模块,并且内置方法和字典非常接近。Python2.x 中名为 ConfigParser,3.x 已更名小写,并加入了一些新功能。 配置文件的格式如下: “[ ]”包含的为 section,secti 阅读全文
摘要:
知乎的登录页面已经改版多次,加强了身份验证,网络上大部分模拟登录均已失效,所以我重写了一份完整的,并实现了提交验证码 (包括中文验证码),本文我对分析过程和代码进行步骤分解,完整的代码请见末尾 Github 仓库,不过还是建议看一遍正文,因为代码早晚会失效,解析思路才是永恒。 分析 POST 请求 阅读全文