上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 31 下一页

2016年5月16日

摘要: PIL:Python Imaging Library,已经是Python平台事实上的图像处理标准库了。PIL功能非常强大,但API却非常简单易用。 由于PIL仅支持到Python 2.7,加上年久失修,于是一群志愿者在PIL的基础上创建了兼容的版本,名字叫Pillow,支持最新Python 3.x, 阅读全文
posted @ 2016-05-16 17:35 邬兴亮 阅读(439) 评论(0) 推荐(0) 编辑
摘要: urllib提供了一系列用于操作URL的功能。 Get urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应: 例如,对豆瓣的一个URLhttps://api.douban.com/v2/book/2129650进行抓取,并返回响 阅读全文
posted @ 2016-05-16 17:32 邬兴亮 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 如果我们要编写一个搜索引擎,第一步是用爬虫把目标网站的页面抓下来,第二步就是解析该HTML页面,看看里面的内容到底是新闻、图片还是视频。 假设第一步已经完成了,第二步应该如何解析HTML呢? HTML本质上是XML的子集,但是HTML的语法没有XML那么严格,所以不能用标准的DOM或SAX来解析HT 阅读全文
posted @ 2016-05-16 17:27 邬兴亮 阅读(142) 评论(0) 推荐(0) 编辑
摘要: XML虽然比JSON复杂,在Web中应用也不如以前多了,不过仍有很多地方在用,所以,有必要了解如何操作XML。 DOM vs SAX 操作XML有两种方法:DOM和SAX。DOM会把整个XML读入内存,解析为树,因此占用内存大,解析慢,优点是可以任意遍历树的节点。SAX是流模式,边读边解析,占用内存 阅读全文
posted @ 2016-05-16 17:26 邬兴亮 阅读(201) 评论(0) 推荐(0) 编辑
摘要: Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数。 首先,我们看看itertools提供的几个“无限”迭代器: 因为count()会创建一个无限的迭代器,所以上述代码会打印出自然数序列,根本停不下来,只能按Ctrl+C退出。 cycle()会把传入的一个序列无限重复下去 阅读全文
posted @ 2016-05-16 17:24 邬兴亮 阅读(128) 评论(0) 推荐(0) 编辑
摘要: Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。 什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。 举个例子,你写了一篇文章,内容是一个字符串'how to use python h 阅读全文
posted @ 2016-05-16 17:21 邬兴亮 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 准确地讲,Python没有专门处理字节的数据类型。但由于str既是字符串,又可以表示字节,所以,字节数组=str。而在C语言中,我们可以很方便地用struct、union来处理字节,以及字节和int,float的转换。 在Python中,比方说要把一个32位无符号整数变成字节,也就是4个长度的byt 阅读全文
posted @ 2016-05-16 17:18 邬兴亮 阅读(218) 评论(0) 推荐(0) 编辑
摘要: Base64是一种用64个字符来表示任意二进制数据的方法。 用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以,如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。Base64是一种最常见的二进制编 阅读全文
posted @ 2016-05-16 17:15 邬兴亮 阅读(241) 评论(0) 推荐(0) 编辑
摘要: collections是Python内建的一个集合模块,提供了许多有用的集合类。 namedtuple 我们知道tuple可以表示不变集合,例如,一个点的二维坐标就可以表示成: 但是,看到(1, 2),很难看出这个tuple是用来表示一个坐标的。 定义一个class又小题大做了,这时,namedtu 阅读全文
posted @ 2016-05-16 17:14 邬兴亮 阅读(178) 评论(0) 推荐(0) 编辑
摘要: datetime是Python处理日期和时间的标准库。 获取当前日期和时间 我们先看如何获取当前日期和时间: 注意到datetime是模块,datetime模块还包含一个datetime类,通过from datetime import datetime导入的才是datetime这个类。 如果仅导入i 阅读全文
posted @ 2016-05-16 17:10 邬兴亮 阅读(309) 评论(0) 推荐(0) 编辑
上一页 1 ··· 17 18 19 20 21 22 23 24 25 ··· 31 下一页

导航