part10-2 Python常见模块(random模块、time模块、JSON模块)

三、 random 模块

random 模块的各种变量和函数主要用于生成伪随机数。在 Python 交互式解释器中导入 random 模块,可使用 random.__all__ 命令查看该模块的公开接口,这些接口是该模块包含的全部属性和函数。

>>> random.__all__
['Random', 'seed', 'random', 'uniform', 'randint', 'choice', 'sample', 'randrange', 'shuffle', 'normalvariate',
'lognormvariate', 'expovariate', 'vonmisesvariate', 'gammavariate', 'triangular', 'gauss', 'betavariate',
'paretovariate', 'weibullvariate', 'getstate', 'setstate', 'getrandbits', 'choices', 'SystemRandom']

这些属性和函数的含义不用强记,官方参考网站是 https://docs.python.org/3/library/random.html。常用函数如下:

(1)、random.seed(a=None,version=2):指定种子来初始化伪随机数生成器。

(2)、random.randrange(start,stop[,step]):返回从 start 开始到 stop 结束、步长为 step 的随机数。与choice(range(start,stop,step))的效果一样,只不过实际在底层并不生成区间对象。

(3)、random.randint(a,b):生成一个范围在 a<=N<=b 的随机数。等同于 randrange(a,b+1)的效果。

(4)、random.choice(seq):从 seq 中随机抽取一个元素,如果 seq 为空,则引发 IndexError 异常。

(5)、random.choices(seq,weights=None,*,cum_weights=None,k=1):从 seq 序列中抽取 k 个元素,还可通过 weights 指定各元素被抽取的权重(代表被抽取的可能性高低)。

(6)、random.shuffle(x[,random]):对 x 序列执行洗牌“随机排列”操作。

(7)、random.sample(population,k):从 population 序列中随机抽取 k 个独立的元素。

(8)、random.random():生成一个从 0.0(包含)到 1.0(不包含)之间的伪随机浮点数。

(9)、random.uniform(a,b):生成一个范围为 a<=N<=b 的随机数。

(10)、random.expovariate(lambd):生成呈指数分布的随机数。其中 lambd 参数(实际应该是lambda,只是lambda是Python关键字,所以简写成lambd)为1除以期望平均值。如果 lambd 是正值,则返回的随机数是从 0 到正无穷大;如果 lambd 是负值,则返回的随机数是从负无穷大到 0。

此外,random 模块还有 random.triangular(low,high,mode)、random.gauss(mu,sigma)等函数,用于生成呈对称分布、高斯分布的随机数,这些函数需要一些数学知识来理解,平时用得不多。

下面是 random 模块的常用函数的功能和用法。

import random
# 生成范围为 0.0<=x<1.0 的伪随机浮点数
print(random.random())
# 生成范围为 2.5<=x<10.0 的伪随机浮点数
print(random.uniform(2.5, 10.0))
# 生成呈指数分布的伪随机浮点数
print(random.expovariate(1 / 5))
# 生成从 0 到 33 的伪随机整数
print(random.randrange(34))
# 生成从 0 到 100 的随机偶数
print(random.randrange(0, 101, 2))
# 随机抽取一个元素
print(random.choice(['python', 'linux', 'michael', 'stark']))
book_list = ['python', 'linux', 'java', 'html']
# 对列表元素进行随机排列
random.shuffle(book_list)
print(book_list)
# 随机抽取 4 个独立元素
print(random.sample([10, 20, 30, 40, 50, 60], k=4))

运行程序,输出结果如下:
0.9460895371013778
4.026276430084499
8.989374079499285
16
34
stark
['html', 'java', 'python', 'linux']
[60, 20, 50, 40]

random 模块可以做一些有趣的事情,示例如下:

import random
import collections
# 指定随机抽取 6 个元素,各元素被抽取的权重(概率)不同
print(random.choices(['python', 'linux', 'html'], [6, 5, 1], k=6))
# 模拟从52张扑克牌中抽取20张
# 在抽取的 20 张牌中,牌面为 10 (包括J、Q、K)的牌占多的比例
# 生成一个 16 个 tens(代表10)和36个 low_cards(代表其他牌)的集合
deck = collections.Counter(tens=16, low_cards=36)
# 从52张牌中随机抽取 20 张
seen = random.sample(list(deck.elements()), k=20)
# 统计 tens 元素有多少个,再除以 20
print(seen.count('tens') / 20)

运行程序,输出信息如下所示:
['linux', 'python', 'python', 'linux', 'linux', 'python']
0.4

从输出可知,抽取的6个元素中,html 因为权重太低,完全没有被抽取到。

 

四、 time 模块

time 模块提供了日期、时间功能的类和函数。该模块有把日期、时间格式化为字符串的功能,也有从字符串恢复日期、时间的功能。在Python 交互式解释器中先导入 time 模块,使用列表解析式过滤下划线的模块,示例如下:

>>> import time
>>> [e for e in dir(time) if not e.startswith("_")]
['altzone', 'asctime', 'clock', 'ctime', 'daylight', 'get_clock_info', 'gmtime', 'localtime', 'mktime',
'monotonic', 'perf_counter', 'process_time', 'sleep', 'strftime', 'strptime', 'struct_time', 'time',
'timezone', 'tzname']

在 time 模块内有一个 time.struct_time 类,该类代表一个时间对象,主要有9个属性,每个属性的信息如下所示:

例如可以用 time.struct_time(tm_year=2019, tm_mon=11, tm_day=11, tm_hour=15, tm_min=10, tm_sec=33, tm_wday=0, tm_yday=315, tm_isdst=0) 清楚的代表时间。此外还可用一个包含9个元素的元组来代表时间,该元组的9个元素和 struct_time 对象中 9 个属性的含义是一一对应的。比如用 (2019,11,11,15,10,33,1,1,0) 来清楚的代表时间。time 模块的常用功能函数如下:

(1)、time.asctime([t]):将时间元组或 struct_time 转换为时间字符串。如果不指定参数 t,则默认转换当前时间。

(2)、time.ctime([secs]):将以秒数代表的时间转换为时间字符串。

这里要注意的是:Python 的时间从 1970 年1月1日0点整到现在所经过的秒数来代表当前时间。比如写30秒,就意味着时间是1970年1月1日0点30秒。在实际输出的时候还会受到时区的影响,比如我国处于东八区,因此实际上会输出1970年1月1日8点0分30秒。

(3)、time.gmtime([secs]):将以秒数代表的时间转换为 struct_time 对象。如果不传入参数,则使用当前时间。

(4)、time.localtime([secs]):将以秒数代表的时间转换为代表当前时间的 struct_time 对象。如果不传入参数,则使用当前时间。

(5)、time.mktime(t):它是 localtime 的反转函数,用于将 struct_time 对象或元组代表的时间转换为从1970年1月1日0点整到现在过了多少秒。

(6)、time.perf_counter():返回性能计数器的值。以秒为单位。

(7)、time.process_time():返回当前进程使用 CPU 的时间。以秒为单位。

(8)、time.sleep(secs):暂停 secs 秒,什么都不做。

(9)、time.strftime(format[,t]):将参数 t 代表的时间元组或 struct_time 对象按照 format 格式转化为时间字符串。如果不指定参数 t,则默认转换当前时间。

(10)、time.strptime(string[,format]):将 format 格式的 string 时间字符串解析成 struct_time 对象。如果不指定参数 format,则要求 string 字符串的格式要与 '%a %b %d %H:%M:%S %Y' 格式相匹配。

(11)、time.time():返回从 1970年1月1日0点整到现在经过了多少秒。

(12)、time.timezone:返回本地时区的时间偏移,以秒为单位。

(13)、time.tzname:返回本地时区的名字。

time 模块的常用功能函数示例如下:

 

import time
# 将当前时间转换时间字符串
print(time.asctime())       # 不传入参数,默认是当前时间
# 将指定时间转换为时间字符串,时间元组的后面3个元素没有设置
print(time.asctime((2019, 11, 12, 10, 18, 22, 0, 0, 0)))
# 将以秒数为代表的时间转换为时间字符串,默认是从1970年1月1日0点开始
print(time.ctime(50))       # Thu Jan  1 08:00:50 1970
# 将以秒数为代表的时间转换为 struct_time 对象
print(time.gmtime(50))
# 将当前时间转换为 struct_time 对象
print(time.gmtime())
# 将以秒数代表的时间转换为代表当前时间的 struct_time 对象
print(time.localtime(50))
# 将元组格式的时间转换为以秒数代表的时间
print(time.mktime((2019, 11, 12, 10, 20, 31, 0, 0, 0)))     # 1573525231.0
# 返回性能计数器的值
print(time.perf_counter())      # 4e-07
# 返回当前进程使用 CPU 的时间
print(time.process_time())      # 0.40625
# 当前程序暂停 3 秒
time.sleep(3)
# 将当前时间转换为指定格式的字符串
print(time.strftime('%Y-%m-%d %H:%M:%S'))   # 2019-11-12 09:27:44
st = '2019年11月12日'
# 将指定时间字符串转换(或恢复)成 struct_time 对象
print(time.strptime(st, '%Y年%m月%d日'))       # 格式化字符串要与时间字符串格式相匹配
# 查看从1970年1月1日0点开始到现在经过了多少秒
print(time.time())          # 1573522064.3641815
# 返回本地时区的时间偏移,以秒为单位
print(time.timezone)        # 我国在东八区输出是 -28800,-28800 / 3600 = -8,相差8小时

运行上面代码,输出如下结果:
Tue Nov 12 09:27:41 2019
Mon Nov 12 10:18:22 2019
Thu Jan  1 08:00:50 1970
time.struct_time(tm_year=1970, tm_mon=1, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=50, tm_wday=3, tm_yday=1, tm_isdst=0)
time.struct_time(tm_year=2019, tm_mon=11, tm_mday=12, tm_hour=1, tm_min=27, tm_sec=41, tm_wday=1, tm_yday=316, tm_isdst=0)
time.struct_time(tm_year=1970, tm_mon=1, tm_mday=1, tm_hour=8, tm_min=0, tm_sec=50, tm_wday=3, tm_yday=1, tm_isdst=0)
1573525231.0
4e-07
0.40625
2019-11-12 09:27:44
time.struct_time(tm_year=2019, tm_mon=11, tm_mday=12, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=1, tm_yday=316, tm_isdst=-1)
1573522064.3641815
-28800

在 time 模块中的 strftime() 和 strptime() 两个函数是互为逆函数,其中 strftime() 是将 struct_time 对象或时间元组转换为时间字符串;strptime() 是将时间字符串转换为 struct_time 对象。在实际应用中,可使用 localtime() 获取当前时间,再将当前时间以参数形式传递给 strftime() 函数的第二个参数,将按照该函数的第一个参数格式转换为时间字符串。另外,这两个函数都需要编写格式模板,在 Python 中时间格式字符串的指令有:

 

 

 

五、 JSON 支持

JSON 是一种轻量级、跨平台、跨语言的数据交换格式,JSON 格式被广泛应用于各种语言的数据交换中。

1、 JSON 基本知识

JSON 全称是 JavaScript Object Notation,即 JavaScript 对象符号,是一种轻量级的数据交换格式。JSON 格式的数据即适合人阅读,也适合计算机解析和生成。早期,JSON 是 JavaScript 语言的数据交换格式,后来发展成一种与语言无关的数据交换格式,这一点非常类似 XML。

JSON 在C、C++、C#、Java、JavaScript、Perl、Python等编程语言中使用广泛。JSON 提供了在多种语言之间完成数据交换的能力,因此,JSON 是一种非常理想的数据交换格式。JSON 有两种主要的数据结构:

(1)、由 key-value 对组成的数据结构。这种数据结构在不同的语言中不同的实现。例如,在 JavaScript 中是一个对象;在 Python 中是一种 dict 对象;在 C 语言中是一个 struct;在其他语言中可能是 record、dictionary、hash table等。

(2)、有序集合。这种数据结构在 Python 中对应于列表;在其他语言中,可能对应于 list、vector、数组和序列等。

这两种数据在不同的语言中都有对应实现,因此这种简便的数据表示方式可以实现跨语言。所以,JSON 可以作为程序设计语言中通用的
数据交换格式。在 JavaScript 中有两种语法,一种用于创建对象;另一种用于创建数组。

1.1 使用 JSON 语法创建对象
在早期的 JavaScript 版本中要创建 JSON 对象,需要写函数,并且使用 new 关键字。例如下面这样:

// 定义一个函数,可以作为该类的构造器
function Person(name, gender){
    this.name = name;
    this.gender = gender;
}
// 创建一个 Person 实例
var p = new Person('michael', 'male');
// 输出 Person 实例的 name 属性
alert(p.name);

从 JavaScript 1.2 开始,创建 JSON 对象更快捷的语法如下所示:

var p = {'name': 'michael', 'gender': 'male'};
alert(p);

在新版本的 JavaScript 中创建 JSON 对象的语法更加简捷、方便。从上面示例可知,在 JavaScript 中创建 JSON 对象时,以“{”开始,以“}”结束,对象的每个属性名和属性值之间以英文冒号(:)分隔,多个属性之间用英文逗号(,)分隔。语法格式如下:

object = {
key1: valeu1,
key2: value2,
...
};

在上面这个语法中,最后一个 key-value 对后面不需要有逗号(,),所以在定义时要留意。另外还需要注意的是,JavaScript 中定义JSON对象时,每个对象的 key 可以是字符串,也可以是非字符串,例如下面定义的 JSON 对象也是正确的:

// p 对象的 key 可以不是字符串,在 Python 中 key 必须是可 hash 的对象
var p = {name: 'stark', age: 25};
alert(p.name)

此外,使用 JSON 语法创建 JavaScript 对象时,属性值可以是普通字符串,也可以是任何基本数据类型,还可以是函数、数组,甚至是另外一个使用 JSON 语法创建的对象。例如:

person = {
    name: 'michael',
    age: 25,
    // 使用 JSON 语法创建一个属性
    son: {
        name: 'stark',
        grade: 1
    },
    // 使用 JSON 语法为 person 直接创建一个方法
    info: function(){
        console.log('姓名:' + this.name + '性别:' + this.sex);
    }
}

 

1.2 使用 JSON 语法创建数组
在早期的 JavaScript 语法中,使用下面的方式来创建数组:

// 创建数组对象
var a = new Array();
// 为数组元素赋值
a[0] = 'michael';
a[1] = 25;

也可通过下面的方式来创建数组:

// 创建数组对象时直接赋值
var a = new Array('michael', 25);
使用 JSON 语法创建数组非常简单,如下所示:
// 使用 JSON 语法创建数组
var a = ['michael', 25];

从上面这行代码可知,使用 JSON 创建数组时以英文左方括号([)开始,接着放入数组元素,各元素之间用英文逗号(,)分隔,最后一个
元素后面不需要英文逗号,而是以英文右方括号(])结束。使用 JSON 创建数组的语法格式如下:

arr = [val1, val2, ...]

JSON 语法简单易用,作为数值传输载体时,数据传输量小,在跨平台的数据交换中,经常采用 JSON 作为数据交换格式。在 Python 中有将 JSON 格式的字符串恢复成对象的方法(或函数),也有将某个对象转换成 JSON 字符串的方法。关于 JSON 的更多信息,可参考官方网站 http://www.json.org。

 

2、 Python 的 JSON 支持

json 模块可用于操作 JSON,该模块有的函数是将 JSON 字符串恢复成 Python 对象的,有的函数是将 Python 对象转换成 JSON 字符串的。

当把 JSON 对象或 JSON 字符串转换成 Python 对象时,从 JSON 类型到 Python 类型的对应转换关系如下所示:

当把 Python 对象转换成 JSON 格式字符串时,从 Python 类型到 JSON 类型的对应转换关系如下所示:

json 模块提供的属性和函数并不多,在交互式解释器中导入 json 模块,使用 json.__all__ 命令可查看全部属性和函数。

>>> import json
>>> json.__all__
['dump', 'dumps', 'load', 'loads', 'JSONDecoder', 'JSONDecodeError', 'JSONEncoder']

json 模块中常用的函数和类的功能如下:

(1)、json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw):将obj 对象转换成 JSON 字符串输出到 fp 流中,fp 是一个支持 write() 方法的类文件对象。

(2)、json.dumps(obj, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True,cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw):将 obj 对象转换为 JSON 字符串,并返回该 JSON 字符串。

(3)、json.load(fp, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):从 fp 流读取 JSON 字符串,将其恢复成 JSON对象,其中 fp 是一个支持 write()方法的类文件对象。

(4)、json.loads(s, *, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):将 JSON 字符串 s 恢复成 JSON 对象。

上面 4 个功能函数实现了 JSON 的两个主要应用场景,JSON 是一种轻量级的数据交换格式,它的主要应用场景是:

(1)、JSON字符串 decode(用load或loads) 转换成 Python 对象。
(2)、将 Python 对象 encode(用dump或dumps) 转换成 JSON 字符串。

下面代码将 Python 对象转换成 JSON 字符串,主要使用 dumps()和dump()函数的encode操作。代码如下:

import json
# 将 Python 对象转换为 JSON 字符串,元组会被当成数组
s = json.dumps(['michael', {'fav': ('coding', None, 'game', 25)}])
print(s)        # ["michael", {"fav": ["coding", null, "game", 25]}]
# 将简单的 Python 字符串转换为 JSON 字符串
s2 = json.dumps("\"foo\bar")
print(s2)       # "\"foo\bar"
# 将简单的 Python 字符串转换为 JSON 字符串
s3 = json.dumps("\\")
print(s3)       # "\\"
# 将 Python 的 dict 对象转换为 JSON 字符串,并对 key 排序
s4 = json.dumps({'c':3, 'b': 2, 'a': 1}, sort_keys=True)
print(s4)       # {"a": 1, "b": 2, "c": 3}
# 将 Python 列表转换为 JSON 字符串,并指定 JSON 分隔符,在逗号和冒号之后没有空格(默认有空格)
s5 = json.dumps([1, 2, 3, {'x': 5, 'y': 7}], separators=(',', ':'))
# 在输出的 JSON 字符串中,在逗号和冒号之后没有空格
print(s5)       # [1,2,3,{"x":5,"y":7}]
# 指定 indent 为4,此时转换的 JSON 字符串有缩进,缩进是4个空格
s6 = json.dumps({'Python': 5, 'Linux': 7}, sort_keys=True, indent=4)
print(s6)
# 伤脑筋 JSONEncoder 的 encode 方法将 Python 对象转换为 JSON 字符串
s7 = json.JSONEncoder().encode({'city': ('成都', '上海')})
print(s7)       # {"city": ["\u6210\u90fd", "\u4e0a\u6d77"]}
f = open('a.json', 'w')
# 使用 dump() 函数将转换得到的 JSON 字符串输出到文件中
json.dump(['Linux', {'Python': 'excellent'}], f, indent=4)

运行代码,输出结果如下:
["michael", {"fav": ["coding", null, "game", 25]}]
"\"foo\bar"
"\\"
{"a": 1, "b": 2, "c": 3}
[1,2,3,{"x":5,"y":7}]
{
    "Linux": 7,
    "Python": 5
}
{"city": ["\u6210\u90fd", "\u4e0a\u6d77"]}

上面代码中使用了 dumps() 函数的 encode 操作,在调用 dumps() 函数时指定了不同的选项。最后一行代码使用 dump() 函数将通过 encode 操作得到的 JSON 字符串输出到文件中。dumps() 和 dump() 函数的功能、所支持的选项基本相同,只是 dumps() 函数直接返回转换得到的 JSON 字符串,而 dump() 函数则将转换得到的 JSON 字符串输出到文件中。运行上面的代码,会在当前工作目录下生成一个 a.json 文件,文件内容就是转换得到的 JSON 字符串。

在上面代码中还调用了 json.JSONEncoder 对象的 encode() 方法,同样可以将 Python 对象转换为 JSON 字符串。而 dumps() 和dump() 函数是更高级的调用方式,通常调用 dumps() 和 dump() 函数对 Python 对象进行转换即可。

下面代码使用 loads() 和 load() 函数的 decode 操作将 JSON 字符串转换成 Python 对象。代码如下:

import json
# 将 JSON 字符串恢复成 Python 列表
r1 = json.loads('["michael", {"fav": ["coding", null, "game", 25]}]')
print(r1)       # ['michael', {'fav': ['coding', None, 'game', 25]}]
# 将 JSON 字符串恢复成 Python 字符串
r2 = json.loads('"\\"foo\\"bar"')
print(r2)       # "foo"bar
# 定义一个自定义的转换函数,将 real 数据转换成复数的实部,将 imag 转换成复数的虚部
def as_complex(dct):
    if '__complex__' in dct:
        return complex(dct['real'], dct['imag'])
    return dct
# 使用自定义的恢复函数
r3 = json.loads('{"__complex__": true, "real": 1, "imag": 2}', object_hook=as_complex)
print(r3)       # (1+2j)
f = open('a.json')
# 从文件中恢复 JSON 列表
r4 = json.load(f)
print(r4)       # ['Linux', {'Python': 'excellent'}]

运行代码,输出信息如下所示:
['michael', {'fav': ['coding', None, 'game', 25]}]
"foo"bar
(1+2j)
['Linux', {'Python': 'excellent'}]

在上面代码中,使用 loads() 函数将 JSON 字符串转换成 Python 列表、Python字符串。接下来使用自定义的转换函数,将原本应该恢复成 dict 对象的 JSON 字符串恢复成复数,并将字典中 real 对应的值转换成复数的实部,将字典中 imag 对应的值转换成复数的虚部。

通过使用自定义的恢复函数,可以完成 JSON 类型到 Python 特殊类型(如复数、矩阵)的转换。上面代码最后使用 load() 函数从文件流来恢复 JSON 列表。

此外,Python 支持的类型中有些是 JSON 所不支持的,比如复数、矩阵等,这些不能直接使用 dumps() 或 dump() 函数进行转换,直接转换会出问题。此时需要对 JSONEncoder 类进行扩展,通过扩展来完成从 Python 特殊类型到 JSON 类型的转换。

下面代码通过扩展 JSONEncoder 来实现从 Python 复数到 JSON 字符串的转换。代码如下:

import json
# 定义 JSONEncoder 的子类
class ComplexEncoder(json.JSONEncoder):
    def default(self, o):
        # 如果要转换的对象是复数类型,就进行处理
        if isinstance(o, complex):
            return {"__complex__": 'true', 'real': o.real, 'imag': o.imag}
        # 对于其他类型,还是使用 JSONEncoder 默认处理
        return json.JSONEncoder.default(self, o)
# 第一种转换方式,将自定义的转换类传递给 dumps() 函数的 cls 参数
s1 = json.dumps(2 + 1j, cls=ComplexEncoder)
print(s1)       # {"__complex__": "true", "real": 2.0, "imag": 1.0}
# 第二种调用方式,直接调用自定义类的 encode() 实例方法转换
s2 = ComplexEncoder().encode(2 + 1j)
print(s2)       # {"__complex__": "true", "real": 2.0, "imag": 1.0}

运行代码,输出结果如下所示:
{"__complex__": "true", "real": 2.0, "imag": 1.0}
{"__complex__": "true", "real": 2.0, "imag": 1.0}

上面代码中对 JSONEncoder 类进行了扩展,并重写父类的 default() 方法,在方法中对被转换的目标类型进行判断,如果是复数类型(complex)就使用自定义转换将复数转换成 JSON 对象,且该对象包含 "__complex__":"true" 属性。

对 JSONEncoder 类扩展后,有两种调用自定义的子类。

(1)、在 dumps() 或 dump() 函数中通过 cls 参数指定使用 JSONEncoder 的自定义子类。
(2)、直接使用自定义子类的 encode() 方法执行转换。
posted @ 2020-01-06 15:21  远方那一抹云  阅读(327)  评论(0编辑  收藏  举报