Python学习手册之数据类型

 在上一篇文章中,我们介绍了 Python 的异常和文件,现在我们介绍 Python 中的数据类型。

查看上一篇文章请点击:https://www.cnblogs.com/dustman/p/9979931.html

数据类型
None 类型
None 类型是 Python 的特殊类型,它是 NoneType 的对象类型,表示无值。该对象只有一个值 None。其它语言使用 null 来表示这个对象。
它不支持任何运算也没有任何内建方法。作为一个对象其布尔值为 False。除了和自己比较,None 和任何其他的数据类型比较永远返回 False

>>> None == True
False
>>> None
>>> print(None)
None
>>> None == None
True
>>>

如果函数没有清楚地声明返回值,则返回 None 对象。

def func():
 print("I like Python!")
temp = func()
print(temp)

运行结果:

>>>
I like Python!
None
>>>

字典
字典(Dictionaries)是 Python 中一个非常有用的内置数据类型。它不像列表一样通过数字索引来访问,字典当中的元素是通过键来存取。
字典是一个映射类型,在其它语言中被称为 map。字典用 {} 来标识,使用键 : 值 (key : value) 存储,具有极快的查找速度,使用 [] 语法来访问。

sex = {"John":"F","Amy":"M","Echo":"F"}
print(sex["Amy"])
print(sex["John"])

运行结果:

>>>
M
F
>>>

访问不存在字典里的键值会导致 KeyError 异常。

msg = {
 "name":"John",
 "sex":"M",
 "age":10,
}
print(msg["name"])
print(msg["age"])
print(msg["son"])

运行结果:

>>>
John
10

KeyError:
'son' >>>

实际上字典能够存储任何类型的数据。

字典为空时的表现形式为 {}

只有不可变的对象可以用作字典的 key,不可变的对象是指那些不能更改的对象。到目前为止,我们遇到的唯一可变对象是列表和字典。可变对象做键值会触发 TypeError 异常。

msg = {
 ['a','b','c']:"a to c"
}

运行结果:

>>>
TypeError: unhashable type: 'list'
>>>
正确使用字典非常重要,需要牢记字典的 key 必须是不可变对象。

字典方法

我们知道字典是可变对象,可以像列表一样,字典的键值存储的数值可以重新指派另外的值。

不同于列表的是,我们可以通过字典的键值存储数据,不管这个键存不存在字典里。

msg = {
 "name":"John",
 "sex":"M",
 "age":10,
}
msg[2] = "Home"
msg[8] = "Job"
print(msg)

运行结果:

{'name': 'John', 'sex': 'M', 'age': 10, 2: 'Home', 8: 'Job'}

要在字典里确定一个键是否存在词典里,你可以使用 in 语法。

msg = {
 "name":"John",
 "sex":"M",
 "age":10,
}
print("name" in msg)
print("job" in msg)
print("age" in msg)

运行结果:

>>>
True
False
True
>>>

我们还可以通过 get 的方法从字典里取数据,就像前面用 msg["name"] 这样的方法读取数据。与这种方法不同的是,当字典里没有该键值时 get 方法取回的值是 None,而不会触发 KeyError 异常。

msg = {
 "name":"John",
 "sex":"M",
 "age":10,
 "Job":False,
}
print(msg.get("name"))
print(msg.get(6))
print(msg.get(123,"Not in dictionary!"))

运行结果:

>>>
John
None
Not in dictionary!
>>>
我们还可以指定 get 方法的第二个参数,当键值在字典里不存在是会返回我们所指定的值。

下面代码运行结果是什么?

msg = {
 1:1,2:1,3:2,4:3,
}
print(msg.get(2,0) + msg.get(8,3))

运行结果:

>>>
4
>>>

元组

元组 (Tuples) 跟列表很像,但是元组不能提供列表类能够提供给你的很多功能。元组的一大特征就是不可变。

元组使用圆括号来创建。

msg = ("Hello","World","!",)

你可以像访问列表一样,通过索引来访问元组。

print(msg[1])

给元组的元素重新分配值会触发 TypeError 异常。

msg[0] = "Thank"

运行结果:

>>>
TypeError: 'tuple' object does not support item assignment
>>>
和列表字典一样,元组也能嵌套存储。

我们也可以不用圆括号就创建元组,通过逗号分割来确定元组的分组。

msg = "Hello","World","!"
print(msg[0])

运行结果:

>>>
Hello
>>>

空元祖必须通过圆括号创建。

empty = ()
尽管元组不能改变,但是运行速度快于列表。

列表切片

Python 为列表提供了高级特征切片 (Slice) 操作功能,大大弱化了获取一个列表区间的操作。切片操作通过两个索引数字中间用冒号分割来完成,返回从第一个数字索引到第二个数字索引的一个新列表。

msg = [0,1,2,3,4,5,14,28,32]
print(msg[2:5])
print(msg[0:1])

运行结果:

>>>
[2, 3, 4]
[0]
>>>
range 函数操作一样,包含第一个数字索引里的值,不包含第二个数字索引的值。

如果切片的第一个数字忽略,切片操作从 0 开始,如果切片的第二个数字缺失,切片操作直到列表尾部结束。

msg = [0,1,2,3,4,5,14,28,32]
print(msg[:5])
print(msg[5:])

运行结果:

>>>
[0, 1, 2, 3, 4]
[5, 14, 28, 32]
>>>
切片操作同样可以作用于元组。

列表切片操作同样可以提供第三个参数,这一参数将被视为切片的步长 (Step) ,在默认情况下,步长大小为 1、

msg = [0,1,2,3,4,5,14,28,32]
print(msg[:2])
print(msg[2:8:2])

运行结果:

>>>
[0, 1]
[2, 4, 14]
>>>
[2:8:2] 将会取出列表从索引 2 开始直到索引 8 并且每隔 2 个取一个列表的元素。

索引操作也可以使用负数,在这种情况下,位置计数将从列表的末尾开始。

msg = [0,1,2,3,4,5,14,28,32]
print(msg[1:-1])

运行结果:

>>>
[1, 2, 3, 4, 5, 14, 28]
>>>
如果步进使用负值,则切片操作将从后向前执行。
使用 [::-1] 切片是一种常见的方法来反转列表。

列表生成式
列表生成式即 List Comprehensions,是 Python 内置的非常强大却简单的可以用来创建列表的生成式。

# a list comprehension
cubes = [i**2 for i in range(5)]
print(cubes)

运行结果:

>>>
[0, 1, 4, 9, 16]
>>>

列表生成式同样可以包含 if 条件判断,一遍创建一个符合一定条件的列表。

cubes = [i**2 for i in range(5) if i**2 % 2 ==0]
print(cubes)

运行结果:

>>>
[0, 4, 16]
>>>

通过列表生成式生成一个非常大的列表会引发 MemoryError 异常。

even = [2*i for i in range(10**150)]

运行结果:

>>>
MemoryError
>>>
这个问题我们可以通过 迭代器 来解决这个问题,迭代器将会在下一篇文章中讲到。

字符串格式化

我们经常会输出劣势 '尊敬的客户,您尾号xx的账户向xx公司完成xx交易,余额xx'之类的字符串,而 xxx 的内容都是根据变量变化的。
所以,需要一种简便的格式化字符串的方式。String 对象提供了一个 format 方法。

# string formatting
nums = [1,2,3]
msg = "Numbers:{0} {1} {2}".format(nums[0],nums[1],nums[2])
print(msg)

运行结果:

>>>
Numbers:1 2 3
>>>
每一个参数对应字符串里相应的占位符 {}。使用数字的方式不仅可以交换参数的位置,甚至可以在字符串里面换位,比如 {5} 在最前面。

字符串格式化也可以用命名参数替换。

msg = "{a},{b}".format(a=5,b=15)
print(msg)

运行结果:

>>>
5,15
>>>

Python 还提供了另一种格式化的方法。这种格式化方式和 C 语言一致用 % 实现,举例如下:

s = 'Hello,%s' % 'Python'
print(s)
s = 'Hi,%s,you have $%d' % ('man',100)
print(s)

运行结果:

>>>
Hello,Python
Hi,man,you have $100
>>>

% 运算符就是用来格式化字符串的,下图是常见的占位符。

在字符串内部,%s 表示用字符串替换,%d表示用整数替换,有几个 %? 占位符,后面就跟几个变量或者值,顺序需要对应好。如果只有一个 %?,括号可以省略。

常用方法

字符串方法

Python 标准库内建一些常用的方法。
join - 用一个字符串作为分隔符连接字符串列表。
replace - 对字符串进行替换操作。
startswith - 字符串是否以另一个字符串开头。
endswith - 字符串是否以另一个字符串结束。
upperlower - 返回字符串以大写或小写的形式。
split - 切割字符串为列表。

print(",".join(["man","and","boy"]))
print("Hello me".replace("me","world"))
print("This is a man".startswith("This"))
print("This is a woman".endswith("woman"))
print("this is a boy".upper())
print("THIS IS A GIRL".lower())
print("man,and,boy".split(","))

运行结果:

>>>
man,and,boy Hello world True True THIS IS A BOY this is a girl ['man', 'and', 'boy']
>>>

数学方式
maxmin - 查找一组数里最大和最小的值。
abs - 绝对值。
round - 四舍五入
sum - 数字列表里数字的总和。

print(max(9,8,7,4,5,2,1))
print(min(1,2,3,4,0,-5))
print(abs(-41))
print(abs(32))
print(sum([100,455,78,-584]))

运行结果:

>>>
9
-5
41
32
49
>>>

列表方法
标准库提供了一些非常有用的函数,allany 函数为我们对列表进行条件判断提供了方便。函数 enumerate 也提供了另一种方式来遍历列表的方法。

nums = [14,51,48,46,11]

if all([i > 6 for i in nums]): print("All larger than 6")
if any([i % 2 == 0 for i in nums]): print("At least on is even")
for v in enumerate(nums): print(v)

运行结果:

>>>
All larger than 6
At least on is even
(0, 14)
(1, 51)
(2, 48)
(3, 46)
(4, 11)
>>>

文本分析
现在我们来做学习一个文本分析的具体例子,我们来分析文本里每个字母出现的百分比。首先我们打开一个文件并读取内容。

filename = input("Enter a filename: ")
with open(filename) as f:
msg= f.read()

print(msg)

运行结果:

Enter a filename: test.txt
I like Python!!!!!
I like Python!!!!
I like Python!!!
I like Python!!
I like Python!
I like Python

下面代码用来统计一个字母出现在字符串的次数。

def count_char(test,char):
 count = 0
 for c in test:
  if c == char:
   count += 1
 return count

这个函数接受两个参数,一个是字符串,一个是字母,返回字母出现在字符串的次数。现在我们可以打开文件调用它。

filename = input("Enter a filename: ")
with open(filename) as f:
 msg= f.read()

print(count_char(msg,'P'))

运行结果:

>>>
Enter a filename: test.txt
6
>>>
字母 "P" 总共出现在文件里 6 次。

接下来就是统计每个字母出现在文件的百分比。

for char in "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz":
 percent = 100 * count_char(msg,char) / len(msg)
 print("{0} - {1}%".format(char,round(percent,2)))

把所有的代码合并在一起运行。

def count_char(content,char):
 count = 0
 for c in content:
  if c == char:
   count += 1
 return count

filename = input("Enter a filename: ")
with open(filename) as f:
 msg= f.read()

 print(count_char(msg, 'P'))
for char in "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz":
 percent = 100 * count_char(msg,char) / len(msg)
 print("{0} - {1}%".format(char,round(percent,2)))

运行结果:

>>>
Enter a filename: test.txt
6
A - 0.0%
a - 0.0%
B - 0.0%
b - 0.0%
C - 0.0%
c - 0.0%
...
H - 0.0%
h - 6.0%
I - 6.0%
i - 6.0%
J - 0.0%
...
>>>

 

 

 

“今年的我们已与去年不同,我们的爱人亦是如此,如果变化中的我们依旧爱着那个变了的另一半,那是幸运所致。”    

                                      -- 毛姆(英国小说家/故事圣手)

posted @ 2018-11-23 10:30  清洁工老板  阅读(714)  评论(0编辑  收藏  举报