python 基础之数据类型
一、python中的数据类型之列表
1、列表
列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储、修改等操作
二、列表常用操作
>切片
>追加
>插入
>修改
>删除
>扩展
>拷贝
>统计
>排序
>翻转
>>> names = ["admin","abc","jack","lily"] #定义列表 >>> names #查表中的元素 ['admin', 'abc', 'jack', 'lily'] 通过下标访问列表中的元素,下标从0开始计数 >>> names[0] 'admin' >>> names[1] 'abc' >>> names[2] 'jack' 取最后一个元素: >>> names[-1] 'lily' 取倒数第二个元素: >>> names[-2] 'jack'
2.1.1、切片:取多个元素
>>> names ['admin', 'abc', 'jack', 'lily'] >>> names[0:3] #取下标0到下标3之间的数字,包括0,不包括3 ['admin', 'abc', 'jack'] >>> names[:3] #从头开始取,0可以忽略,跟上问效果一样 ['admin', 'abc', 'jack'] >>> names[0:-1] #取下标0到-1之前的数字,包括0,不包括-1.也就是最后一个 ['admin', 'abc', 'jack'] >>> names[1:] #如果想取到最后一个,只能这么写,不能写-1 ['abc', 'jack', 'lily'] >>> names[1:-1] #如果写成-1,此时不包括-1 ['abc', 'jack'] >>> names[0::2] #后面的2代表每隔一个元素取一个 ['admin', 'jack'] >>> names[::2] #跟上句效果一样 ['admin', 'jack']
2.1.2、追加
>>> names ['admin', 'abc', 'jack', 'lily'] >>> names.append("追加第一个") #追加函数 append,默认追加到最后一个 >>> names ['admin', 'abc', 'jack', 'lily', '追加第一个'] >>> names.append("追加第二个") >>> names ['admin', 'abc', 'jack', 'lily', '追加第一个', '追加第二个']
2.1.3、插入
>>> names ['admin', 'abc', 'jack', 'lily', '追加第一个', '追加第二个'] >>> names.insert(1,"我是新来的") #在下标1的前面插入一个元素 >>> names ['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', '追加第二个'] >>> names.insert(-1,"我也是新来的") #在倒数第一个前面插入一个元素 >>> names ['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', '我也是新来的', '追加第二个']
2.1.4、修改
>>> names ['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', '我也是新来的', '追加第二个'] >>> names[6] = "boy" #将下标6的元素改为boy >>> names ['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', 'boy', '追加第二个']
2.1.5、删除
删除可以有三种方法实现 >>> names ['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', 'boy', '追加第二个'] >>> del names[3] #删除下标为第3个的元素 ‘蜡jack' >>> names ['admin', '我是新来的', 'abc', 'lily', '追加第一个', 'boy', '追加第二个'] >>> names ['admin', '我是新来的', 'abc', 'lily', '追加第一个', 'boy', '追加第二个'] >>> names.remove("abc") #删除指定元素 >>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy', '追加第二个'] >>> names.pop() #删除最后一个元素并将删除元素显示出来 '追加第二个' >>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy']
2.1.6、扩展
>>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy'] >>> a = ["123","abc","321"] >>> names.extend(a) #将两个列表扩展成一个列表 >>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy', '123', 'abc', '321'] >>> a #列表不会改变 ['123', 'abc', '321']
2.1.7、拷贝
>>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy'] >>> names_copy = names.copy() >>> names_copy ['admin', '我是新来的', 'lily', '追加第一个', 'boy']
2.1.8、统计
>>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy', 'admin', 'admin'] >>> names.count("admin") #统计列表中相同元素的个数 3
2.1.9、排序
>>> names ['admin', '我是新来的', 'lily', '追加第一个', 'boy', 'admin', 'admin', '123', 'abc', '321'] >>> names.sort() #排序 >>> names ['123', '321', 'abc', 'admin', 'admin', 'admin', 'boy', 'lily', '我是新来的', '追加第一个']
2.2.1、翻转
>>> names ['123', '321', 'abc', 'admin', 'admin', 'admin', 'boy', 'lily', '我是新来的', '追加第一个'] >>> names.reverse() >>> names ['追加第一个', '我是新来的', 'lily', 'boy', 'admin', 'admin', 'admin', 'abc', '321', '123']
2.2.2、获取下标
>>> names ['追加第一个', '我是新来的', 'lily', 'boy', 'admin', 'admin', 'admin', 'abc', '321', '123'] >>> names.index("admin") #只返回找到的第一个下标 4
2.2.3、长度获取
>>> names ['追加第一个', '我是新来的', 'lily', 'boy', 'admin', 'admin', 'admin', 'abc', '321', '123'] >>> len(names) #列表中元素的个娄 10
三、python 字符串函数
Python内置的字符串处理函数整理,收集常用的Python 内置的各种字符串处理 函数的使用方法
>>> abc = "Python String Function" #生成字符串变量 >>> abc 'Python String Function' >>> len(abc) #字符串长度获取,从0开始,包括空格在内 22 >>> abc[0] 'P' >>> abc[21] 'n'
3.1、字母处理
>>> abc 'Python String Function' >>> abc.upper() #全部大写 'PYTHON STRING FUNCTION' >>> abc.lower() #全部小写 'python string function' >>> abc.swapcase() #大小写互换 'pYTHON sTRING fUNCTION' >>> abc.capitalize() #首字母大写,其他小写 'Python string function' >>> abc.title() #首字母大写 'Python String Function'
3.2、格式化相关
>>> abc 'Python String Function' >>> abc.ljust(30,"*") #获取固定长度,左对齐,右边不够*补齐,不加*会以空格补齐 'Python String Function********' >>> abc.rjust(30) #获取固定长度,右对齐,左边不够*补齐 '********Python String Function' >>> abc.center(30,"*") #获取固定长度,中间对齐,两边不够用*补齐 '****Python String Function****'
3.3、搜索相关
>>> abc 'Python String Function' >>> abc.find("b") #搜索指定字符串,没有返回-1 -1 >>> abc.find("t",3) #指定起始位置搜索,返回的是第二个t的下标 8 >>> abc.find("t",1,13) #指定开始及结束位置搜索,如果找到多个,只返回第一个的下标 2 >>> abc.rfind("t") #从右边开始找 18 >>> abc.count("t") #指定字符串的个数 3 上面所有方法都可用index代替,不同的是使用index查找不到会抛异常,而find返回-1
3.4、替换相关
>>> abc 'Python String Function' >>> abc.replace("tion","TION") #将指定字符串替换为大写 'Python String FuncTION' >>> abc.replace("t","*",1) #替换字符串中的第一个t为* 'Py*hon String Function'
3.5、去空格及去指定字符
>>> abc.strip() #去两边空格 'Python String Function' >>> abc.lstrip() #去左边空格 'Python String Function' >>> abc.rstrip() #去右边空格 'Python String Function' >>> abc.strip("n") #去两边字符串,也有lstrip和rsrtip 'Python String Functio'
3.6、判断相关
>>> abc 'Python String Function' >>> abc.startswith("P") #是否以P开头,是则为True,不是则为False True >>> abc.endswith("n") #是否以n结尾,是则为True,不是则为False True >>> abc.isalnum() #是否全为字母或数字,是则为True False >>> abc.isalpha() #是否全为字母,不是则为False,因为还有空格 False >>> abc.isdigit() #是否全为数字,不是则False False >>> abc.islower() #是否全小写 False >>> abc.isupper() #是否全大写 False
四、元组
定义:与列表类似,只不过[]改成()
特性:
1.可存放多个值
2.不可变
3.按照从左到右的顺序定义元组元素,下标从0开始顺序访问,有序
>>> ages = ("10","20","30","40") >>> ages ('10', '20', '30', '40')
注:只有2个方法,一个是count,一个是index
五、字典
定义:{key1:value1,key2:value2},key-value结构,key必须可hash
字典一种key - value 的数据类型
语法:
>>> info = { ... "stu1":{"lily":{"age":18,"job":"IT"}}, ... "stu2":{"jack":{"age":20,"job":"IT"}}, ... "stu3":{"admin":{"age":30,"job":"Driver"}} ... } >>> info {'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}
字典的特性:
- dict是无序的
- key必须是唯一的,天生去重
5.1、增加
>>> info["abc"] = {"age":22,"job":"IT"} >>> info {'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'abc': {'age': 22, 'job': 'IT'}, 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}
5.2、修改
>>> info["abc"] = "xiaoming" >>> info {'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'abc': 'xiaoming', 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}
5.3、删除
>>> info {'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'abc': 'xiaoming', 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}} >>> del info["abc"] >>> info {'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}} >>> #另一种方法 >>> info.pop("stu3") {'admin': {'age': 30, 'job': 'Driver'}} >>> info {'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}}
5.4、查找
>>> info {'stu2': {'admin': {'age': 30, 'job': 'Driver'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'stu3': {'jack': {'age': 20, 'job': 'IT'}}} >>> "stu3" in info #显示返回值 True >>> info["stu3"] #第二种方法 {'jack': {'age': 20, 'job': 'IT'}} >>> info["stu4"] #如果没找到会报错 Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 'stu4' >>> info.get("stu3") #第三种方法 {'jack': {'age': 20, 'job': 'IT'}} >>> info.get("stu4") #没找到不会报错 >>>
其他方法:
>>> info.values() dict_values([{'admin': {'age': 30, 'job': 'Driver'}}, {'lily': {'age': 18, 'job': 'IT'}}, {'jack': {'age': 20, 'job': 'IT'}}]) >>> info.keys() dict_keys(['stu2', 'stu1', 'stu3']) >>> a = {1:2,2:3,"a":"b"} >>> info.update(a) >>> info {'stu1': {'lily': {'job': 'IT', 'age': 18}}, 1: 2, 2: 3, 'stu2': {'jack': {'job': 'IT', 'age': 20}}, 'stu3': {'admin': {'job': 'Driver', 'age': 30}}, 'a': 'b'} >>> info.items() dict_items([('stu1', {'lily': {'job': 'IT', 'age': 18}}), (1, 2), (2, 3), ('stu2', {'jack': {'job': 'IT', 'age': 20}}), ('stu3', {'admin': {'job': 'Driver', 'age': 30}}), ('a', 'b')])
循环、、、
info = { "name1":"lily", "name2":"admin", "name3":"jack", "name4":"abc" } for key in info: print(key,info[key]) name3 jack name1 lily name2 admin name4 abc
六、集合
集合是一个无序的,不重复的数据组合,它的主要作用如下:
- 去重,把一个列表变成集合,就自动去重了
- 关系测试,测试两组数据之前的交集、差集、并集等关系
集合常用操作:关系运算
in
not in
==
!= 不等于
<,<=
>,>=
|,|=:合集
&.&=:交集
-,-=:差集
^,^=:对称差分
set 的创建:
>>> L = [1,1,2,4,3] >>> t = (2,3,4,6,6,6,7) >>> s = {1} >>> type(s) <class 'set'> >>> s= set(L) >>> s {1, 2, 3, 4} #从列表到集合 >>> s = set(t) >>> s {2, 3, 4, 6, 7} #从元组到集合
set 基本函数与操作:
s.add( x ) 将元素 x 添加到集合s中,若重复则不进行任何操作
>>> s = {1,2,"a"} >>> s.add("b") >>> s {1, 2, 'b', 'a'} >>> s.add(1) >>> s {1, 2, 'b', 'a'}
s.update( x ) 将集合 x 并入原集合s中,x 还可以是列表,元组,字典等,x 可以有多个,用逗号分开
>>> s {1, 2, 'b', 'a'} >>> s.update({1,3}) >>> s {1, 2, 'b', 3, 'a'} >>> s.update([1,4]) >>> s {1, 2, 'b', 3, 4, 'a'}
s.discard( x )将 x 从集合s中移除,若x不存在,不会引发错误
>>> s {1, 2, 'b', 3, 4, 'a'} >>> s.discard(1) >>> s {2, 'b', 3, 4, 'a'} >>> s.discard(1) >>> s {2, 'b', 3, 4, 'a'}
s.remove( x ) 将 x 从集合s中移除,若x不存在,会引发错误
>>> s {2, 'b', 3, 4, 'a'} >>> s.remove("a") >>> s {2, 'b', 3, 4} >>> s.remove("a") Traceback (most recent call last): File "<input>", line 1, in <module> KeyError: 'a'
s.pop() 随机删除并返回集合s中某个值,注意,因为set是无序的,不支持下标操作,没有所谓的最后一个,pop()移除随机一个元素,这和其他数据结构不同
>>> s {2, 'b', 3, 4} >>> s.pop() 2 >>> s {'b', 3, 4}
s.clear() 清空
len(s) set支持len操作
>>> s {'b', 3, 4} >>> len(s) 3
x in s set同样支持in操作
>>> s {'b', 3, 4} >>> 1 in s False >>> 3 in s True
s.union( x ) 返回s与集合x的交集,不改变原集合s,x 也可以是列表,元组,字典。
>>> s1 = {1,2,3} >>> s2 = {"a","b"} >>> s1.union(s2) {1, 2, 3, 'b', 'a'} >>> s1 {1, 2, 3} >>> s2 {'b', 'a'}
s.intersection( x ) 返回s与集合x的并集,不改变s, x 也可以是列表,元组,字典。
>>> s1 = {1,2,3} >>> s2 = {2,3,4} >>> s1.intersection(s2) {2, 3} >>> s1 {1, 2, 3}
s.symmetric_difference( x ) 返回s和集合x的对称差集,即只在其中一个集合中出现的元素,不改变集合s, x 也可以是列表,元组,字典。
>>> s1 {1, 2, 3} >>> s2 {2, 3, 4} >>> s1.symmetric_difference(s2) {1, 4} >>> s1 {1, 2, 3}
s.issubset( x ) 判断 集合s 是否是 集合x 子集
s.issuperset( x ) 判断 集合x 是否是集合s的子集
>>> s1 = {1,2,3} >>> s2 = {1,3} >>> s2.issubset(s1) True >>> s1.issubset(s2) False >>> s1.issuperset(s2) True
求交集,并集,差集,对称差集的另一种方法:
>>> s1 = {1,2,3,"a"} >>> s2 = {3,4,"b"} >>> s1 & s2 #交集 {3} >>> s1 | s2 #并集 {1, 2, 3, 'b', 4, 'a'} >>> s1 - s2 #差集 {1, 2, 'a'} >>> s1 ^ s2 #对称差集 {1, 'b', 2, 4, 'a'}
{ } 在布尔运算中表示 False,其他均为 True
七、文件操作
对文件操作流程
- 打开文件,得到文件句柄并赋值给一个变量
- 通过句柄对文件进行操作
- 关闭文件
模式 | 描述 |
---|---|
r | 打开一个文件为只读。文件指针被放置在文件的开头。这是默认模式。 |
rb | 打开一个文件只能以二进制格式读取。文件指针被放置在文件的开头。这是默认模式。 |
r+ | 打开用于读和写文件。文件指针置于该文件的开头。 |
rb+ | 打开用于读取和写入二进制格式的文件。文件指针置于该文件的开头。 |
w | 打开一个文件只写。如果文件存在覆盖该文件。如果该文件不存在,则创建写入新文件。 |
wb | 打开一个文件只能以二进制格式写入。如果文件存在覆盖该文件。如果该文件不存在,则创建写入新文件。 |
w+ | 打开文件为写入和读取模式。如果文件存在覆盖现有文件。如果该文件不存在,创建用于读写操作的新文件。 |
wb+ | 打开用于以二进制格式写入和读出文件。如果文件存在覆盖现有文件。如果该文件不存在,创建用于读写操作的新文件。 |
a | 打开用于追加的文件。文件指针是在文件是否存在该文件的末尾。也就是说,该文件是在追加模式。如果该文件不存在,它会创建一个用于写入的新文件。 |
ab | 打开文件用于二进制格式追加。文件指针是在文件是否存在该文件的末尾。也就是说,文件是在追加模式。 如果该文件不存在,它会创建一个用于写入的新文件。 |
a+ | 打开文件为追加和读取方式。文件指针是在文件是否存在该文件的末尾。该文件以追加模式打开。如果该文件不存在,它将创建用于读写操作的新文件。 |
ab+ | 打开一个文件以附加和二进制格式读取模式。如果该文件存在文件指针在该文件的末尾。该文件以追加模式打开。如果该文件不存在,它将创建读写操作的新文件。 |
file 对象属性
一旦文件被打开,则就会有一个文件对象,你就可以得到有关该文件的各种信息。
属性:
描述 | |
---|---|
file.closed |
如果文件被关闭返回true,否则为false
|
file.mode |
返回文件打开访问模式
|
file.name |
返回文件名
|
示例:
1 fo = open("foo.txt","wb") 2 print("Name of the file:",fo.name) 3 print("Closed or not :",fo.closed) 4 print("Opening mode:",fo.mode) 5 fo.close()
结果:
Name of the file: foo.txt Closed or not : False Opening mode: wb
close()方法
文件对象的close()方法用于刷新任何未写入的信息,并关闭文件对象, 之后就没有更多的写入东西了。
Python自动关闭文件当参考文件对象分配给另一个文件。使用 close()方法关闭文件一个很好的做法。
fileObject.close();
示例:
fo = open("foo.txt","wb") print("Name of the file:",fo.name) fo.close()
结果:
Name of the file: foo.txt
文件对象提供了一组访问方法。 我们将看到如何使用 read()和write()方法来读取和写入文件。
write() 方法
write()方法将字符串写入一个打开的文件。要注意,Python的字符串可以是二进制数据,而不仅仅只是文字。
语法:
fileObject.write(string);
示例:
fo = open("foo.txt","w") fo.write("Python is a great language.\n Yeah its great!\n") fo.close()
上面的方法将创建 foo.txt 文件,并给出的内容写入文件,最后将关闭该文件。如果打开这个文件,会看到它有以下内容。
Python is a great language. Yeah its great!
read() 方法
read()方法从一个打开的文件读取字符串。要注意,Python字符串可以是二进制数据。而并非只是文本数据。
语法
fileObject.read([count]);
这里,传递的参数是从打开的文件读取的字节数。该方法开始从文件的开始读取,并且如果 count 丢失,那么它会尝试尽可能读,也许直到文件的末尾。
示例
# Open a file fo = open("foo.txt", "r+") str = fo.read(10) print ("Read String is : ", str) # Close opened file fo.close()
Read String is : Python is
tell() 方法告诉你该文件中的当前位置;换句话说,下一个读或写将发生在从该文件的开头之后多个字节。
seek(offset[, from]) 方法改变当前文件的位置。 offset 参数指示要移动字节数。from 参数指定字节从哪移动的参考位置。
如果 from 被设置为0,这意味着使用该文件的开头作为基准位置,以及如果设置为1,则使用当前位置作为基准位置,如果它被设置为2,则该文件的结束将被作为基准位置。
示例
# Open a file fo = open("foo.txt", "r+") str = fo.read(10) print ("Read String is : ", str) # Check current position position = fo.tell() print ("Current file position : ", position) # Reposition pointer at the beginning once again position = fo.seek(0, 0) str = fo.read(10) print ("Again read String is : ", str) # Close opened file fo.close()
Read String is : Python is Current file position : 10 Again read String is : Python is
八. 字符编码与转码
详细文章:
http://www.cnblogs.com/yuanchenqi/articles/5956943.html
http://www.diveintopython3.net/strings.html
需知:
1.在python2默认编码是ASCII, python3里默认是utf-8
2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), so utf-8就是unicode
3.在py3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string