Python编程-数据类型方法
一、进制简介
进制也就是进位制,是人们规定的一种进位方法。对于任何一种进制---X进制,就表示某一位置上的数运算时是逢X进一位。十进制是逢十进一,十六进制是逢十六进一,二进制就是逢二进一,以此类推,x进制就是逢x进位。
1.位和字节
位(bit)表示二进制位。位是计算机内部数据储存的最小单位,11010100是一个8位二进制数。
字节(byte)习惯上用大写的“B”表示。字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即1个字节等于8个比特(1Byte=8bit)。
八位二进制数最小为00000000,最大为11111111;通常1个字节可以存入一个ASCII码,2个字节可以存放一个汉字国标码。
(1) bit:位
一个二进制数据0或1,是1bit;
(2) byte:字节
1 byte = 8 bit
(3) 一个英文字符占一个字节;
1 字母 = 1 byte = 8 bit
(4) 一个汉字占2个字节;
1 汉字 = 2 byte = 16 bit
GBK:一个汉字占用两个字节,GB18030编码向下兼容GBK和GB2312。
UTF-8:一个汉字占用3个字节
每种编码都有自己的码表,因此编码规则是不一样的。
2.二进制
二进制是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一”。
数据在计算机中主要是以补码的形式存储的。计算机中的二进制则是一个非常微小的开关,用“开”来表示1,“关”来表示0。
二进制就是等于2时就要进位。
0=00000000
1=00000001
2=00000010
3=00000011
4=00000100
5=00000101
6=00000110
7=00000111
8=00001000
9=00001001
10=00001010
3.十进制
十进制基于位进制和十进位两条原则,即所有的数字都用10个基本的符号表示,满十进一,同时同一个符号在不同位置上所表示的数值不同,符号的位置非常重要。基本符号是0到9十个数字。
0 1 2 3 4 5 6 7 8 9
4.十六进制
十六进制是计算机中数据的一种表示方法。同我们日常生活中的表示法不一样。它由0-9,A-F组成,字母不区分大小写。与10进制的对应关系是:0-9对应0-9;A-F对应10-15。
0 1 2 3 4 5 6 7 8 9 A B C D E F
5.各进制对照表
二、字符串str
1.类和对象
在python中,一个对象的特征也称为属性(attribute)。它所具有的行为也称为方法(method)
结论:对象=属性+方法
在python中,把具有相同属性和方法的对象归为一个类(class)。
类是对象的抽象化,对象是类的实例化。类不代表具体的事物,而对象表示具体的事物。
类是抽象的,不占用内存,而对象是具体的,占用存储空间。类是用于创建对象的蓝图,它是一个包括在特定类型的对象中的方法和变量的模板。
打个比方:
智能手机就是一个类(class),它是某类对象的统称,而你手上的这部iPhone7就是从属于智能手机这个类的一个具体实例/对象(object)。智能手机都会有个电池容量的参数(智能手机这个类的域或类变量),智能手机的电池容量除以充电功率可得充满电需要的时长(这一行为称为智能手机这个类的方法)具体到你的这部iPhone7也有它对应的电池容量(对象的域或实例变量),相应的:这部iPhone7的电池容量除以它的充电器功率也就得到它充满电需要的时间(对象可调用从属的那个类的方法)再具体到张三的那部sumsung S7,同样可以调用智能手机这个类的域和方法,得到那部S7的目标值。
2.字符串首字母大写,其他变成小写
string.capitalize()
自身不变,会生成一个新的值
name = 'toNg'
v = name.capitalize() # 自动找到name关联的str类,执行其中的capitalize技能
print(name)
print(v)
运行结果:
toNg
Tong
3.将所有大小写都变小写
string.casefold()
name = 'ToNg'
v = name.casefold()
print(name)
print(v)
运行结果:
ToNg
tong
string.lower()
效果与上面的一样。
只不过:
python 3.3引入了string.casefold方法,对Unicode(其他语言:德语...)的时候用casefold,lower() 只对 ASCII 也就是 'A-Z'有效,但是其它一些语言里面存在小写的情况就没办法了。
例如:德语中
s = 'ß'
a = s.lower() # 'ß'
b = s.casefold() # 'ss'
print(a)
print(b)
运行结果:
ß
ss
4.文本格式化
(1)文本居中
string.center(width, fillchar=None)
参数1: 表示总长度
参数2:空白处填充的字符(长度为1)
name = 'tong'
v = name.center(20)
print(v)
v = name.center(20,'行')
print(v)
运行结果:
tong
行行行行行行行行tong行行行行行行行行
(2)文本左对齐并填充右边部分(长度包含前面的值)
string.ljust(width, fillchar=None)
name = 'tong'
v = name.ljust(20)
print(v)
v = name.ljust(20,'*')
print(v)
运行结果:
tong
tong****************
(3)文本右对齐并填充左边部分(长度包含后面的值)
string.rjust(width, fillchar=None)
name = 'tong'
v = name.rjust(20)
print(v)
v = name.rjust(20,'*')
print(v)
运行结果:
tong
****************tong
5.表示传入值在字符串中出现的次数
string.count(sub, start=None, end=None)
参数1: 要查找的值(子序列)
参数2: 起始位置(索引)
参数3: 结束位置(索引)
name = "alexasdfdsafsdfasdfaaaaaaaa"
v = name.count('a')
print(v)
v = name.count('df',0,15)
print(v)
运行结果:
12
2
6.是否以xx开头或结尾
string.startswith(prefix, start=None, end=None)
string.endswith(suffix, start=None, end=None)
参数1:需要检查的字符串
参数2:设置字符串检测的起始位置
参数3:设置字符串检测的结束位置
name = 'tong'
v1 = name.startswith('to')
print(v1)
v2 = name.endswith('g')
print(v2)
v3 = name.startswith('c')
print(v3)
运行结果:
True
True
False
7.指定的编码格式编码字符串
string.encode(encoding='UTF-8',errors='strict')
参数1:要使用的编码,如"UTF-8、GBK"
参数2:设置不同错误的处理方案。默认为 'strict',意为编码错误引起一个UnicodeError。 其他可能的值有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace'以及通过codecs.register_error() 注册的任何值。
name = '晓达'
v = name.encode(encoding='utf-8',errors='strict')
print(v)
a = name.encode(encoding='gbk',errors='strict')
print(a)
运行结果:
b'\xe6\x99\x93\xe8\xbe\xbe'
b'\xcf\xfe\xb4\xef'
8.找到制表符\t,进行替换(长度包含前面的值)
string.expendtabs(tabsize=8)
name = "al\te\tx\nalex\tuu\tkkk"
v = name.expandtabs(20)
print(v)
运行结果:
al e x
alex uu kkk
9.找到指定子序列的索引位置:不存在返回-1
string.find(sub, start=None, end=None)
存在返回索引位置,不存在返回-1
string.index(sub, start=None, end=None)
存在返回索引位置,不存在报错
name = 'alex'
v = name.find('o')
print(v)
a = name.find('e')
print(a)
b = name.index('e')
print(b)
c = name.index('t')
print(c)
运行结果:
-1
2
2
Traceback (most recent call last):
File "E:/s17/day02/test.py", line 10, in <module>
c = name.index('t')
ValueError: substring not found
10.字符串格式化
string.format(*args, **kwargs)
string.format_map(mapping)
根据索引位置
tpl = "我是:{0};年龄:{1};性别:{2}"
v = tpl.format("李杰",19,'都行')
print(v)
根据变量名
tpl = "我是:{name};年龄:{age};性别:{gender}"
v = tpl.format(name='李杰',age=19,gender='随意')
print(v)
根据KV映射关系
tpl = "我是:{name};年龄:{age};性别:{gender}"
v = tpl.format_map({'name':"李杰",'age':19,'gender':'中'})
print(v)
运行结果:
我是:李杰;年龄:19;性别:都行
我是:李杰;年龄:19;性别:随意
我是:李杰;年龄:19;性别:中
11.检测函数
(1)检测字符串是否由字母和数字、汉字组成
string.isalnum()
如果string至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
name = 'alex8汉子'
v = name.isalnum()
name1 = 'alex8..*汉子'
v1 = name1.isalnum()
print(v1)
运行结果:
True
False
(2)检测字符串是否只由字母组成
string.isalpha()
如果字符串至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
name = 'alex'
name1 = 'alex8..*汉子'
v1 = name.isalpha()
print(v1)
v2 = name1.isalpha()
print(v2)
运行结果:
True
False
(3)判断是否是数字
string.isdecimal()
string.isdigit()
string.isnumeric()
num = '②'
v1 = num.isdecimal() # '123' 只能识别阿拉伯数字
v2 = num.isdigit() # '123','②' 可识别特殊数字格式
v3 = num.isnumeric() # '123','二','②' 可识别汉字,及特殊数字格式
print(v1,v2,v3)
运行结果:
False True True
(4)判断字符串是否是合法的标识符,字符串仅包含中文字符合法,实际上这里判断的是变量名是否合法
string.isidentifier()
n = 'name'
v = n.isidentifier()
print(v)
n = '仝晓达'
v = n.isidentifier()
print(v)
n = '9xiaoda'
v = n.isidentifier()
print(v)
运行结果:
True
True
False
(5)是否全部是大写或小写
string.isupper()
string.islower()
name = "ALEX"
v = name.isupper()
print(v)
name1 = "tong"
v1 = name1.islower()
print(v1)
运行结果:
True
True
(6)判断字符串中所有字符是否是可见状态
string.isprintable()
name = "钓鱼要钓刀鱼,\n刀鱼要到岛上钓"
v = name.isprintable()
print(v)
运行结果:
False
(7)字符串中如果至少有一个字符,并且全部为空格时返回为True
string.isspace()
name = 'tong '
v = name.isspace()
print(v)
name1 = ' '
v1 = name1.isspace()
print(v1)
运行结果:
False
True
12.全部变大写
string.upper()
name = 'alex'
v = name.upper()
print(v)
运行结果:
ALEX
13.将序列中的元素以指定的字符连接生成一个新的字符串
string.join(iterable)
返回通过指定字符连接序列中元素后生成的新字符串
name = 'alex'
v = "_".join(name) # 内部循环每个元素
print(v)
name_list = ['海峰','杠娘','李杰','李泉']
v = "搞".join(name_list)
print(v)
运行结果:
a_l_e_x
海峰搞杠娘搞李杰搞李泉
14.对应关系 + 翻译
string.maketrans(*args, **kwargs)
用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
string.translate(table)
根据参数table给出的表(包含256个字符)转换字符串的字符
m = str.maketrans('aeiou','12345') # 对应关系
print(m)
name = "akpsojfasdufasdlkfj8ausdfakjsdfl;kjer09asdf"
v = name.translate(m) # 翻译
print(v)
运行结果:
{97: 49, 111: 52, 117: 53, 101: 50, 105: 51}
1kps4jf1sd5f1sdlkfj815sdf1kjsdfl;kj2r091sdf
15.分割元素
string.partition(sep)
根据指定字符串来分割原字符串,并将指定字符串添加进原字符串内
string.split(sep=None, maxsplit=-1)
指定分隔符对字符串进行切片,可指定分割次数
content = "李泉SB刘康SB刘一"
v = content.partition('SB') # partition
print(v)
v1 = content.split('SB')
print(v1)
v2 = content.split('SB',1)
print(v2)
运行结果:
('李泉', 'SB', '刘康SB刘一')
['李泉', '刘康', '刘一']
['李泉', '刘康SB刘一']
16.替换字符串
string.replace(old, new, count=None)
content = "李泉SB刘康SB刘浩SB刘一"
v = content.replace('SB','Love')
print(v)
v = content.replace('SB','Love',1)
print(v)
运行结果:
李泉Love刘康Love刘浩Love刘一
李泉Love刘康SB刘浩SB刘一
17.移除空白,\n,\t,自定义去掉指定字符串
string.strip(chars=None)
name = ' alex\t'
v = name.strip() # 空白,\n,\t
print(v)
name1 = ' alex tong eric'
v1 = name1.strip('eric') # 自定义
print(v1)
运行结果:
alex
alex tong
18.大小写转换
string.swapcase()
name = "Alex"
v = name.swapcase()
print(v)
运行结果:
aLEX
19.填充0
string.zfill(width)
name = "alex"
v = name.zfill(20)
print(v)
运行结果:
0000000000000000alex
20.标题格式化
string.title()
string.istitle()
判断是否为标题
返回字符串内所有首字母均变为大写
v = "this is string example....wow!!!"
a = v.title()
print(a)
运行结果:
This Is String Example....Wow!!!
三、整数int
1.当前整数的二进制表示,最少位数
int.bit_length()
age = 4 # 100
print(age.bit_length())
运行结果:
3
2. 获取当前数据的字节表示
int.to_bytes(length, byteorder, *args, **kwargs)
age = 15
v = age.to_bytes(10,byteorder='big')
v1 = age.to_bytes(10,byteorder='little')
print(v)
print(v1)
运行结果:
b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x0f'
b'\x0f\x00\x00\x00\x00\x00\x00\x00\x00\x00'
四、布尔值bool
v = 0
v = ""
v = []
以上均为:False 其他情况为:True
五、列表list
1.追加
user_list = ['李泉','刘一','刘康','豆豆','小龙']
user_list.append('刘铭')
print(user_list)
运行结果:
['李泉', '刘一', '刘康', '豆豆', '小龙', '刘铭']
2. 清空
user_list = ['李泉','刘一','刘康','豆豆','小龙']
user_list.clear()
print(user_list)
运行结果:
[]
3. 拷贝(浅拷贝)
user_list = ['李泉','刘一','刘康','豆豆','小龙']
v = user_list.copy()
print(v)
print(user_list)
运行结果:
['李泉', '刘一', '刘康', '豆豆', '小龙']
['李泉', '刘一', '刘康', '豆豆', '小龙']
4. 计数
user_list = ['李泉','刘一','李泉','刘康','豆豆','小龙']
v = user_list.count('李泉')
print(v)
运行结果:
2
5. 扩展原列表
user_list = ['李泉','刘一','李泉','刘康','豆豆','小龙']
user_list.extend(['郭少龙','郭少霞'])
print(user_list)
运行结果:
['李泉', '刘一', '李泉', '刘康', '豆豆', '小龙', '郭少龙', '郭少霞']
6. 查找元素索引,没有则报错
user_list = ['李泉','刘一','李泉','刘康','豆豆','小龙']
v = user_list.index('李海')
print(v)
运行结果:
Traceback (most recent call last):
File "E:/s17/day02/test.py", line 4, in <module>
v = user_list.index('李海')
ValueError: '李海' is not in list
7. 删除并且获取元素 - 索引
user_list = ['李泉','刘一','李泉','刘康','豆豆','小龙']
v = user_list.pop(1)
print(v)
print(user_list)
运行结果:
刘一
['李泉', '李泉', '刘康', '豆豆', '小龙']
8. 删除 - 值
user_list = ['李泉','刘一','李泉','刘康','豆豆','小龙']
user_list.remove('刘一')
print(user_list)
运行结果:
['李泉', '李泉', '刘康', '豆豆', '小龙']
9. 翻转
user_list = ['李泉','刘一','李泉','刘康','豆豆','小龙']
user_list.reverse()
print(user_list)
运行结果:
['小龙', '豆豆', '刘康', '李泉', '刘一', '李泉']
10. 排序: 欠参数
nums = [11,22,3,3,9,88]
print(nums)
# 排序,从小到大
nums.sort()
print(nums)
# 从大到小
nums.sort(reverse=True)
print(nums)
运行结果:
[11, 22, 3, 3, 9, 88]
[3, 3, 9, 11, 22, 88]
[88, 22, 11, 9, 3, 3]
六、range和enumrate生成序列方式
1. 请输出1-10
2.7: 立即生成所有数字
range(1,11) # 生成 1,2,3,4,5,6,...10
3.x: 不会立即生成,只有循环迭代时,才一个一个生成
for i in range(1,11):
print(i)
for i in range(1,11,2):
print(i)
for i in range(10,0,-1):
print(i)
2. range: 三个参数
li = ['eric','alex','tony']
range,len,li循环
for i in range(0,len(li)):
ele = li[i]
print(ele)
li = ['eric','alex','tony']
for j in range(0,len(li)):
print(j+1,li[j])
运行结果:
eric
alex
tony
1 eric
2 alex
3 tony
3.enumerate额外生成一列有序的数字
li = ['eric','alex','tony']
for i,ele in enumerate(li,1):
print(i,ele)
v = input('请输入商品序号:')
v = int(v)
item = li[v-1]
print(item)
运行结果:
1 eric
2 alex
3 tony
请输入商品序号:2
alex
七、元组tuple
1.元组定义
user_tuple = ('alex','eric','seven','alex')
元组是不可被修改的列表;不可变类型
2. 获取个数
user_tuple = ('alex','eric','seven','alex')
v = user_tuple.count('alex')
print(v)
运行结果:
2
3.获取值的第一个索引位置
user_tuple = ('alex','eric','seven','alex')
v = user_tuple.index('alex')
print(v)
运行结果:
0
4.额外的元组功能:
user_tuple = ('alex','eric','seven','alex')
for i in user_tuple: # 可以for循环
print(i)
v = user_tuple[0] # 可以被索引
v = user_tuple[0:2] # 可以切片
print(v)
运行结果:
alex
eric
seven
alex
('alex', 'eric')
user_tuple = ('alex','eric','seven',['陈涛','刘浩','赵芬芬'],'alex')
user_tuple[3][1] = '刘一' # 元组不可变,但构成元组的可变元素是可变的
print(user_tuple)
li = ['陈涛','刘浩',('alex','eric','seven'),'赵芬芬']
****** 元组最后,加逗号,否则只有一个元素时将变成字符串 ******
li = ('alex',)
print(li)
运行结果:
('alex', 'eric', 'seven', ['陈涛', '刘一', '赵芬芬'], 'alex')
('alex',)
八、字典dict
1. 清空
dic = {'k1':'v1','k2':'v2'}
dic.clear()
print(dic)
运行结果:
{}
2. 浅拷贝
dic = {'k1':'v1','k2':'v2'}
v = dic.copy()
print(v)
运行结果:
{'k1': 'v1', 'k2': 'v2'}
3. 根据key获取指定的value;不存在则赋予新值,不报错
dic = {'k1':'v1','k2':'v2'}
v = dic.get('k1111',1111)
print(v)
运行结果:
1111
4. 删除并获取对应的value值
dic = {'k1':'v1','k2':'v2'}
v = dic.pop('k1')
print(dic)
print(v)
运行结果:
5. 随机删除键值对,并获取到删除的键值
dic = {'k1':'v1','k2':'v2'}
v = dic.popitem()
print(dic)
print(v)
运行结果:
{'k2': 'v2'}
v1
dic = {'k1':'v1','k2':'v2'}
k,v = dic.popitem() # ('k2', 'v2')
print(dic)
print(k,v)
运行结果:
{'k2': 'v2'}
k1 v1
dic = {'k1':'v1','k2':'v2'}
v = dic.popitem() # ('k2', 'v2')
print(dic)
print(v[0],v[1])
运行结果:
{'k1': 'v1'}
k2 v2
6. 增加,如果存在则不做操作
dic = {'k1':'v1','k2':'v2'}
dic.setdefault('k3','v3')
print(dic)
dic = {'k1':'v1','k2':'v2'}
dic.setdefault('k1','1111111')
print(dic)
运行结果:
{'k1': 'v1', 'k3': 'v3', 'k2': 'v2'}
{'k1': 'v1', 'k2': 'v2'}
7. 批量增加或修改
dic = {'k1':'v1','k2':'v2'}
dic.update({'k3':'v3','k1':'v24'})
print(dic)
运行结果:
{'k3': 'v3', 'k2': 'v2', 'k1': 'v24'}
dic = dict.fromkeys(['k1','k2','k3'],123)
print(dic)
dic = dict.fromkeys(['k1','k2','k3'],123)
dic['k1'] = 'asdfjasldkf'
print(dic)
运行结果:
{'k2': 123, 'k1': 123, 'k3': 123}
{'k2': 123, 'k1': 'asdfjasldkf', 'k3': 123}
dic = dict.fromkeys(['k1','k2','k3'],[1,])
dic['k1'].append(222)
print(dic)
运行结果:
{'k2': [1, 222], 'k3': [1, 222], 'k1': [1, 222]}
8.额外的字典功能:
- 字典可以嵌套
- 字典key: 必须是不可变类型
dic = {
'k1': 'v1',
'k2': [1,2,3,],
(1,2): 'lllll',
1: 'fffffffff',
111: 'asdf',
}
print(dic)
key:
- 不可变
- True,1
dic = {'k1':'v1'}
del dic['k1']
布尔值:
1 True
0 False
bool(1111)
九、集合set
1.集合的定义
s1 = {"alex",'eric','tony','李泉','李泉11'}
s2 = {"alex",'eric','tony','刘一'}
不可重复的列表;可变类型
2.s1中存在,s2中不存在
s1 = {"alex",'eric','tony','李泉','李泉11'}
s2 = {"alex",'eric','tony','刘一'}
v = s1.difference(s2)
print(v)
运行结果:
{'李泉11', '李泉'}
s1中存在,s2中不存在,然后对s1清空,然后在重新复制
s1 = {"alex",'eric','tony','李泉','李泉11'}
s2 = {"alex",'eric','tony','刘一'}
s1.difference_update(s2)
print(s1)
print(s2)
运行结果:
{'李泉11', '李泉'}
{'tony', 'alex', '刘一', 'eric'}
3.s2中存在,s1中不存在,s1中存在,s2中不存在
s1 = {"alex",'eric','tony','李泉','李泉11'}
s2 = {"alex",'eric','tony','刘一'}
v = s1.symmetric_difference(s2)
print(v)
运行结果:
{'李泉', '刘一', '李泉11'}
4. 交集
s1 = {"alex",'eric','tony','李泉','李泉11'}
s2 = {"alex",'eric','tony','刘一'}
v = s1.intersection(s2)
print(v)
运行结果:
{'eric', 'tony', 'alex'}
5. 并集
s1 = {"alex",'eric','tony','李泉','李泉11'}
s2 = {"alex",'eric','tony','刘一'}
v = s1.union(s2)
print(v)
运行结果:
{'李泉', 'alex', 'tony', 'eric', '李泉11', '刘一'}
6. 移除
s1 = {"alex",'eric','tony','李泉','李泉11'}
s1.discard('alex')
print(s1)
运行结果:
{'李泉', 'eric', 'tony', '李泉11'}
7.更新,值存在则不更新
s1 = {"alex",'eric','tony','李泉','李泉11'}
s1.update({'alex','123123','fff'})
print(s1)
运行结果:
{'eric', 'alex', '123123', '李泉11', '李泉', 'tony', 'fff'}
8.额外的集合功能:
s1 = {"alex",'eric','tony','李泉','李泉11'}
for i in s1: # 可以使用for循环
print(i)
s1 = {"alex",'eric','tony','李泉','李泉11',(11,22,33)}
for i in s1: # 可以嵌套元组,不能嵌套列表
print(i)