学习笔记-Python开发-005_数据类型_上

1 数据类型概述

总所周知，在运行程序之前，计算机会讲程序相关的数据提取到内存之中，而变量由于会随着程序的运算，不断变化内部的值，故应该给每个变量在内存中分配多大的空间就成为了一个迷，空间大了浪费，小了不够用，为了方便人们的使用，就诞生了数据类型。

不同数据类型占用的数据空间：

序号	类型	字节数（byte）
1	boolean	1
2	byte	1
3	char	2
4	short	2
5	float	4
6	int	4
7	double	8
8	long	8

每种数据类型都有属于自己的特点、应用场景、和独特功能。

python是一门动态类型的编程语言，他不需要专门的对变量进行定义，当他的值为什么类型，他即为什么类型。

当变量名指向整形的时候，在内存中赋予其整形的内存空间大小，当同一个变量名指向其他类型的时候，又会在内存空间的另一个地方开辟另一个空间来存放。

2 整形

整型其实就是十进制整数的统称，比如：1、68、999都属于整型。他一般用于表示年龄、序号等纯整数的场景。

2.1 定义方式

number = 10
age = 99

2.2 独有功能

整形只有一个独有功能，即使用.bit_length()，显示将整形转为二进制后有多少位。

v1 = 5
print(bin(v1))  # 0b101
# 调用v1（int）的独有功能，获取v1的二进制表示有多少个位组成。
result1 = v1.bit_length()
print(result1)  # 3

v2 = 10
print(bin(10))  # 0b1010
# 调用v2（int）的独有功能，获取v2的二进制表示有多少个位组成。
result2 = v2.bit_length()
print(result2)  # 4

2.3 公共功能

整形的公共功能就是加减乘除。

v1 = 4
v2 = 8
v3 = v1 + v2

2.4 转换

在项目开发和面试题中经常会出现一些 "字符串" 和布尔值转换为整型的情况。

# 布尔值转整型
n1 = int(True)  # True转换为整数 1
n2 = int(False) # False转换为整数 0

# 字符串转整型 base=几进制
v1 = int("186",base=10) # 把字符串看成十进制的值，然后再转换为 十进制整数，结果：v1 = 186
v2 = int("0b1001",base=2) # 把字符串看成二进制的值，然后再转换为 十进制整数，结果：v1 = 9 (0b表示二进制)
v3 = int("0o144",base=8)  # 把字符串看成八进制的值，然后转换为 十进制整数，结果：v1 = 100 (0o表示八进制)
v4 = int("0x59",base=16)  # 把字符串看成十六进制的值，然后转换为 十进制整数，结果：v1 = 89 （0x表示十六进制）

# 浮点型（小数）
v1 = int(8.7) # 8 会丢掉小数点后的数据

二进制、八进制、十进制、十六进制规则存储的字符串，可以轻松的通过int转换为十进制的整数。

2.5 其他 -> python2与3的差别

2.5.1 长整形

Python3：整型（无限制）
Python2：整型、长整形

在python2中跟整数相关的数据类型有两种：int(整型)、long（长整型），他们都是整数只不过能表示的值范围不同。

int，可表示的范围：-9223372036854775808～9223372036854775807
long，整数值超出int范围之后自动会转换为long类型（无限制）。

在python3中去除了long只剩下：int（整型），并且 int 长度不在限制。

2.5.2 整除

在python2中整形除以整形，也会得到一个整形，即丢掉小数点后的数字，在python3中进行了优化。

Python3：

v1 = 9/2 
print(v1) # 4.5

# python3 中整除
v1 = 9//2
print(v1) # 4

Python2:

v1 = 9/2 
print(v1) # 4

# python2中可以通过引入division来达到不整除
from __future__ import division 
v1 = 9/2 
print(v1) # 4.5

3 布尔类型

布尔类型，常用在判断中，它就只有两个值：True和False

3.1 定义

demo1 = False
demo2 = True

3.2 独有功能

无

3.3 公共功能

boolean类型做运算时，会转换为整形进行

v1 = True + True
print(v1) # 2

3.4 转换

其他类型转换为布尔值的情景，只要记住一个规律即可。

整数0、空字符串、空列表、空元组、空字典转换为布尔值时均为False
其他均为True

案例

v1 = bool(0) # False
v2 = bool(-10) # True
v3 = bool(10) # True
v4 = bool("废物") # True 
v5 = bool("") # Flase
v6 = bool(" ") # Flase
v7 = bool([]) # [] 表示空列表 Flase
v8 = bool([11，22，33]) # [11，22，33] 表示非空列表 True
v9 = bool({}) # {} 表示空字典 False
v10 = bool({"name":"kinght","age":18}) # {"name":"kinght","age":18} 表示非空字典 True

3.5 其他

3.5.1 做条件自动转换

如果在 if 、while 条件后面写一个值当做条件时，他会默认转换为布尔类型，然后再做条件判断。

if 值:
  pass
while 值:
  pass

案例：

if 0:
	print("太六了")
else:
  print(999)

if "kinght":
	print("你好")

if "amber":
	print("你是傻逼？")
else:
	print("你是逗比？")
  
 while 1>9:
  pass

4 字符串类型

字符串，我们平时会用他来表示文本信息。例如：姓名、地址、自我介绍等。

4.1 定义

v1 = "包治百病"
v2 = '包治百病'
v3 = "包'治百病"
v4 = '包"治百病'
v5 = """
吵架都是我的错，
因为大家打不过。
"""
# 三个引号，可以支持多行/换行表示一个字符串，其他的都只能在一行中表示一个字符串。

4.2 独有功能

字符串的独有功能有48个，目前只介绍其中常用的18个。

# 使用功能的方式
## 基本格式1
"xxxxx".功能(...)
## 基本格式2
v1 = "xxxxx"
v1.功能(...)

4.2.1 判断字符串

判断字符串是否以 XX 开头？得到一个布尔值

# 案例1
v1 = "叨逼叨的一天，烦死了"

result = v1.startswith("叨逼叨的一天")
print(result) # 值为True

# 案例2
v1 = input("请输入住址：")

if v1.startswith("北京市"):
	print("北京人口")
else:
	print("非北京人口")

判断字符串是否以 XX 结尾？得到一个布尔值

# 案例1
v1 = "叨逼叨的一天，烦死了"

result = v1.endswith("烦死了")
print(result) # 值为True

# 案例2
address = input("请输入地址：")

if address.endswith('村'):
	print("农业户口")
else:
	print("非农户口")

判断字符串是否为十进制整数？得到一个布尔值

# 案例1
v1 = "1238871"
result = v1.isdecimal()
print(result) # True

# 案例2 -> 两个数相加。

v1 = input("请输入值：") # ”666“
v2 = input("请输入值：") # ”999“
if v1.isdecimal() and v2.isdecimal():
	data = int(v1) + int(v2)
	print(data)
else:
	print("请正确输入数字")
  
## 这里不能使用isdigit
### isdigit 会把某些字符也判断成整数
v1 = "123"
print(v1.isdecimal()) # True
v2 = "①"
print(v2.isdecimal()) # False
v3 = "123"
print(v3.isdigit()) # True
v4 = "①"
print(v4.isdigit()) # True

4.2.2 字符串变换

去除字符串两边的空格、换行符、制表符或去掉指定字符，得到一个新字符串

在输入中，有一些看不到的符号，例如空格、换行符\n、制表符\t，都可以通过strip()去掉

# 案例1
##将msg两边的空白去掉，得到"H e ll o啊，树哥"
msg = " H e ll o啊，树哥 "
data = msg.strip()
print(data) # H e ll o啊，树哥

## 只去除左边的空白
msg = " H e ll o啊，树哥 "
data = msg.lstrip()
print(data) # H e ll o啊，树哥 

## 只去除右边的空白
msg = " H e ll o啊，树哥 "
data = msg.rstrip()
print(data) #  H e ll o啊，树哥

# 案例2
code = input("请输入4位验证码：") #  FB87 输入带空格，导致比较不准
data = code.strip()
if data == "FB87":
	print('验证码正确')
else:
	print("验证码错误")

也可以通过在strip(指定内容)去掉制定的符号。

# 将msg两边的哥去掉
msg = "哥H e ll o啊，树哥"
data = msg.strip("哥")
print(data) # H e ll o啊，树

# 只去除左边的哥
msg = "哥H e ll o啊，树哥"
data = msg.lstrip("哥")
print(data) # H e ll o啊，树哥

# 只去除右边的哥
msg = "哥H e ll o啊，树哥"
data = msg.rstrip("哥")
print(data) # 哥H e ll o啊，树

字符串首字母变大写，得到一个新的字符串

msg = 'absdaw'.capitalize()
print(msg) # Absdaw

字符串变大写，得到一个新字符串

# 案例1
msg = "my name is oliver queen"
data = msg.upper()
# 新生成大写值，不改变原来字符串
print(msg) # my name is oliver queen
print(data) # 输出为：MY NAME IS OLIVER QUEEN

# 案例2
code = input("请输入4位验证码：") #  FB88   fb88 
value = code.upper() #  FB88  
data = value.strip() # FB88

if data == "FB87":
	print('验证码正确')
else:
	print("验证码错误")
  
# 注意事项
"""
code的值"fb88 "
value的值"FB88 "
data的值"FB88"
"""

字符串变小写，得到一个新字符串

# 案例1
msg = "My Name Is Oliver Queen"
data = msg.lower()

print(data) # 输出为：my name is oliver queen

# 案例2
code = input("请输入4位验证码：")
value = code.strip().lower()
if value == "fb87":
	print('验证码正确')
else:
	print("验证码错误")

字符串内容替换，得到一个新的字符串

# 案例1
data = "你是个好人，但是好人不合适我"
value = data.replace("好人","贱人")
print(data)  # "你是个好人，但是好人不合适我"
print(value) # "你是个贱人，但是贱人不合适我"

# 案例2
video_file_name = "高清无码爱情动作片.mp4"
new_file_name = video_file_name.replace("mp4","avi") # "高清无码爱情动作片.avi"
final_file_name = new_file_name.replace("无码","步兵") # "高清步兵爱情动作片.avi"
print(final_file_name)

# 案例3 -> 使用功能的时候，原变量不会被修改
video_file_name = "高清无码爱情动作片.mp4"
new_file_name = video_file_name.replace("mp4","avi") # "高清无码爱情动作片.avi"
final_file_name = video_file_name.replace("无码","步兵") # "高清步兵爱情动作片.mp4"
print(final_file_name)

# 案例4
content = input("请输入评论信息") # alex是一个草包
content = content.replace("草","**") # alex是一个**包
content = content.replace("泥马","***") # alex是一个**包
print(content) # alex是一个**包

# 案例5 -> 屏蔽敏感词系统
# 让用户输入一段文本，请实现将文本中的敏感词 `苍老师`、`波波老师`替换为 `***`，最后并输入替换后的文本。
Sensitive_words=['苍老师','苍老师']
user_speak = input("请输入文本:")
for replace in Sensitive_words:
    user_speak=user_speak.replace(replace,"***")
print(user_speak)

4.2.3 字符串切割与拼接

字符串切割，得到一个列表

使用方法

.split("切割字符",切几个) # 从左往右切,切几个不填默认全切
.rsplit("切割字符",切几个) # 从右往左切,切几个不填默认全切

案例：

# 案例1
data = "武沛齐|root|wupeiqi@qq.com"
result = data.split('|') # ["武沛齐","root","wupeiqi@qq.com"]
print(data) # "武沛齐|root|wupeiqi@qq.com"
print(result) # 输出 ["武沛齐","root","wupeiqi@qq.com"] 根据特定字符切开之后保存在列表中，方便以后的操作

# 案例2
# 对用户输入的数据使用"+"切割，判断输入的值是否都是数字？(提示：用户输入的格式必须是以下+连接的格式，如 5+9 、alex+999)
result = input("请输入+连接的格式：")
result = result.split("+")
for i in result:
    if i.isdecimal():
        pass
    else:
        print("输入值不都是整数")
        break
else:
    print("输入值都是整数")

指定切几个

# 从左往右切一个

# 案例1
blog_url = 'yzc.blog
# 从左往右切割1个.         
host_3 = blog_url.sp
print(host_3)  # ['yzc', 'blog.geekxk.com']
# 从左往右切割2个.         
host_2 = blog_url.sp
print(host_2) # ['yzc', 'blog', 'geekxk.com']
# 从右往左切1个       
host_r = blog_url.r
print(host_r) # ['yzc.blog.geekxk', 'com']


# 案例2 -> 识别后缀名
file_path = "xxx/xxxx/xx.xx/xxx.mp4"

data_list = file_path.rsplit(".",1) # ["xxx/xxxx/xx.xx/xxx","mp4"]
data_list[0]
data_list[1]

字符串拼接，得到一个新的字符串

data_list = ["alex","是","大帅比"]
v1 = "_".join(data_list) # alex_是_大帅比
print(v1)

格式化字符串，得到新的字符串

前文在标准输出里提到过。格式化字符串的三种方式

# 方式一
name = "{0}的喜欢干很多行业，例如有：{1}、{2} 等"
data = name.format("老王","护士","嫩模")
print(data) # 老王的喜欢干很多行业，例如有：护士、嫩模 等
print(name) # "{0}的喜欢干很多行业，例如有：{1}、{2} 等"

# 方式二
name = "{}的喜欢干很多行业，例如有：{}、{} 等"
data = name.format("老王","护士","嫩模")
print(data) # 老王的喜欢干很多行业，例如有：护士、嫩模 等

# 方式三
name = "{name}的喜欢干很多行业，例如有：{h1}、{h2} 等"
data = name.format(name="老王",h1="护士",h2="嫩模")
print(data) # 老王的喜欢干很多行业，例如有：护士、嫩模 等

4.2.4 字符串转换字节类型

data = "嫂子"  # unicode，字符串类型

# 在内存中存放是用unicode,如果存储到硬盘中，需要转存为utf-8编码或gbk编码

# 编码
v1 = data.encode("utf-8")  # utf-8，字节类型
v2 = data.encode("gbk")  # gbk，字节类型

print(v1)  # b'\xe5\xab\x82 \xe5\xad\x90' 三个字节一个汉字
print(v2)  # b'\xc9\xa9 \xd7\xd3' 两个字节一个汉字

# 解码
s1 = v1.decode("utf-8") # 嫂子
s2 = v2.decode("gbk") # 嫂子
print(s1)
print(s2)

4.2.5 将字符串内容居中、居左、居右展示

v1 = "王老汉"
# data = v1.center(21, "-")
# print(data) #---------王老汉---------

# data = v1.ljust(21, "-")
# print(data) # 王老汉------------------

# data = v1.rjust(21, "-")
# print(data) # ------------------王老汉

4.2.6 填充0

处理二进制数据，为了方便，让计算机自动在数值前面填充0

# 应用场景：处理二进制数据
data = "101" # "00000101"
v1 = data.zfill(8) # 将数值填充到8位，已有3位前面添加5个0
print(v1) # "00000101"

4.2.7 查询全部字符串独有功能

在pycharm编辑器中，输入str，然后安装windwos ctrl或者mac command键鼠标点击str即可查看python的关于字符串的源代码。

想要更方便的查看，鼠标选到 class str里面，然后点击小齿轮，打开显示成员

然后再点击定位小图标,就会显示str拥有的独有功能

4.3 公共功能

4.3.1 加减运算

# 相加：字符串 + 字符串 == 字符串拼接
v1 = "abc" + "def"
print(v1) # abcdef

# 相乘：字符串 * 整数 == 重复多次字符串
v1 = "abc" *3
print(v1) # abcabcabc

4.3.2 字符串的长度

长度使用len()来计算。

data = "asdljkharuiasudjkasiufhoiwhrlawiohawlheawio"
value = len(data) 
print(value) # 43

4.3.3 字符串索引取字符

字符串能通过索引来进行取值，而字符串是一个元数据，不可变类型，在内部存储时不允许对内部元素修改，若要改动字符串中内容，则内存会直接销毁其对应的引用，另寻一块空间建立引用(相关知识后续文章会进行补充)。

字符串索引 -> 相当于对字符串的字符进行排序，从0开始

message = "来做点py交易呀"
#          0 1 2345 6 7   -> 正序
#           ... -3 -2 -1  -> 倒叙
print(message[0]) # "来"
print(message[1]) # "做"
print(message[2]) # "点"

print(message[-1]) # 呀
print(message[-2]) # 易
print(message[-3]) # 交

案例：

# 案例
# 顺序展示message元素
message = "来做点py交易呀"
index = 0
while index < len(message):
	value = message[index]
    print(value)
    index += 1
# 倒叙展示message元素
message = "来做点py交易呀"
index = len(message) - 1
while index >=0:
    value = message[index]
    print(value)
    index -= 1

4.3.4 获取字符串中的子序列，切片

字符串切片遵循：遵循前取后不取

# 案例1
message = "来做点py交易呀"
print(message[0:2]) # "来做"
print(message[3:7]) # "py交易" -> 前取后不取
print( message[3:] ) # "py交易呀"
print( message[:5] ) # "来做点py"
print(message[4:-1]) # "y交易"
print(message[4:-2]) # "y交"
print( message[4:len(message)] ) # "y交易呀"


# 案例2
message = "来做点py交易呀"
value = message[:3] + "Python" + message[5:]
print(value)

4.3.5 步长

步长 == 切片范围内，隔几步取一次

name = "生活不是电影，生活比电影苦"

# 前两个值表示区间范围，最有一个值表示步长
print( name[ 0:5:2 ] )   # 输出：生不电 【取值序号0-5，两个值取一个】
# 区间范围的前面不写则表示起始范围为0开始
print( name[ :8:2 ] )    # 输出：生不电，  【取值范围：从头开始到索引8，两个取一个】
# 取值范围后面不写则是取到末尾
print( name[ 2::2 ] )    # 输出：不电，活电苦【取值范围：从索引2到结尾，两个取一个】
print( name[ 2::3 ] )    # 输出：不影活影【取值范围：从索引2到结尾，三个取一个】
# 区间范围不写表示整个字符串
print( name[ ::2 ] )     # 输出：生不电，活电苦 【取值范围：整个字符串，两个取一个】
# 步长为负数，则是倒序
print( name[ ::-1 ] )  # 输出：苦影电比活生，影电是不活生 【取值范围：整个字符串，倒序】
# 步长为负数，则是倒序
print( name[ ::-2 ] )  # 输出：苦电活，电不生 【取值范围：整个字符串，倒序，两个取一个】

案例

name = "生活不是电影，生活比电影苦"
print(name[8:1:-1])  # 输出：活生，影电是不 【倒序】
print(name[-1:1:-1])  # 输出：苦影电比活生，影电是不 【倒序】

# 面试题：给你一个字符串，请将这个字符串翻转。
value = name[-1::-1]
print(value)  # 苦影电比活生，影电是不活生

4.3.6 循环

while循环

while循环是之前已经详细介绍过，这里不做过多的赘述了。

message = "来做点py交易呀"
index = 0
while index < len(message):
	value = message[index]
    print(value)
    index += 1

for循环

for循环，又被称为迭代循环(取值循环)，是python提供的第二种循环机制，从理论上for循环能做的事情，while循环都能做，for循环在循环取值上面比while更加简便，他可以将内部的值逐一取出，都遍历取出完成后，也能自动结束。

message = "来做点py交易呀"
for char in message:
    print(char)

for循环的嵌套用法

for a in range(1,10):
    for b in range(1,10):
        print('{}x{}={}'.format(a,b,a*b))

`range()`函数

range()，这是一个在python2就有的功能，他的功能是生成从0开始的数组，括号里是多少，就生成序号到多少的列表

# 指定元素个数生成列表 -> 0-9 10个数
range(10) # [0,1,2,3,4,5,6,7,8,9] 
# 指定元素序号生成列表 -> 整数1-9 同样遵循前取后不取
range(1,10) # [1,2,3,4,5,6,7,8,9]
# range可以指定步长
range(1,10,2) # [1,3,5,7,9]
# range步长为负数则是倒序
range(10,1,-1) # [10,9,8,7,6,5,4,3,2]

这是一个在python2就有的功能，但range作为列表而言，一旦数字过大，对于内存是一种负担。

Python3 做了相对应到优化，range() 函数返回的是一个可迭代对象（类型是对象），而不是列表类型，所以打印的时候不会打印列表，这样做内存空间优化了，使用并不会有什么区别

案例

使用range限制登录次数

sys_name = 'admin'
sys_pwd = 'admin'
for x in range(3):
    name = input("请输入账号：")
    pwd = input('请输入密码：')
    if(name == sys_name and pwd == sys_pwd):
        print("密码正确")
        break
    else:
        print("密码错误{}次,还有{}次机会".format((x+1),(2-x)))
else:
    print("账号验证错误次数过多，请联系管理员找回密码")

循环的应用场景

while，一般在做无限制（未知）循环此处时使用。

# 用户输入一个值，如果不是整数则一直输入，直到是整数了才结束。
num = 0
while True:
    data = input("请输入内容:")
    if data.isdecimal():
        num = int(data)
        break
	else:
        print("输入错误，请重新输入！")

for循环，一般应用在已知的循环数量的场景。

for i in range(30):
    print(message[i])

他们都适用于break和continue关键字。

4.4 转换

字符串的类型转换其实是一件很无意义的事情。

data_list = ["kinght","aym",999]
data = str(data_list)
print(data) 
# 把列表整体'["alex","eric",999]'放入字符串 -> 无意义

字符串转换唯一的应用场景可能就是

num = 999
data = str(num)
print(data) # "999"

4.5 其他

这里再次强调，字符串是不可变类型，改变值==改变字符串

demo1 = 'abcdefg'
print(id(demo1)) # 140427044152816
demo1 = 'abcdfeg'
print(id(demo1)) # 140426774570672

id可以查看对于变量的内存地址。

posted @ 2023-02-26 22:24 kinghtxg 阅读(9) 评论(0) 编辑收藏举报

刷新页面返回顶部

kinghtxg

信息安全菜鸡的笔记