python自学笔记(二)python基本数据类型之字符串处理
一、数据类型的组成分3部分:身份、类型、值
身份:id方法来看它的唯一标识符,内存地址靠这个查看
类型:type方法查看
值:数据项
二、常用基本数据类型
int 整型
boolean 布尔型
string 字符串
list 列表
tuple 元组
dict 字典
三、数据类型的可变和不可变
不可变类型:int,string,tuple
可变类型:list,dict
python基本数据类型讲解
一、len 之需注意
例如:字符串"asd234"
默认的文件编码都是ascii码
unicode编码能描述全世界大部分语言,它只是一套标准,各国家的存储方式不一致
utf8是一种unicode编码的实现标准,这期间万维网的出现,正好需要一套标准来统一,utf8能根据各国操作系统的语言不同,选择对应的unicode编码
a = "哈" 默认是ascii编码 3个字节
a = u"哈" 用前面带u 这中方式转成unicode编码 或者 b = a.decode('uft-8') 解码,两种方式打印出的len 就是一个字节了。
二、转义符让文本更好处理
a = "ad\n\r" 换行回车
三、字符串前面的小尾巴作用
a = r"abc\n" 不转义 输出 ab\n
四、访问子字符串,序列来了(查找字符串)
a = "abcde"
print a[0] -->a
print a[len(a) - 1] 或 a[-1] 表示最后一个元素
a[0:] 从0位到最后 abcde
a[0:1] 大于等于左边的,小于右边的,就是大于等于第0位置,小于第一位,那就只剩下是 第0位元素了 就是输出 a
a[1:3] 输出 bc
a[4:3] 大于等于第4位,小于第3位,也就是从后往前查找,也就是输出 e
a[:-1] 默认从第0位开始,可以省略0 不写,小于最后一位(不包括最后一位) 输出 abcd
五、字符串拼接
1、超级丑陋的(不推荐)
a = 'ab'
b = 'cd'
c = a + b 输出 abcd
2、可选方案支字符串模板(占位符)
例如输出 "my name is niuniu"
print ("my name is %s" % "niuniu") %s 是字符串占位符 %d是数字占位符
print ("my name is %s %s" % ("niuniu","zhenshuai")) 元组方式
3、推荐拼接的方案
a = "a"
b = "bcd"
c = "ef"
"".join([a,b,c]) 里面是list(数组) -->"abcdef"
",".join([a,b,c])-->"a,bcd,ef" 也可以用其他字符分割
六、字符串修改和查询 replace、find
a.replace("旧","新") 替换
a.find("world") 返回下标,-1为没找到
a.rfind()从右向左查找
a.index("world")返回下标,没找到会报错
a.count(",")查找有个数
七、formart格式化(%s %d的格式化不容易管理,位置不能变)
用法1
b = "this {1}{0}".format("apple","my")
print b --> this is my apple
用法2
b = "this is{whose}{fruit}".format(fruit = "apple", whose = "my")
print b --> this is my apple
用法3 用字典来完善 %s %d的格式化
b = "this is %(whose)s %(fruit)s" %{"whose":"my","fruit":"apple"}
print b --> this is my apple
ps:help("str") 命令行方法,可查找所有系统封装的字符串函数方法