python 基础之数据类型

一、python中的数据类型之列表
　　1、列表
　　　　列表是我们最以后最常用的数据类型之一，通过列表可以对数据实现最方便的存储、修改等操作

二、列表常用操作

^>切片
^>追加
>插入
>修改
>删除
>扩展
>拷贝
>统计

>排序

>翻转

>>> names = ["admin","abc","jack","lily"]    #定义列表
>>> names            #查表中的元素
['admin', 'abc', 'jack', 'lily']

通过下标访问列表中的元素，下标从0开始计数
>>> names[0]
'admin'
>>> names[1]
'abc'
>>> names[2]
 'jack'

取最后一个元素：
>>> names[-1]
'lily'
 
取倒数第二个元素：
>>> names[-2]
'jack'

　　 2.1.1、切片：取多个元素

>>> names 
['admin', 'abc', 'jack', 'lily']
>>> names[0:3]         #取下标0到下标3之间的数字，包括0，不包括3
['admin', 'abc', 'jack']

>>> names[:3]           #从头开始取，0可以忽略，跟上问效果一样
['admin', 'abc', 'jack']

>>> names[0:-1]        #取下标0到-1之前的数字，包括0，不包括-1.也就是最后一个
['admin', 'abc', 'jack']

>>> names[1:]           #如果想取到最后一个，只能这么写，不能写-1
['abc', 'jack', 'lily']

>>> names[1:-1]        #如果写成-1,此时不包括-1
['abc', 'jack']

>>> names[0::2]        #后面的2代表每隔一个元素取一个
['admin', 'jack']
        
>>> names[::2]          #跟上句效果一样
['admin', 'jack']

切片

　　 2.1.2、追加

>>> names   
['admin', 'abc', 'jack', 'lily']
>>> names.append("追加第一个")                #追加函数 append，默认追加到最后一个
>>> names
['admin', 'abc', 'jack', 'lily', '追加第一个']

>>> names.append("追加第二个")
>>> names
['admin', 'abc', 'jack', 'lily', '追加第一个', '追加第二个']

追加

　　 2.1.3、插入

>>> names
['admin', 'abc', 'jack', 'lily', '追加第一个', '追加第二个']
>>> names.insert(1,"我是新来的")                         #在下标1的前面插入一个元素
>>> names
['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', '追加第二个']

>>> names.insert(-1,"我也是新来的")                  #在倒数第一个前面插入一个元素
>>> names
['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', '我也是新来的', '追加第二个']

插入

　　2.1.4、修改

>>> names
['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', '我也是新来的', '追加第二个']

>>> names[6] = "boy"                  #将下标6的元素改为boy
>>> names 
['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', 'boy', '追加第二个']

修改

　　 2.1.5、删除

删除可以有三种方法实现
>>> names
['admin', '我是新来的', 'abc', 'jack', 'lily', '追加第一个', 'boy', '追加第二个']
>>> del names[3]               #删除下标为第3个的元素 ‘蜡jack'
>>> names
['admin', '我是新来的', 'abc', 'lily', '追加第一个', 'boy', '追加第二个']

>>> names
['admin', '我是新来的', 'abc', 'lily', '追加第一个', 'boy', '追加第二个']
>>> names.remove("abc")    #删除指定元素
>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy', '追加第二个']

>>> names.pop()                  #删除最后一个元素并将删除元素显示出来
'追加第二个'
>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy']

删除

　　 2.1.6、扩展

>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy']
>>> a = ["123","abc","321"]
>>> names.extend(a)           #将两个列表扩展成一个列表
>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy', '123', 'abc', '321']
>>> a                                  #列表不会改变
['123', 'abc', '321']

扩展

　　 2.1.7、拷贝

>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy']
>>> names_copy = names.copy() 
>>> names_copy
['admin', '我是新来的', 'lily', '追加第一个', 'boy']

拷贝

　　 2.1.8、统计

>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy', 'admin', 'admin']
>>> names.count("admin")     #统计列表中相同元素的个数
3

统计

　　 2.1.9、排序

>>> names
['admin', '我是新来的', 'lily', '追加第一个', 'boy', 'admin', 'admin', '123', 'abc', '321']
>>> names.sort()                        #排序
>>> names
['123', '321', 'abc', 'admin', 'admin', 'admin', 'boy', 'lily', '我是新来的', '追加第一个']

排序

　　 2.2.1、翻转

>>> names
['123', '321', 'abc', 'admin', 'admin', 'admin', 'boy', 'lily', '我是新来的', '追加第一个']
>>> names.reverse()
>>> names
['追加第一个', '我是新来的', 'lily', 'boy', 'admin', 'admin', 'admin', 'abc', '321', '123']

翻转

　　 2.2.2、获取下标

>>> names
['追加第一个', '我是新来的', 'lily', 'boy', 'admin', 'admin', 'admin', 'abc', '321', '123']
>>> names.index("admin")     #只返回找到的第一个下标
4

获取下标

　　2.2.3、长度获取

>>> names     
['追加第一个', '我是新来的', 'lily', 'boy', 'admin', 'admin', 'admin', 'abc', '321', '123']
>>> len(names)            #列表中元素的个娄
10

长度获取

三、python 字符串函数

　　Python内置的字符串处理函数整理,收集常用的Python 内置的各种字符串处理函数的使用方法

>>> abc = "Python String Function"           #生成字符串变量
>>> abc
'Python String Function'
>>> len(abc)                 #字符串长度获取，从0开始，包括空格在内
22
>>> abc[0]
'P'
>>> abc[21]   
'n'

　　3.1、字母处理

>>> abc
'Python String Function'
>>> abc.upper()                     #全部大写
'PYTHON STRING FUNCTION'

>>> abc.lower()                      #全部小写
'python string function'
       
>>> abc.swapcase()                #大小写互换
'pYTHON sTRING fUNCTION'
        
>>> abc.capitalize()                #首字母大写，其他小写
'Python string function'

>>> abc.title()                         #首字母大写
'Python String Function'

字母处理

　　3.2、格式化相关

>>> abc
'Python String Function'
>>> abc.ljust(30，"*")    #获取固定长度，左对齐，右边不够*补齐,不加*会以空格补齐
'Python String Function********'

>>> abc.rjust(30)           #获取固定长度，右对齐，左边不够*补齐
'********Python String Function'

>>> abc.center(30,"*")   #获取固定长度，中间对齐，两边不够用*补齐
'****Python String Function****'

格式化

　 3.3、搜索相关

>>> abc
'Python String Function'
>>> abc.find("b")            #搜索指定字符串，没有返回-1
-1

>>> abc.find("t",3)           #指定起始位置搜索，返回的是第二个t的下标
8

>>> abc.find("t",1,13)       #指定开始及结束位置搜索，如果找到多个，只返回第一个的下标
2

>>> abc.rfind("t")             #从右边开始找
18

>>> abc.count("t")            #指定字符串的个数
3
上面所有方法都可用index代替，不同的是使用index查找不到会抛异常，而find返回-1

搜索相关

　　3.4、替换相关

>>> abc
'Python String Function'
>>> abc.replace("tion","TION")        #将指定字符串替换为大写
'Python String FuncTION'

>>> abc.replace("t","*",1)               #替换字符串中的第一个t为*
'Py*hon String Function'

替换

　　3.5、去空格及去指定字符

>>> abc.strip()                   #去两边空格    
'Python String Function'

>>> abc.lstrip()                  #去左边空格
'Python String Function'

>>> abc.rstrip()                  #去右边空格
'Python String Function'

>>> abc.strip("n")              #去两边字符串，也有lstrip和rsrtip
'Python String Functio'

去空格及指定字符串

　　3.6、判断相关

>>> abc
'Python String Function'

>>> abc.startswith("P")        #是否以P开头，是则为True，不是则为False
True

>>> abc.endswith("n")         #是否以n结尾，是则为True,不是则为False
True

>>> abc.isalnum()              #是否全为字母或数字，是则为True
False

>>> abc.isalpha()               #是否全为字母，不是则为False,因为还有空格
False

>>> abc.isdigit()                #是否全为数字，不是则False
False

>>> abc.islower()               #是否全小写
False

>>> abc.isupper()              #是否全大写
False

判断

四、元组

　　定义：与列表类似，只不过［］改成（）

特性：

1.可存放多个值
2.不可变
3.按照从左到右的顺序定义元组元素，下标从0开始顺序访问，有序

>>> ages = ("10","20","30","40")
>>> ages
('10', '20', '30', '40')

　　　　注：只有2个方法，一个是count,一个是index

五、字典

定义：｛key1:value1,key2:value2｝,key-value结构，key必须可hash
字典一种key - value 的数据类型
语法：

>>> info = {
... "stu1":{"lily":{"age":18,"job":"IT"}},
... "stu2":{"jack":{"age":20,"job":"IT"}},
... "stu3":{"admin":{"age":30,"job":"Driver"}}
... }
>>> info
{'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}

　　字典的特性：

dict是无序的
key必须是唯一的,天生去重

　5.1、增加

>>> info["abc"] = {"age":22,"job":"IT"}
>>> info
{'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'abc': {'age': 22, 'job': 'IT'}, 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}

增加

　5.2、修改

>>> info["abc"] = "xiaoming"
>>> info
{'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'abc': 'xiaoming', 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}

修改

5.3、删除

>>> info
{'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'abc': 'xiaoming', 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}
>>> del info["abc"]   
>>> info
{'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'stu3': {'admin': {'age': 30, 'job': 'Driver'}}}
>>> 


#另一种方法
>>> info.pop("stu3")
{'admin': {'age': 30, 'job': 'Driver'}}
>>> info 
{'stu2': {'jack': {'age': 20, 'job': 'IT'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}}

删除

　5.4、查找

>>> info
{'stu2': {'admin': {'age': 30, 'job': 'Driver'}}, 'stu1': {'lily': {'age': 18, 'job': 'IT'}}, 'stu3': {'jack': {'age': 20, 'job': 'IT'}}}
>>> "stu3" in info          #显示返回值
True

>>> info["stu3"]             #第二种方法
{'jack': {'age': 20, 'job': 'IT'}}
>>> info["stu4"]              #如果没找到会报错
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'stu4'

>>> info.get("stu3")        #第三种方法
{'jack': {'age': 20, 'job': 'IT'}}
>>> info.get("stu4")        #没找到不会报错
>>>

查找

其他方法：

　>>> info.values()
dict_values([{'admin': {'age': 30, 'job': 'Driver'}}, {'lily': {'age': 18, 'job': 'IT'}}, {'jack': {'age': 20, 'job': 'IT'}}])


>>> info.keys()
dict_keys(['stu2', 'stu1', 'stu3'])

>>> a = {1:2,2:3,"a":"b"}
>>> info.update(a)
>>> info    
{'stu1': {'lily': {'job': 'IT', 'age': 18}}, 1: 2, 2: 3, 'stu2': {'jack': {'job': 'IT', 'age': 20}}, 'stu3': {'admin': {'job': 'Driver', 'age': 30}}, 'a': 'b'}

>>> info.items()
dict_items([('stu1', {'lily': {'job': 'IT', 'age': 18}}), (1, 2), (2, 3), ('stu2', {'jack': {'job': 'IT', 'age': 20}}), ('stu3', {'admin': {'job': 'Driver', 'age': 30}}), ('a', 'b')])

其他方法

循环、、、

info = {
    "name1":"lily",
    "name2":"admin",
    "name3":"jack",
    "name4":"abc"
}

for key in info:
    print(key,info[key])

 
    name3 jack
    name1 lily
    name2 admin
    name4 abc

循环

六、集合

集合是一个无序的，不重复的数据组合，它的主要作用如下：

去重，把一个列表变成集合，就自动去重了
关系测试，测试两组数据之前的交集、差集、并集等关系

　　集合常用操作：关系运算

　　in
　　not in
　　＝＝
　　！＝不等于
　　 <,<=
　　 >,>=
　　 |,|=:合集
　　 &.&=:交集
　　－,－=:差集
　　 ^,^=:对称差分

　set 的创建：　

>>> L = [1,1,2,4,3]
>>> t = (2,3,4,6,6,6,7)
>>> s = {1}
>>> type(s)
<class 'set'>
>>> s= set(L)
>>> s
{1, 2, 3, 4}   #从列表到集合

>>> s = set(t)  
>>> s
{2, 3, 4, 6, 7}  #从元组到集合

set 基本函数与操作：

　　s.add( x ) 将元素 x 添加到集合s中，若重复则不进行任何操作

>>> s = {1,2,"a"}
>>> s.add("b")
>>> s
{1, 2, 'b', 'a'}
>>> s.add(1)
>>> s
{1, 2, 'b', 'a'}

add

s.update( x ) 将集合 x 并入原集合s中，x 还可以是列表，元组，字典等，x 可以有多个，用逗号分开

>>> s
{1, 2, 'b', 'a'}
>>> s.update({1,3})
>>> s
{1, 2, 'b', 3, 'a'}
>>> s.update([1,4])
>>> s
{1, 2, 'b', 3, 4, 'a'}

update

s.discard( x ）将 x 从集合s中移除，若x不存在，不会引发错误

>>> s
{1, 2, 'b', 3, 4, 'a'}
>>> s.discard(1)
>>> s
{2, 'b', 3, 4, 'a'}
>>> s.discard(1)
>>> s
{2, 'b', 3, 4, 'a'}

discard

s.remove( x ) 将 x 从集合s中移除，若x不存在，会引发错误

>>> s
{2, 'b', 3, 4, 'a'}
>>> s.remove("a")
>>> s
{2, 'b', 3, 4}
>>> s.remove("a")
Traceback (most recent call last):
  File "<input>", line 1, in <module>
KeyError: 'a'

remove

s.pop() 随机删除并返回集合s中某个值，注意，因为set是无序的，不支持下标操作，没有所谓的最后一个，pop()移除随机一个元素，这和其他数据结构不同

>>> s
{2, 'b', 3, 4}
>>> s.pop()
2
>>> s
{'b', 3, 4}

pop

s.clear() 清空

len(s) set支持len操作

>>> s
{'b', 3, 4}
>>> len(s)
3

x in s set同样支持in操作

>>> s
{'b', 3, 4}
>>> 1 in s
False
>>> 3 in s 
True

s.union( x ) 返回s与集合x的交集，不改变原集合s，x 也可以是列表，元组，字典。

>>> s1 = {1,2,3}
>>> s2 = {"a","b"}
>>> s1.union(s2)
{1, 2, 3, 'b', 'a'}
>>> s1
{1, 2, 3}
>>> s2
{'b', 'a'}

View Code

s.intersection( x ) 返回s与集合x的并集，不改变s， x 也可以是列表，元组，字典。

>>> s1 = {1,2,3}
>>> s2 = {2,3,4}
>>> s1.intersection(s2)
{2, 3}
>>> s1
{1, 2, 3}

intersection

s.symmetric_difference( x ) 返回s和集合x的对称差集，即只在其中一个集合中出现的元素，不改变集合s， x 也可以是列表，元组，字典。

>>> s1
{1, 2, 3}
>>> s2
{2, 3, 4}
>>> s1.symmetric_difference(s2)
{1, 4}
>>> s1
{1, 2, 3}

View Code

s.issubset( x ) 判断集合s 是否是集合x 子集

s.issuperset( x ）判断集合x 是否是集合s的子集

>>> s1 = {1,2,3}
>>> s2 = {1,3}
>>> s2.issubset(s1)
True
>>> s1.issubset(s2)
False
>>> s1.issuperset(s2)
True

View Code

求交集，并集，差集，对称差集的另一种方法：

>>> s1 = {1,2,3,"a"}
>>> s2 = {3,4,"b"}
>>> s1 & s2          #交集
{3}
>>> s1 | s2           #并集
{1, 2, 3, 'b', 4, 'a'}
>>> s1 - s2           #差集
{1, 2, 'a'}
>>> s1 ^ s2          #对称差集
{1, 'b', 2, 4, 'a'}

View Code

{ } 在布尔运算中表示 False，其他均为 True

七、文件操作

对文件操作流程

打开文件，得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件

模式	描述
r	打开一个文件为只读。文件指针被放置在文件的开头。这是默认模式。
rb	打开一个文件只能以二进制格式读取。文件指针被放置在文件的开头。这是默认模式。
r+	打开用于读和写文件。文件指针置于该文件的开头。
rb+	打开用于读取和写入二进制格式的文件。文件指针置于该文件的开头。
w	打开一个文件只写。如果文件存在覆盖该文件。如果该文件不存在，则创建写入新文件。
wb	打开一个文件只能以二进制格式写入。如果文件存在覆盖该文件。如果该文件不存在，则创建写入新文件。
w+	打开文件为写入和读取模式。如果文件存在覆盖现有文件。如果该文件不存在，创建用于读写操作的新文件。
wb+	打开用于以二进制格式写入和读出文件。如果文件存在覆盖现有文件。如果该文件不存在，创建用于读写操作的新文件。
a	打开用于追加的文件。文件指针是在文件是否存在该文件的末尾。也就是说，该文件是在追加模式。如果该文件不存在，它会创建一个用于写入的新文件。
ab	打开文件用于二进制格式追加。文件指针是在文件是否存在该文件的末尾。也就是说，文件是在追加模式。如果该文件不存在，它会创建一个用于写入的新文件。
a+	打开文件为追加和读取方式。文件指针是在文件是否存在该文件的末尾。该文件以追加模式打开。如果该文件不存在，它将创建用于读写操作的新文件。
ab+	打开一个文件以附加和二进制格式读取模式。如果该文件存在文件指针在该文件的末尾。该文件以追加模式打开。如果该文件不存在，它将创建读写操作的新文件。

　　file 对象属性

　　　　一旦文件被打开，则就会有一个文件对象，你就可以得到有关该文件的各种信息。

　　　　这里是一个文件对象相关的所有属性的列表：

　　　　属性:

	描述
file.closed	如果文件被关闭返回true，否则为false
file.mode	返回文件打开访问模式
file.name	返回文件名

　示例：

1 fo = open("foo.txt","wb")
2 print("Name of the file:",fo.name)
3 print("Closed or not :",fo.closed)
4 print("Opening mode:",fo.mode)
5 fo.close()

结果：

Name of the file: foo.txt
Closed or not : False
Opening mode: wb

close()方法

文件对象的close()方法用于刷新任何未写入的信息，并关闭文件对象，之后就没有更多的写入东西了。

Python自动关闭文件当参考文件对象分配给另一个文件。使用 close()方法关闭文件一个很好的做法。

fileObject.close();

示例：

fo = open("foo.txt","wb")
print("Name of the file:",fo.name)
fo.close()

结果：

Name of the file: foo.txt

读写文件

文件对象提供了一组访问方法。我们将看到如何使用 read()和write()方法来读取和写入文件。

write() 方法

write()方法将字符串写入一个打开的文件。要注意，Python的字符串可以是二进制数据，而不仅仅只是文字。

write()方法不添加换行符('\n')到字符串的结尾-


语法：

fileObject.write(string);

这里，传递的参数是要写入到打开的文件的内容。

示例：

fo = open("foo.txt","w")
fo.write("Python is a great language.\n Yeah its great!\n")
fo.close()

上面的方法将创建 foo.txt 文件，并给出的内容写入文件，最后将关闭该文件。如果打开这个文件，会看到它有以下内容。

Python is a great language.
 Yeah its great!

read() 方法

read()方法从一个打开的文件读取字符串。要注意，Python字符串可以是二进制数据。而并非只是文本数据。

语法

fileObject.read([count]);

这里，传递的参数是从打开的文件读取的字节数。该方法开始从文件的开始读取，并且如果 count 丢失，那么它会尝试尽可能读，也许直到文件的末尾。

示例

让我们使用一个文件 foo.txt，这是我们在上面所创建的。

# Open a file
fo = open("foo.txt", "r+")
str = fo.read(10)
print ("Read String is : ", str)
# Close opened file
fo.close()

这将产生以下结果 -

Read String is :  Python is

文件位置

tell() 方法告诉你该文件中的当前位置；换句话说，下一个读或写将发生在从该文件的开头之后多个字节。

seek(offset[, from]) 方法改变当前文件的位置。 offset 参数指示要移动字节数。from 参数指定字节从哪移动的参考位置。

如果 from 被设置为0，这意味着使用该文件的开头作为基准位置，以及如果设置为1，则使用当前位置作为基准位置，如果它被设置为2，则该文件的结束将被作为基准位置。

示例

让我们使用一个文件foo.txt，这是我们在上面创建的。

# Open a file
fo = open("foo.txt", "r+")
str = fo.read(10)
print ("Read String is : ", str)

# Check current position
position = fo.tell()
print ("Current file position : ", position)

# Reposition pointer at the beginning once again
position = fo.seek(0, 0)
str = fo.read(10)
print ("Again read String is : ", str)
# Close opened file
fo.close()

这将产生以下结果 -

Read String is :  Python is
Current file position :  10
Again read String is :  Python is

重命名和删除文件

Python的os模块提供了执行文件处理操作，如重命名和删除文件的方法。

要使用这个模块，需要先导入它，然后就可以调用任何相关的功能了。

八. 字符编码与转码

详细文章:

http://www.cnblogs.com/yuanchenqi/articles/5956943.html

http://www.diveintopython3.net/strings.html

需知:

1.在python2默认编码是ASCII, python3里默认是utf-8

2.unicode 分为 utf-32(占4个字节),utf-16(占两个字节)，utf-8(占1-4个字节)， so utf-8就是unicode

3.在py3中encode,在转码的同时还会把string 变成bytes类型，decode在解码的同时还会把bytes变回string

posted @ 2016-10-20 17:19 lily1160 阅读(261) 评论(0) 收藏举报

刷新页面返回顶部

lily1160

python 基础之数据类型

集合常用操作：关系运算

file 对象属性

close()方法

write() 方法

示例：

语法

示例

示例

八. 字符编码与转码

公告

　　集合常用操作：关系运算

　　file 对象属性