基础python学习笔记5——文件和数据格式化
文本文件VS二进制文件
- 文本文件和二进制文件都只是文件的展示方式
- 本质上,所有文件都是二进制形式存储
- 形式上,所有文件采用两种方式展示
文本文件
- 由单一特定编码组成的文件,如UTF-8编码
- 由于存在编码,也被看成是存储着的长字符串
- 比如说txt文件,py文件
二进制文件
- 直接由比特0,,组成,没有统一字符编码
- 比如说png文件,avi文件
文件的打开模式
- 'r'只读模式,默认值,如果文件不存在,返回FileNotFoundError
- 'w'覆盖写模式,如果文件不存在则创建,存在则完全覆盖
- 'x'创建写模式,如果文件不存在则创建,存在则返回FileExistsError
- 'a'追加写模式,文件不存在则创建,存在则在文件最后追加内容
- 'b'二进制文件模式
- 't'文本文件模式【默认值】
- '+'与'r/w/a'一起使用,在原先功能基础上增加同时读写的功能
文件的关闭
- <变量名>.close() //不过当程序退出时,也可以自动将打开的文件关闭掉
一维数据
对应列表、数组和集合等类型的概念
如果数据之间有顺序,可以使用列表
如果数据之间没有顺序,可以使用集合类型
存储方式
- 空格分隔(数据中不能有空格
- 逗号分隔(数据中不能有逗号
- 特殊符号分割
eg: 中国$美国$日本$法国
二维数据
由多个一维数据构成,是一维数据的组合体
二维数据的表示
使用列表类型:[[3.1,3.2,3.3],["kkk","sss"]]
ls = [["333","444"], ["111","222"]]
for i in ls:
for j in i:
print(j,end=" ")
print(end='\n')
CSV数据存储格式:
国际通用的一二维数据存储格式,一般为.csv后缀
一维:以逗号为分隔
二维:以换行为分隔
- 如果某个元素缺失,逗号仍然保留
- 逗号为英文半角符号,逗号和数据之间没有空格
- 如果数据中包含逗号,要在数据两侧加一个引号;也可以为逗号增加一个转义符(即\)