python之文件操作

文件操作：我们一般对文件操作有如下基本过程

1.打开文件，得到文件句柄并且赋值给一个变量

2.通过该文件句柄对文件进行一系列的操作

3.关闭文件

在这里解释下文件句柄：在文件I/O中，要从一个文件读取数据，应用程序首先要调用操作系统函数并传送文件名，并选一个到该文件的路径来打开文件。该函数取回一个顺序号，即文件句柄（file handle），该文件句柄对于打开的文件是唯一的识别依据。

在这里，举个栗子~

f = open(file='文本.txt',mode='r',encoding='utf-8')

data = f.read()

f.close()

这里对于文件各部分的解释如下：

file='文本.txt'                                     表示文件路径
mode='r'                                          表示只读（可以修改为其他）
encoding='utf-8'                                  表示将硬盘上的 0101010 按照utf-8的规则去“断句”，再将“断句”后的每一段0101010转换成unicode的 01010101，unicode对照表中有01010101和字符的对应关系。
f.read()                                          表示读取所有内容，内容是已经转换完毕的字符串。
f.close()                                         表示关闭文件

此处的encoding必须和文件在保存时设置的编码一致，不然“断句”会不准确从而造成乱码。

P：就是怎么存进去就怎么读出来，编码保持一致

一般打开文件有这么几种类型：

1.r, 只读模式。（不允许写，只允许读）

2.w，只写模式。（不可读，不存在则创建：若存在，则删除再创建）

3.a，追加模式。（可读。不存在则创建，存在则只追加内容，在最后面）

其他类型，后续补充：

在以后使用较多的是：wb,rb主要是用来传输文件之类使用

还有写读和读写模式，但是实际应用种不是特别多

打开文件（一般有两种操作）：

f=open("yesterday","a",encoding="utf_8")

此方法需要手动关闭，或者等程序结束之后关闭，可添加f.closed()来关闭

with open('yesterday','r',encoding="utf-8") as f:

用with方法打开文件，当with代码块执行完毕时，内部会自动关闭并释放文件资源。

此外，with方法还有支持同时管理上下文的功能

with open('log1') as obj1, open('log2') as obj2:

文件循环：

f = open("文本.txt",'r',encoding="utf-8")

for line in f:
    print(line)

f.close()

写文件

f = open(file='文本.txt',mode='w',encoding='utf-8')
f.write('我是文本')
f.close()

语法解释：

file=' 文本.txt'                                       表示文件路径
mode='w'                                             表示只写
encoding='utf-8'                                     将要写入的unicode字符串编码成utf-8格式
f.write(...)                                         表示写入内容，写入的内容是unicode字符串类型，内部会根据encoding转换为制定编码的 01101010101，即：字节类型
f.close()

追加

f = open("文本.txt",'a',encoding="gbk")

f.write("\n杜姗姗 北京  167 49 13324523342")
f.close()

注意：

文件操作时，以 “a”或“ab” 模式打开，则只能追加，即：在原来内容的尾部追加内容

写入到硬盘上时，必须是某种编码的0101010，打开时需要注意：

ab，写入时需要直接传入以某种编码的0100101，即：字节类型

a 和 encoding，写入时需要传入unicode字符串，内部会根据encoding制定的编码将unicode字符串转换为该编码的 010101010

文件的一些其他操作：

def fileno(self, *args, **kwargs): # real signature unknown
        返回文件句柄在内核中的索引值，以后做IO多路复用时可以用到

    def flush(self, *args, **kwargs): # real signature unknown
        把文件从内存buffer里强制刷新到硬盘

    def readable(self, *args, **kwargs): # real signature unknown
        判断是否可读

    def readline(self, *args, **kwargs): # real signature unknown
        只读一行，遇到\r or \n为止

    def seek(self, *args, **kwargs): # real signature unknown
        把操作文件的光标移到指定位置
        *注意seek的长度是按字节算的， 字符编码存每个字符所占的字节长度不一样。
        如“路飞学城” 用gbk存是2个字节一个字，用utf-8就是3个字节，因此以gbk打开时，seek(4) 就把光标切换到了“飞”和“学”两个字中间。
        但如果是utf8,seek(4)会导致，拿到了飞这个字的一部分字节，打印的话会报错，因为处理剩下的文本时发现用utf8处理不了了，因为编码对不上了。少了一个字节

    def seekable(self, *args, **kwargs): # real signature unknown
        判断文件是否可进行seek操作

    def tell(self, *args, **kwargs): # real signature unknown
        返回当前文件操作光标位置 

    def truncate(self, *args, **kwargs): # real signature unknown
        按指定长度截断文件
        *指定长度的话，就从文件开头开始截断指定长度，不指定长度的话，就从当前位置到文件尾部的内容全去掉。

    def writable(self, *args, **kwargs): # real signature unknown
        判断文件是否可写

占硬盘方式的文件修改代码示例

f_name = "兼职白领学生空姐模特护士联系方式utf8.txt"
f_new_name = "%s.new" % f_name

old_str = "乔亦菲"
new_str = "[乔亦菲 Yifei Qiao]"

f = open(f_name,'r',encoding="utf-8")
f_new = open(f_new_name,'w',encoding="utf-8")

for line in f:

    if old_str in line:
        new_line = line.replace(old_str,new_str)
    else:
        new_line = line

    f_new.write(new_line)

f.close()
f_new.close()

上面的代码，会生成一个修改后的新文件，原文件不动，若想覆盖原文件

import os

f_name = "兼职白领学生空姐模特护士联系方式utf8.txt"
f_new_name = "%s.new" % f_name

old_str = "乔亦菲"
new_str = "[乔亦菲 Yifei Qiao]"

f = open(f_name,'r',encoding="utf-8")
f_new = open(f_new_name,'w',encoding="utf-8")

for line in f:

    if old_str in line:
        new_line = line.replace(old_str,new_str)
    else:
        new_line = line

    f_new.write(new_line)

f.close()
f_new.close()

os.rename(f_new_name,f_name) #把新文件名字改成原文件 的名字，就把之前的覆盖掉了,windows使用os.replace # 帮助文档说明replace会覆盖原文件

其他的一些用法：

with open('yesterday','r',encoding="utf-8") as f:
    print(f.tell())
    print(f.readline())
    f.seek(0)
    print(f.tell())

seek(),用于移动文件读写指针到指定位置：tell()获取当前位置

在某一行插入一行文字：

count=0
for line in f:

    if count==9:
        print("--------我是分割线-------")
        count += 1
        continue
    print(line.rstrip())
    count+=1

其中的for循环就是遍历整个文件

文件的修改：

f=open('yesterday','r',encoding="utf-8")
f_new=open('yesterday.bak','w',encoding="utf-8")


for line in f:
    if "肆意的快乐等我享受" in line:
        line = line.replace("肆意的快乐等我享受","肆意的快乐等周栩强享受")
    f_new.write(line)
f.close()
f_new.close()

创建一个新文件，将修改后的内容写入新的文件，然后手动删除之前的文件，就能实现文件的修改。该方式下记得关闭文件

文件的数据类型转换

如果我们要将存在在文件中的多行数据进行处理，比如转换成列表我们可以进行如下操作：

文件内容如图所示：

1,Alex Li,22,13651054608,IT,2013‐04‐01
2,Jack Wang,28,13451024608,HR,2015‐01‐07
3,Rain Wang,21,13451054608,IT,2017‐04‐01
4,Mack Qiao,44,15653354208,Sales,2016‐02‐01
5,Rachel Chen,23,13351024606,IT,2013‐03‐16
6,Eric Liu,19,18531054602,Marketing,2012‐12‐01
7,Chao Zhang,21,13235324334,Administration,2011‐08‐08
8,Kevin Chen,22,13151054603,Sales,2013‐04‐01
9,Shit Wen,20,13351024602,IT,2017‐07‐03
10,Shanshan Du,26,13698424612,Operation,2017‐07‐02

我们可以进行如下操作：

li = { #把文件里的每列添加到下面这些列表里
        'id':[],
        'name':[],
        'age':[],
        'phone':[],
        'job':[],
        'time':[]
    }


f = open('员工信息表',"r",encoding="utf-8")

for line in f:
    number,name,age,phone,job,time = line.strip().split(',')
    li['id'].append(number)
    li['name'].append(name)
    li['age'].append(age)
    li['phone'].append(phone)
    li['job'].append(job)
    li['time'].append(time)

就可以将文件的数据转换成列表的形式了

posted @ 2018-04-16 20:41 Recklessz 阅读(208) 评论(0) 收藏举报

刷新页面返回顶部

Marvelous

Just do it nothing is impossible

python之文件操作

文件循环：

写文件

追加

公告