【python】 文件相关操作

  使用python进行读写文件时非常简单的事,我们使用open()函数来打开一个文件,获取到文件句柄,通过句柄就可以进行各种各样的操作了,根据打开方式的不同能够执行的操作也会有相应的差异.

 

  什么是句柄:

  句柄,从广义上,能够以一个数值拎起一大堆数据的东西都可以叫做句柄。句柄的英文是"Handle",本义就是"柄",只是在计算机科学中,被特别地翻译成"句柄",其实还是个"柄"。以一个小东西拎起一大堆东西,这难道不像是个"柄"吗?如果想更深刻的理解句柄的概念和含义,我给大家推荐一篇博文https://blog.csdn.net/rongwenbin/article/details/19820829

  举个栗子: 句柄其实就是变量

 

  打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的事r(只读)模式.

  文件操作的基本格式: open("文件名路径",mode="打开方式",encoding="编码方式"),值得注意的是,这里的文件名是单纯的文件名,就是你ctrl+s保存之后输入的文件名,不需要加后缀名。打开之后需要用一个变量来接收。在这里还涉及到一个路径的问题

 

  绝对路径: 从磁盘根目录开始一直到文件名.

  相对路径: 同一个文件夹下的文件.相对于当前这个程序所在的文件夹而言,如果在同一个文件夹,相对路径就是文件名,如果在上一层文件夹,则要../ 

  相比较而言,更推荐大家使用相对路径,因为我们在把程序拷贝给别人时,直接把项目拷贝走就可以使用,但是如果使用绝对路径,那还需要拷贝外部的文件 

 

  1. r模式(只读):

f = open("护士少妇嫩模",mode="r", encoding="utf-8") 
content = f.read() 
print(content) 
f.close() 

  读取文件的方式:

    1. read(),这是将文件内容一次性全部读取出来,但是缺点就是占内存,如果文件过大的话,容易导致内存崩溃;

    2. read(n),这是读取n个字符.需要注意的是,如果再次读取的话,那么会在当前位置继续去读取而不是从头开始读取,试过是rb模式,那读取之后就是n个字节

    3.readline(),这是一次读取一行数据,注意: readline()结尾,每次都会有一个\n,所以需要我们使用strip()方法来去除空格或者\n

    4. readlines(),这是将每一行形成一个元素,放在列表里,将所有的内容都读取出来,所以这个读取方式也容易出现内存崩溃的问题

    5.循环读取,这种方式是组好的. 每次读取一行内容,不会产生内存溢出的问题.

  注意: 读取完的句柄一定要关闭: f.close()

 

  2. w模式(只写):

f = open("护士少妇嫩模",mode="w", encoding="utf-8") 
content = f.write("护士少妇嫩模,大家都喜欢") 
print(content) 
f.close() 

  w模式,如果文件不存在的话,则会创建文件,如果文件存在,则将原文件的内容全部删除,再写入新的内容

 

  3. a模式(追加):

f = open("护士少妇嫩模",mode="a", encoding="utf-8") 
content = f.write("护士少妇嫩模,大家都喜欢") 
print(content) 
f.close() 

 

  4. r+模式(读写):

f = open("小娃娃", mode="r+", encoding="utf-8")
content = f.read()
f.write("麻花藤的最爱")
print(content)
f.flush()
f.close()

 

  5. w+模式(写读):

f = open("小娃娃", mode="w+", encoding="utf-8") 
f.write("哈哈") 
content = f.read() 
print(content) 
f.flush() 
f.close()

 

  6. a+模式(追加读)

f = open("小娃娃", mode="a+", encoding="utf-8") 
f.write("马化腾") 
content = f.read() 
print(content) 
f.flush() 
f.close()

 

  7. 其他操作 

    1. seek(n) 光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中文部分要是3的倍数.

     通常我们使用seek都是移动到开头或者结尾.

    移动到开头: seek(0)

    移动到结尾: seek(0,2)

    seek的第二个参数表示的是从哪个位置进行偏移, 默认是0, 表示开头, 1表示当前位置, 2表示结尾

f = open("小娃娃", mode="r+", encoding="utf-8") 
f.seek(0)   # 光标移动到开头 
content = f.read()  # 读取内容, 此时光标移动到结尾 
print(content) 
f.seek(0)   # 再次将光标移动到开头 
f.seek(0, 2)    # 将光标移动到结尾 
content2 = f.read()  # 读取内容. 什么都没有 
print(content2) 
f.seek(0)   # 移动到开头 
f.write("张国荣")  # 写入信息. 此时光标在9  中文3 * 3个 = 9 
f.flush() 
f.close()

    

    2. tell() 使⽤用tell()可以帮我们获取到当前光标在什么位置

 

    3. truncate() 截断文件

f = open("小娃娃", mode="w", encoding="utf-8") 
f.write("哈哈")   # 写入两个字符 
f.seek(3)   # 光标移动到3, 也就是两个字中间 
f.truncate()    # 删掉光标后面的所有内容 f.close()
f = open("小娃娃", mode="r+", encoding="utf-8") 
content = f.read(3)  # 读取12个字符 
f.seek(4) 
print(f.tell()) 
f.truncate()    # 后面的所有内容全部都删掉 # 
print(content) 
f.flush() 
f.close()

    所以如果想做截断操作. 记住了. 要先挪动光标. 挪动到你想要截断的位置. 然后再进行截断 .关于truncate(n), 如果给出了n. 则从开头进行截断, 如果不给n, 则从当前位置截断. 后面的内容将会被删除

  

  8. 文件修改

    文件修改: 只能将文件中的内容读取到内存中, 将信息修改完毕, 然后将源文件删除, 将新文件的名字改成老文件的名字. 

import os with open("小娃娃", mode="r", encoding="utf-8") as f1,\
     open("小娃娃_new", mode="w", encoding="UTF-8") as f2:
    for line in f1:        
        new_line = line.replace("大白梨梨", "冰糖葫芦")        
        f2.write(new_line) 
os.remove("小娃娃")    # 删除源⽂文件 
os.rename("小娃娃_new", "小娃娃")     # 重命名新文件        

 

posted @ 2018-07-12 16:24  清风吹杨柳  阅读(226)  评论(0编辑  收藏  举报