Python文件处理

第1章简单文件操作

介绍

　　大多数程序都遵循着：输入->处理->输出的模型，首先接收输入数据，然后按照要求进行处理，最后输出数据。

　　在编写代码时，操作系统为了更快响应，把所有当前的数据都放在内存中，因为内存和CPU数据传输的速度要比在硬盘和CPU之间传输的速度快很多倍。但是内存有一个天生的不足，就是一旦断电就是什么都没了，所以要保持随时使用Ctrl+S永久保存数据。

　　Windows是以扩展名来指出文件是什么类型，所以*.exe是可执行文件，*.txt是文本文件，*.docs或*.doc是word的专用格式，这些都称之为文件。

一、打开文件

　　在Python中，使用open()这个函数来打开文件并返回文件对象。

1、操作文件的流程：

# 1、打开文件，得到文件句柄并赋值给一个变量
f=open(r'a.txt','r',encoding='utf-8')

# 2、通过句柄对文件进行操作
data=f.read()
print(data)

# 3、关闭文件
f.close() # 文件关闭，回收操作系统的资源

2、打开文件不需要close()的方法

with open(r'a.txt','r',encoding='utf-8') as f:
    print(f.read())

二、文件的打开模式

#1. 打开文件的模式有(默认为文本模式)：
r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】
w，只写模式【不可读；不存在则创建；存在则清空内容】
a， 之追加写模式【不可读；不存在则创建；存在则只追加内容】

#2. 对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作（而所有文件也都是以字节的形式存储的，使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式）
rb 
wb
ab
注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

#3. 了解部分
"+" 表示可以同时读写某个文件
r+， 读写【可读，可写】
w+，写读【可读，可写】
a+， 写读【可读，可写】


x， 只写模式【不可读；不存在则创建，存在则报错】
x+ ，写读【可读，可写】
xb

三、操作文件的方法

文本读模式

# 读操作：r只读模式，默认是rt
f=open('a.txt','r',encoding='utf-8')
data1=f.read()
print('=1===>',data1)
data2=f.read()
print('=2===>',data2)
f.close()

执行结果：
=1===> 哈哈哈哈
你好lionel
=2===> 

# readline和readlines
f=open(r'a.txt','r',encoding='utf-8')
print(f.readline(),end='')
print(f.readlines())
f.close()

执行结果：
哈哈哈哈
['你好lionel']

# 文本读模式：循环文件
# while循环
with open(r'a.txt','r',encoding='utf-8') as f:
    while True:
        line=f.readline()
        if len(line) == 0:break
        print(line,end='')

# for循环
with open(r'a.txt','r',encoding='utf-8') as f:
    for line in f:
        print(line,end='')

View Code

文本写模式

# 写操作：w只写模式，默认是wt文本写，如果文件不存在则创建，存在则清空+覆盖
f=open(r'a.txt','w',encoding='utf-8')
f.write('11111\n')
f.write('222222\n')
f.writelines(['嘻嘻嘻\n','你好','wang'])
f.close()

执行结果：
a.txt 文件已经被覆盖，下面是a.txt文件内容：
11111
222222
嘻嘻嘻
你好wang

View Code

文本追加模式

f=open(r'a.txt','a',encoding='utf-8')
f.write('12312312\n')
f.writelines(['wangzhiwei\n','123456\n'])
f.write('cccccccccccc')
f.close()

执行结果：
a.txt文件内容：
11111
222222
嘻嘻嘻
你好wang
12312312
wangzhiwei
123456
cccccccccccc

View Code

四、文件的修改

文件的数据是存放于硬盘上的，因而只存在覆盖、不存在修改这么一说，我们平时看到的修改文件，都是模拟出来的效果，具体的说有两种实现方式：
　　方式一：将硬盘存放的该文件的内容全部加载到内存，在内存中是可以修改的，修改完毕后，再由内存覆盖到硬盘（word，vim，nodpad++等编辑器）

import os

with open('info.txt','r',encoding='utf-8') as read_f,open('.info.txt.swap','w',encoding='utf-8') as write_f:
    data=read_f.read()  # 全部读入内存,如果文件很大,会很卡
    write_f.write(data.replace('alex','SB'))  # 在内存中完成修改，并一次性写入新文件

os.remove('info.txt')
os.rename('.info.txt.swap','info.txt')

　　方式二：将硬盘存放的该文件的内容一行一行地读入内存，修改完毕就写入新文件，最后用新文件覆盖源文件

import os

with open('info.txt','r',encoding='utf-8') as read_f,\
        open('.info.txt.swap','w',encoding='utf-8') as write_f:
    # data=read_f.read()
    # write_f.write(data.replace('alex','SB'))
    for line in read_f:
        if 'SB' in line:
            line=line.replace('SB','alex')
        write_f.write(line)

os.remove('info.txt')
os.rename('.info.txt.swap','info.txt')

五、文件内光标移动

1、read(3)：

　　a、文件打开方式为文本模式时，代表读取3个字符

　　b、文件打开方式为b模式时，代表读取3个字节

2、其余的文件内光标移动都是以字节为单位如seek，tell，truncate

注意：
　　1. seek有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的
　　2. truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果

六、练习

#利用b模式，编写一个cp工具，要求如下：
    # 1. 既可以拷贝文本又可以拷贝视频，图片等文件
    # 2. 用户一旦参数错误，打印命令的正确使用方法，如usage: cp source_file target_file

# 方法一：
import sys
if len(sys.argv) != 3:
    print('usage: cp source_file target_file')
    sys.exit()

_,srcfile,dstfile,*_=sys.argv
with open(srcfile,'rb') as read_f,\
    open(dstfile,'wb') as write_f:
    for line in read_f:
        write_f.write(line)

# 方法二：
import sys
if len(sys.argv) != 3:
    print('usage: cp source_file target_file')
    sys.exit()

source_file,target_file=sys.argv[1],sys.argv[2]
with open(source_file,'rb') as read_f,open(target_file,'wb') as write_f:
    for line in read_f:
        write_f.write(line)

# 基于seek实现tail -f功能
import time
with open('access.log','rb') as f:
    f.seek(0,2)
    while True:
        line=f.readline()
        if line:
            print(line.decode('utf-8'),end='')
        else:
            time.sleep(0.05)

posted @ 2019-04-07 15:21 Lionel_Wang 阅读(169) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

行思

Python文件处理

第1章简单文件操作

介绍

一、打开文件

1、操作文件的流程：

2、打开文件不需要close()的方法

二、文件的打开模式

三、操作文件的方法

文本读模式

文本写模式

文本追加模式

四、文件的修改

五、文件内光标移动

1、read(3)：

2、其余的文件内光标移动都是以字节为单位如seek，tell，truncate

六、练习

公告

行思

Python文件处理

第1章 简单文件操作

介绍

一、打开文件

1、操作文件的流程：

2、打开文件不需要close()的方法

二、文件的打开模式

三、操作文件的方法

文本读模式

文本写模式

文本追加模式

四、文件的修改

五、文件内光标移动

1、read(3)：

2、 其余的文件内光标移动都是以字节为单位如seek，tell，truncate

六、练习

公告

第1章简单文件操作

2、其余的文件内光标移动都是以字节为单位如seek，tell，truncate