Python学习笔记——文件

1. 打开模式

打开模式

f = open('F:\\codes\\python\\python\\fishc\\hhh.txt','r')
print(f)
<_io.TextIOWrapper name='F:\\codes\\python\\python\\fishc\\hhh.txt' mode='r' encoding='cp936'>

操作

2. 读取文件

# 读取整个文件
print(f.read())
hhh
qwe大哥撒谎士大夫汇丰大厦广东省大v发
hfvkshkhalsfsfslkakjlkdslajfdlk
# 上面第一次使用read()函数使文件指针指向文件末尾,所以此时再读取,结果为空
print(f.read())
f.close()
f1 = open('F:\\codes\\python\\python\\fishc\\hhh.txt')
# 读取前五个字符
print(f1.read(5))#注意这里的参数为字符个数,与所占空间无关
hhh
q
# 可以使用tell()方法获取指针位置
# 一个中文字符,占两个字节
print(f1.tell())
6
f2 = open('F:\\codes\\python\\python\\fishc\\hhh.txt')
print(f2.read(3))
# 当以上read()函数遇到换行时,会出现奇怪的东西,暂且把换行符当成两个字符
print(f2.tell())
hhh
18446744073709551620
# 移动指针
f1.seek(4,0)
print(f1.tell())
print(f1.read())
4

qwe大哥撒谎士大夫汇丰大厦广东省大v发
hfvkshkhalsfsfslkakjlkdslajfdlk
# 移动指针
f1.seek(4,0)
print(f1.tell())
# readline()只能读取一整行,若读取到上一行的字符,不会有输出
print(f1.readline())
4
# 移动指针
f1.seek(5,0)
print(f1.tell())
print(f1.readline())
5
qwe大哥撒谎士大夫汇丰大厦广东省大v发
# 将从指针开始到文件最后的字符转换成列表的形式
f1.seek(5,0)
print(list(f1))
['qwe大哥撒谎士大夫汇丰大厦广东省大v发\n', 'hfvkshkhalsfsfslkakjlkdslajfdlk\n']
# 回到文件开始的位置,将文件逐行打印
f1.seek(0,0)
lines = list(f1)
for each_line in lines:
    print(each_line)
hhh

qwe大哥撒谎士大夫汇丰大厦广东省大v发

hfvkshkhalsfsfslkakjlkdslajfdlk
# 以上方法效率不高,可用如下方法
f1.seek(0,0)
for each_line in f1:
    print(each_line)
hhh

qwe大哥撒谎士大夫汇丰大厦广东省大v发

hfvkshkhalsfsfslkakjlkdslajfdlk
f1.close()
f2.close()

3. 写入文件

f4 = open('F:\\codes\\python\\python\\fishc\\test.txt','w')
f4.write('你好')
f4.close()

4. 任务:将文件(words.txt)中的数据进行分割,并按照以下规律保存起来:

  • 小甲鱼的对话单独保存为boy_ *.txt的文件(去掉小甲鱼:”)
  • 小客服的对话单独保存为girl_ *.txt的文件(去掉小客服:”)
  • 文件中总共有三段对话,分别保存为boy_ 1.txt,girl_ 1.txt, boy_ 2.txt, girl_ 2.txt,boy_ 3.txt, gril_ 3.txt共6个文件(提示:文件中不同的对话间已经使用 ========= T ”分割)

对话

f = open(r'F:\codes\python\python\fishc\words.txt','r')

boy = []
girl = []
count = 1

for each_line in f:
    if each_line[:6] != '======':
        # 如果不是空行,就进行字符串分割
        if each_line != '\n':
            role,line_spoken = each_line.split(':',1)
            if role == '小甲鱼':
                boy.append(line_spoken)
            if role == '小客服':
                girl.append(line_spoken)
    else:
        # 进行文件的保存操作
        file_name_boy = 'boy_' + str(count) + '.txt'
        file_name_girl = 'girl_' + str(count) + '.txt'
        
        boy_file = open(file_name_boy,'w')
        girl_file = open(file_name_girl,'w')
        
        boy_file.writelines(boy)
        girl_file.writelines(girl)
        
        boy_file.close()
        girl_file.close()
        
        boy = []
        girl = []
        count += 1

# 由于文件中只有两个'========='分隔符
# 所以第三段对话的数据未保存,则退出循环后再保存一次
file_name_boy = 'boy_' + str(count) + '.txt'
file_name_girl = 'girl_' + str(count) + '.txt'
        
boy_file = open(file_name_boy,'w')
girl_file = open(file_name_girl,'w')
        
boy_file.writelines(boy)
girl_file.writelines(girl)
        
boy_file.close()
girl_file.close()
        
f.close()

def save_file(boy,girl,count):
    file_name_boy = 'boy_' + str(count) + '.txt'
    file_name_girl = 'girl_' + str(count) + '.txt'

    boy_file = open(file_name_boy,'w')
    girl_file = open(file_name_girl,'w')

    boy_file.writelines(boy)
    girl_file.writelines(girl)

    boy_file.close()
    girl_file.close()

def split_file(filepath):
    
    f = open(filepath)

    boy = []
    girl = []
    count = 1

    for each_line in f:
        if each_line[:6] != '======':
            # 如果不是空行,就进行字符串分割
            if each_line != '\n':
                role,line_spoken = each_line.split(':',1)
                if role == '小甲鱼':
                    boy.append(line_spoken)
                if role == '小客服':
                    girl.append(line_spoken)
        else:
            # 进行文件的保存操作
            save_file(boy,girl,count)

            boy = []
            girl = []
            count += 1

    save_file(boy,girl,count)

    f.close()

# 整个程序只需要调用这句话就可实现
split_file(r'F:\codes\python\python\fishc\words.txt')
posted @ 2019-07-26 16:22  nigream  阅读(264)  评论(0编辑  收藏  举报