(1)文件操作(爬虫基础)

1、文件读写操作中常用的读写模式

读取

r:   是以文本文件的方式打开并且是只读方式打开
rb :  是以二进制的凡是打开并且是只读方式打开

写入

w :  是以文本文件的方式打开并且是写的方式
wb :  是以二进制的方式打开并且是写的方式

2、在当前项目下创建文件夹

#创建一个文件夹(import os)
if not os.path.exists('./文件夹名字'):
    os.mkdir('./文件夹名字')

3、写入数据

fileOperate.write('Practice code')
图片数据建议用二进制形式写入
#img_name为网页爬取的图片名字
img_path = './文件夹名字/' + img_name
with open(img_path,'wb') as fp:
    fp.write(img_data)

4、打开文件

#向test.html文件写入数据:
fp = open('./test.html', 'w', encoding='utf-8')
'w': 表示打开一个文件只用于写入。采用该模式时需小心。因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件。如果文件不存在,则创建新文件
encoding:所要打开文件的编码格式
posted @ 2020-10-11 23:59  yu10001  阅读(153)  评论(0编辑  收藏  举报