14. Python csv模块(读写文件)
1. 前言
CSV 文件又称为逗号分隔值文件,是一种通用的、相对简单的文件格式,用以存储表格数据,包括数字或者字符。CSV 是电子表格和数据库中最常见的输入、输出文件格式,可参考《CSV介绍》。
通过爬虫将数据抓取的下来,然后把数据保存在文件,或者数据库中,这个过程称为数据的持久化存储。本节介绍 Python 内置模块 CSV 的读写操作。
2. CSV文件写入
1) csv.writer()
csv 模块中的 writer 类可用于读写序列化的数据,其语法格式如下:
1 | writer(csvfile, dialect= 'excel' , **fmtparams) |
参数说明:
- csvfile:必须是支持迭代(Iterator)的对象,可以是文件(file)对象或者列表(list)对象。
- dialect:编码风格,默认为 excel 的风格,也就是使用逗号
,
分隔。 - fmtparam:格式化参数,用来覆盖之前 dialect 对象指定的编码风格。
示例如下:
1 2 3 4 5 6 7 8 9 | import csv # 操作文件对象时,需要添加newline参数逐行写入,否则会出现空行现象 with open( 'eggs.csv' , 'w' , newline= '' ) as csvfile: # delimiter 指定分隔符,默认为逗号,这里指定为空格 # quotechar 表示引用符 # writerow 单行写入,列表格式传入数据 spamwriter = csv.writer(csvfile, delimiter= ' ' ,quotechar= '|' ) spamwriter.writerow([ 'www.biancheng.net' ] * 5 + [ 'how are you' ]) spamwriter.writerow([ 'hello world' , 'web site' , 'www.biancheng.net' ]) |
eggs.csv 文件内容如下:
1 2 | www.biancheng.net www.biancheng.net www.biancheng.net www.biancheng.net www.biancheng.net |how are you| |hello world| |web site| www.biancheng.net |
其中,quotechar 是引用符,当一段话中出现分隔符的时候,用引用符将这句话括起来,以能排除歧义。
如果想同时写入多行数据,需要使用 writerrows() 方法,代码如下所示:
1 2 3 4 5 | import csv with open( 'aggs.csv' , 'w' , newline= '' ) as f: writer = csv.writer(f) # 注意传入数据的格式为列表元组格式 writer.writerows([( 'hello' , 'world' ), ( 'I' , 'love' , 'you' )]) |
aggs.csv文件内容:
1 2 | hello,world I,love,you |
2) csv.DictWriter()
当然也可使用 DictWriter 类以字典的形式读写数据,使用示例如下:
1 2 3 4 5 6 7 8 9 10 11 | import csv with open( 'names.csv' , 'w' , newline= '' ) as csvfile: #构建字段名称,也就是key fieldnames = [ 'first_name' , 'last_name' ] writer = csv.DictWriter(csvfile, fieldnames=fieldnames) # 写入字段名,当做表头 writer.writeheader() # 多行写入 writer.writerows([{ 'first_name' : 'Baked' , 'last_name' : 'Beans' },{ 'first_name' : 'Lovely' , 'last_name' : 'Spam' }]) # 单行写入 writer.writerow({ 'first_name' : 'Wonderful' , 'last_name' : 'Spam' }) |
name.csv 文件内容,如下所示:
1 2 3 4 | first_name,last_name Baked,Beans Lovely,Spam Wonderful,Spam |
3. CSV文件读取
1) csv,reader()
csv 模块中的 reader 类和 DictReader 类用于读取文件中的数据,其中 reader() 语法格式如下:
1 | csv.reader(csvfile, dialect= 'excel' , **fmtparams) |
应用示例如下:
1 2 3 4 5 | import csv with open( 'eggs.csv' , 'r' , newline= '' ) as csvfile: spamreader = csv.reader(csvfile, delimiter= ' ' , quotechar= '|' ) for row in spamreader: print( ', ' . join (row)) |
输出结果:
1 2 | www.biancheng.net, www.biancheng.net, www.biancheng.net, www.biancheng.net, www.biancheng.net, how are you hello world, web site, www.biancheng.net |
2) csv.DictReader()
应用示例如下:
1 2 3 4 5 | import csv with open( 'names.csv' , newline= '' ) as csvfile: reader = csv.DictReader(csvfile) for row in reader: print(row[ 'first_name' ], row[ 'last_name' ]) |
输出结果:
1 2 3 | Baked Beans Lovely Spam Wonderful Spam |
相关推荐文档:《CSV文件读写》
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南