Python读取常用的数据文件
1、CSV
- csv文件:指将数据列用逗号分隔的文件,文件的扩展名是.csv。另一种数据文件叫制表符数据文件,指数据列之间分隔符是制表符。
注:用excel表格打开csv文件格式如上图
# 导入csv库 import csv # 1、读取csv数据文件获得一个列表 csv_list = open(file="data/csv_data.csv", mode="r") reader_list = csv.reader(csv_list) # 遍历列表数据 for row in reader_list: print(row)
结果:
['id', 'name', 'age', 'addr']
['1', 'tom', '24', 'BeiJing']
['2', 'jack', '23', 'BeiJing']
['3', 'bob', '32', 'BeiJing']
['4', 'marry', '24', 'BeiJing']
['5', 'tony', '11', 'BeiJing']
['6', 'marthin', '53', 'BeiJing']
['7', 'jason', '22', 'ShangHai']
['8', 'keivn', '23', 'ShangHai']
['9', 'king', '42', 'ShangHai']
['10', 'fiona', '19', 'ShangHai']
2、JSON
- json文件:每一条记录都像python中的字典,数据都有键-值对,用冒号(:)分隔,数据条目之间用逗号(,)分隔,首尾用花括号({})包围的数据结构。
注:json格式文件数据结构如上图所示
# 导入json库 import json # 读取json文件获取json字符串对象 json_data = open(file="data/json_data.json", mode="r").read() print(type(json_data)) # <class 'str'> # 将json字符串转换json对象 json_obj = json.loads(json_data) print(type(json_obj)) # <class 'dict'> # 遍历文件 for item in json_obj['user']: print(item)
结果:
{'id': 10, 'name': 'Tom', 'age': 22, 'addr': 'BeiJing'}
{'id': 11, 'name': 'Jack', 'age': 25, 'addr': 'ShangHai'}
3、XML
- xml文件:使用标签和属性来保存数据。
注:xml格式文件数据结构如上图所示
# 导入xml相关的库 from xml.etree import ElementTree as ET # 解析xml文件获取对象 tree = ET.parse(source="data/xml_data.xml") # 获取根节点信息,通过根节点查找指定名称的子节点对象 root_ele = tree.getroot() user_ele = root_ele.find('user') # 获取遍历字节点的属性值 for i in user_ele: print(i.attrib['value'])
结果:
10
Tom
22
BeiJing