第二章 Python数据导入
数据导入
数据存储的两个地方:
文件
- CSV、Excel、TXT(学习层面)
数据库(公司实战层面)
- Mysql、Access、SQL Server
导入CSV文件
CSV文件第一行是列名,第二行到最后一行是数据,列与列之间用逗号分隔的数据文件
使用read_csv函数导入CVS文件
read_csv函数用法
常用参数,路径:read_csv(file)
read_csv(file,encoding)如果使用中文,还要使用encoding 参数utf-8… ….但是,最好不要用中文,容易出现不可预知的错误
导入文本文件
文本文件与CSV文件类似,只不过文本文件更加自由,文本文件没有规定要有列名,列与列之间的分隔符也没有规定一定是逗号,甚至文本文件的后缀名都是可以随便起的。
使用read_table 函数导入文本文件
read_table函数语法:
- read_table(file,names=[列名1,列名2,… …],sep=” ”,encoding, … …)
参数 | 注释 |
---|---|
file | 文件路径 |
names | 列名,默认为文件中的第一行作为列名 |
sep | 分隔符,默认为空,表示默认导入为一列 |
encoding | 设置文件编码,在导入中文的时候需要设置为UTF-8 |
导入Excel文件
使用read_excel函数导入Excel文件
read_excel函数的语法
- read_excel(fileName,sheet name,names)
参数 | 注释 |
---|---|
fileName | 文件路径 |
sheetname | Sheet的名字 |
names | 列名,默认为文件中的第一行作为列名 |
特别注意:一定要提前下载xlrd包,Python才会读取 excel