第二章 Python数据导入

数据导入

数据存储的两个地方:

  • 文件

    • CSV、Excel、TXT(学习层面)
  • 数据库(公司实战层面)

    • Mysql、Access、SQL Server

导入CSV文件

CSV文件第一行是列名,第二行到最后一行是数据,列与列之间用逗号分隔的数据文件

  • 使用read_csv函数导入CVS文件

  • read_csv函数用法

    • 常用参数,路径:read_csv(file)

    • read_csv(file,encoding)如果使用中文,还要使用encoding 参数utf-8… ….但是,最好不要用中文,容易出现不可预知的错误

@数据分析-jacky

导入文本文件

文本文件与CSV文件类似,只不过文本文件更加自由,文本文件没有规定要有列名,列与列之间的分隔符也没有规定一定是逗号,甚至文本文件的后缀名都是可以随便起的。

  • 使用read_table 函数导入文本文件

  • read_table函数语法:

    • read_table(file,names=[列名1,列名2,… …],sep=” ”,encoding, … …)
参数 注释
file 文件路径
names 列名,默认为文件中的第一行作为列名
sep 分隔符,默认为空,表示默认导入为一列
encoding 设置文件编码,在导入中文的时候需要设置为UTF-8

导入Excel文件

  • 使用read_excel函数导入Excel文件

  • read_excel函数的语法

    • read_excel(fileName,sheet name,names)
参数 注释
fileName 文件路径
sheetname Sheet的名字
names 列名,默认为文件中的第一行作为列名

特别注意:一定要提前下载xlrd包,Python才会读取 excel

@数据分析-jacky

@数据分析-jacky
这里写图片描述

posted on 2017-08-09 10:15  朱元禄  阅读(309)  评论(0编辑  收藏  举报