python使用小记2-csv文件处理
当输入的文件是csv文件时,我们有一下几种打开方式:
1、
import csv #r表示读 datapath=csv.reader(open('data.csv','r')) #如果文件里有中文,就用下面的代码 datapath=csv.reader(open('data.csv',encoding='utf-8'))
2、
import pandas as pd data=pd.read_csv('data.csv') #如果中文,见下面代码 data=pd.read_csv('data.csv',encoding='gb2312') data.head#预览一部分数据
3、
#csv文件整体读取为一个数组或者矩阵 import numpy my_matrix = numpy.loadtxt(open("c:\\1.csv","rb"),delimiter=",",skiprows=0) #将数组或者矩阵存储为csv文件可以使用如下代码实现 numpy.savetxt('new.csv', my_matrix, delimiter = ',')
4、将csv的文件转为数组类型
import numpy as np from numpy import genfromtxt #可以将非array格式的list转化为array datapath = "data.csv" deliverData = genfromtxt(datapath,delimiter=",") #将csv文件转化为numpy.array格式 #这样就可以进行数组数据的切分选择 X_train= deliverData[:3000,6:46] Y_train= deliverData[:3000,-1]
注意:使用genfromtxt时,需要保证文件里没有中文,这应该怎么处理?
invictus maneo!