pandas处理数据
读文件
pd.read_csv('path/to/file.txt',header=0,names='ab',index=0)
names Columns这个可以不写,制定索引列是第一列,这样就没有序号
写文件
np.tofile("d:/python/np.txt")
dataframe
类似于二维列表
充分利用map函数
df.a=df.a.map(function)
修改一列的值
筛选列
new_dataframe = df[df.a!='']
这种办法可以筛选得到新的df
自动迭代
处理
def getPhoneNumFromFile(fobj):
regex = re.compile(r'1\d{10}', re.IGNORECASE)
phonenums = re.findall(regex, fobj)
#print phonenums
if len(phonenums)==1:
return phonenums[0]
else:
return ''
不要浅尝辄止要认真深入