第八节 pandas读取和保存文件
import pandas as pd import sqlalchemy import create_engine # 读取 pd.options.display.max_rows = 10#设置显示行数 df1 = pd.read_csv(r'E:\anacondatest\PythonData\高校信息.csv',encoding='gbk') print(df1) # read_table更通用的文本文件提取命令,默认tab键分割,sep参数必须指明分隔符 df2 = pd.read_table(r'E:\anacondatest\PythonData\高校信息.csv',sep=',',encoding='gbk') print(df2) # 读入Excel,sheet_name指明要读取sheet的名字 df4=pd.read_excel(r'E:\anacondatest\PythonData\儿童生长研究.xlsx',sheet_name='sheet1') print(df4) # 读入数据库数据,需要安装程序包,SQLALchemy engine(http://docs.sqlalchemy.org/en/latest/index.html) conndf = pd.read_csv("c://conn.txt", header=None) connstr = conndf.iloc[0, 0] eng = create_engine("mysql + pymsql://" + connstr + "?charset=utf8") # pd.read_sql(sql='', con=eng, index_col=None, columns=None) # sql需要执行的SQL语句,index_col指定索引列,columns当提供表名称时,需要读入的列,列表形式提供 tb1 = pd.read_sql('select * from table_name', con=eng) # 保存 # 保存成CSV格式 df1.to_csv(r'E:\anacondatest\PythonData\aaaaa.TXT',columns=['名次','总分'],header=['名次1','总分1'],index=False,) # 保存成Excel格式 df1.to_excel(r'E:\anacondatest\PythonData\aa.xlsx',sheet_name='data',index=False)#需要安装'openpyxl'库 # 保存进数据库,if_exists如果表已存在fail放弃保存,replace替换原表,append在原表最后插入新数据,index是否导出索引 df1.to_sql(name='table_name', con=eng, if_exists='fail', index=True)