Pandas的使用
下载
pip install pandas
pandas数据读取
数据类型 说明 pandas读取方法
csv、tev、txt 用逗号分隔、tab分隔的纯文字文件 pd.read_csv
excel 微软xls或者xlsx文件 pd.read_excel
mysql 关系型数据库 pd.read_sql
导入
import pandas as pd
1、读取纯文本文件
1.1读取csv,使用默认的标题hang,逗号分隔
fpath="文件路径.csv"
#使用pd.read_csv读取数据
#使用read_csv读取数据
ratings=pd.read_csv(fpath,encoding='ANSI')
#查看前几行数据默认5行
print(ratings.head())
#纯文本
pvuv=pd.read_csv(
fpath,#地址
sep=r"\t",#分隔符
header=None,
names=['name','age']#可以自己定义标题行
)
2.读取excel文件
下载
pip install xlrd
#读取excel文件
fpath=r"文件地址"
xls=pd.read_excel(fpath)
print(xls)
3.读取mysql
#读取MySQL
import pymysql
conn=pymysql.connect(
host='127.0.0.1',
user='root',
password='****',
charset='utf8',
database='db1'
)
mysql_qw=pd.read_sql('select * from app01_book',con=conn)
print(mysql_qw)
pandas数据结构
DataFrame:二维数据,这个表格,多行多列
Series:一维数据,一行一列
创建一个一维数据
#创建一个一维数组
sl=pd.Series([1,'a',4.3,2])
#左侧为索引,右侧为数据
print(sl)
#获取索引
print(sl.index)
#获取数据
print(sl.values)
#定义一维数据的索引列
s2=pd.Series([1,'a',4.3,2],index=['a','d','f','e'])
print(s2)
print(s2.index)
#使用字典创建SEries
data={'ojsd':322,'TER':3214,'pid':333,'asd':'上单'}
s3=pd.Series(data)
print(s3)
#取值
print(s3['asd'])#上单
print(s3[['pid','asd']])
#pid 333
# asd 上单
# dtype: object
DataFrame
data={
'state':['q','w','e','r'],
'year':[222,333,444,555],
'pop':[1.2,2.2,2.1,33]
}
datas=pd.DataFrame(data)
print(datas)
#类型
print(datas.dtypes)
#行的索引,列的索引
print(datas.columns)
print(datas.index)
#查询一列,类型
print(datas['year'],datas.dtypes)
print(datas[['year','pop']],datas.dtypes)
查询一行,类型为Series
print(datas.loc[1])
print(type(datas.loc[1]))#Series
查询多行
#查询多行
print(datas.loc[0:2])
print(type(datas.loc[0:2]))#<class 'pandas.core.frame.DataFrame'>