实验一 Pandas操作实验

一、实验要求

按要求完成题目，在实验报告中应有代码和运行截图以及心得体会

二、实验题目

三、实验代码与运行结果：

1 import pandas as pd

df=open(r'D:\数据分析\us-state.csv')

df=pd.read_csv(df,index_col='state',names=None)

df #读取群文件“数据分析实验一”中的”us-state.csv”，加载为dataframe，要求读取state列作为行索引

2 df[df['area'] > 100000]#选择出所有面积大于100000的州的数据

3 df.loc[['Alaska','Texas','California'],:] #获取Arkansas,Texas,California三个州的数据

4 df.iloc[5:10,:] #获取[5,10]行数据

5 df.sort_index() #将DataFrame中数据按照行索引升序排序

6 df.sort_values('area',ascending=False)#将DataFrame中数据按照州面积降序排序

7 df_obj=(df['area'].max()-df['area'].min())

df_obj #计算最大面积州与最小面积州的差值

8 df['area'].mean() #计算平均面积

9 df.drop('abbreviation',axis=1,inplace=True)

df #删除DataFrame中的州简写（abbreviation）那一列

10 df.iloc[8]='xxxxxxxx'

df #将Florida州的面积修改为你的学号

（截图请自己实现）

11 df.to_excel(r'D:\数据分析\你的名字.xlsx',index=True,columns=None)

#将修改后的DataFrame写入excel文件中，文件名为“你的名字.xlsx”，如“张三.xlsx”，excel文件中保留行索引，不保留列索引

（截图请自己实现）

posted on 2022-06-02 17:54 一路向北~~ 阅读(1152) 评论(0) 编辑收藏举报