基于Dataframe实现以下功能:
导入directory.csv
| import numpy as np |
| import pandas as pd |
| fdata=pd.read_csv('F:\\directory.csv') |
| dfx=pd.DataFrame(fdata) |
| starbucks=pd.DataFrame(fdata) |
显示数据集的基本信息
| print(fdata.head()) |
| print(fdata.info()) |
| print(fdata.describe()) |
统计缺失值并删除city为缺失值的记录
| dfx=pd.DataFrame(fdata) |
| print("统计缺失值") |
| print(dfx.isnull().sum()) |
| print("删除city为缺失值的记录") |
| dfx.dropna(subset=['City'],inplace=True) |
| print("统计缺失值") |
| print(dfx.isnull().sum()) |
统计星巴克旗下的品牌数
| print("星巴克旗下品牌有:\n",starbucks.Brand.value_counts()) |
| |
| coffee = starbucks[starbucks.Brand=='Starbucks'] |
全世界一共有多少家星巴克门店
| coffee = starbucks[starbucks.Brand=='Starbucks'] |
| print("全世界一共有多少家星巴克门店:",coffee.shape[0]) |
全世界一共多少个国家开设了星巴克门店
| df=starbucks.groupby(["Country"]).size() |
| print("全世界一共多少个国家开设了星巴克门店:",df.size) |
显示排名前10的国家
| df1=df.sort_values(ascending=False) |
| print("排名前10的国家",df1.head(10)) |
整体代码
| |
| |
| import pandas as pd |
| import numpy as np |
| from pandas import Series,DataFrame |
| |
| starbucks = pd.read_csv("directory.csv") |
| print(starbucks.head()) |
| starbucks.info() |
| |
| print(starbucks.isnull().sum()) |
| star = starbucks.dropna(how='any',subset=['City']) |
| print(star.isnull().sum()) |
| |
| |
| print("星巴克旗下品牌有:\n",starbucks.Brand.value_counts()) |
| |
| coffee = starbucks[starbucks.Brand=='Starbucks'] |
| |
| |
| print("-------------------------") |
| print(coffee.shape[0]) |
| |
| df = starbucks.groupby(["Country"]).size() |
| print("全世界一共多少个国家开设了星巴克门店:",df.size) |
| df1 = df.sort_values( ascending=False) |
| print("排名前10的国家:\n",df1.head(10)) |
| |
| |
本文作者:kingwzun
本文链接:https://www.cnblogs.com/kingwz/p/16201686.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
2022-04-05 最近公共祖先LCA 模板