Datawhale - Pandas(下)--task05 综合练习
问题都比较难,只做了一小部分,其实有三道题,要仔细读题,不会的题多读优秀作业吧。
第一题、端午节的淘宝粽子交易
(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。
import pandas as pd
import numpy as np
df = pd.read_csv(r'data\端午粽子数据.csv')
df_fhdz = df.dropna(axis=0,subset=['发货地址 '])
pd.to_numeric(df_fhdz[df_fhdz['发货地址 '].str.contains('杭州')][' 价格'],errors='coerce').mean().round(decimals=2)
#注意,这里的 errors='coerce'
(2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?
df = df[df.标题.str.contains('嘉兴')][(df.发货地址.str.contains('嘉兴'))==False]
(3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。
(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。
(5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共计 ×× 人付款,单价为 ××。
(6) 请将上一问中的结果恢复成原来的四列。