Datawhale - Pandas(下)--task05 综合练习

问题都比较难,只做了一小部分,其实有三道题,要仔细读题,不会的题多读优秀作业吧。

第一题、端午节的淘宝粽子交易

(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。

import pandas as pd
import numpy as np
df = pd.read_csv(r'data\端午粽子数据.csv')
df_fhdz = df.dropna(axis=0,subset=['发货地址 '])

pd.to_numeric(df_fhdz[df_fhdz['发货地址 '].str.contains('杭州')][' 价格'],errors='coerce').mean().round(decimals=2)
#注意,这里的
errors='coerce'

(2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?


 df = df[df.标题.str.contains('嘉兴')][(df.发货地址.str.contains('嘉兴'))==False]

 

(3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。

 

(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。

(5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共计 ×× 人付款,单价为 ××。

(6) 请将上一问中的结果恢复成原来的四列。

posted @ 2020-07-01 21:55  haiyanli  阅读(109)  评论(0编辑  收藏  举报