pandas 数据预处理实例演示
泰坦尼克-全员存活经典分析案例
●查看数据
●找出年龄未知的人的个数
●求年龄均值 ---.mean()函数亦可
●用循环的方法,通过船票等级定位船票价格从而得到三种等级船票的均值
●分析船舱等级和是否存活的关系,发现船舱等级越高存活概率越大
●分析船舱等级和所住人员年龄的关系,发现年龄越大住的船舱等级越高,不指定aggfunc,默认为均值
●分析三个上岸地点的花费总数和生存指标
●去除空值
●找指定值
●对年龄进行排序
●函数的定义以及调用,查看每列的空值个数
●数据替换
●对年龄离散化,并求两个年龄段的获救概率
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步