摘要: drop_duplicates有两种用法 1.完全除去重复的行数据,不需要定义任何参数 2.去除重复的几列行数据 以上是drop_duplicates的参数含义 subset:指定重复数据所在列 keep:(1)first:去除重复列后第一次出现的行数据;(2)last:去除重复列后最后一次出现的行 阅读全文
posted @ 2021-05-09 11:34 alian_c 阅读(3517) 评论(0) 推荐(0) 编辑
摘要: 1.查看数据缺失值数量 df=pd.read_csv(r'') print(df.isnull().sum().sort_values()) 2.条件筛选替换新值 df.loc[条件1,'替换列']=替换值 df[替换列]=df[替换列].replace(旧值,新值) 3.删除缺失值 df.fill 阅读全文
posted @ 2021-05-05 16:18 alian_c 阅读(71) 评论(0) 推荐(0) 编辑
摘要: 一、项目背景及目的 2019年12月,我国出现了新型冠状病毒引发的多起病例,全国逐渐开启疫情防疫监控,严重地区甚至实施封闭管理。2月是疫情的高发期,各地区的人员流向、时间分布和规模化是本项目的主要分析目标,目的是分析人员流动规模的对比变化。 二、分析维度 根据现有的数据和分析方法,本项目分为三个维度 阅读全文
posted @ 2020-03-10 09:23 alian_c 阅读(2465) 评论(0) 推荐(0) 编辑
摘要: 一、项目目的及数据来源 该项目基于现代电商行业 以淘宝作为分析标的,多维度分析用户行为。数据来源于https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1。 二、分析维度 基于现有的数据以及分析方法,分为四个维度进行分析: 1. 阅读全文
posted @ 2020-03-05 10:22 alian_c 阅读(3615) 评论(0) 推荐(0) 编辑