摘要: 三 数据清洗 3.1 去重 data.duplicated() #标记出哪些是重复的(true) data.drop_duplicates() #直接将重复删除,默认保留第一条 3.2 处理缺失数据 isnull方法用于判断数据是否为空数据; fillna方法用于填补缺失数据; dropna方法用于 阅读全文
posted @ 2020-12-06 18:05 西西里啊 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 二 DataFrame的性质 2.1 索引、切片 # 数据集 data = { 'state':['Ohio','Ohio','Ohio','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2. 阅读全文
posted @ 2020-12-06 18:04 西西里啊 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 1. 学习Python的DataFrame模块性质,以及如何运用DataFrame进行数据清洗 2. 600行 3. 8h 二 DataFrame的性质 2.1 索引、切片 # 数据集 data = { 'state':['Ohio','Ohio','Ohio','Nevada','Nevada'] 阅读全文
posted @ 2020-12-06 18:03 西西里啊 阅读(37) 评论(0) 推荐(0) 编辑