随笔分类 -  Pandas

摘要:将 Excel 多列转多行, 两层循环, 下标取值, 类似指针在 二维数组的移动, 核心就是循环, 和索引 阅读全文
posted @ 2020-05-07 23:59 致于数据科学家的小陈 阅读(1538) 评论(0) 推荐(1) 编辑
摘要:时间序列 datetime 作为序列索引 阅读全文
posted @ 2019-12-15 22:29 致于数据科学家的小陈 阅读(1066) 评论(0) 推荐(0) 编辑
摘要:datetime 时间的定义, 计算, 字符串-时间 转换 阅读全文
posted @ 2019-12-13 22:25 致于数据科学家的小陈 阅读(1566) 评论(0) 推荐(0) 编辑
摘要:数据分析最重要的技巧, 没有之一. 我的分析工作都是用Excel和pandas 来整透视表, 如论深入了解, 还得Excel + 业务分析 阅读全文
posted @ 2019-12-12 21:55 致于数据科学家的小陈 阅读(713) 评论(0) 推荐(0) 编辑
摘要:数据的split-apply-聚合, 案例-缺失值-重采样-加权平均-线性回归 阅读全文
posted @ 2019-12-10 20:11 致于数据科学家的小陈 阅读(953) 评论(0) 推荐(0) 编辑
摘要:数据分析重点. 同维度下,对不同字段聚合 groupbby(key).agg({'字段1':'aggfunc1', '字段1':'aggfunc2''..} 阅读全文
posted @ 2019-12-07 17:50 致于数据科学家的小陈 阅读(1407) 评论(0) 推荐(0) 编辑
摘要:group by 过程, 数据分析中,绝对是最为重要的部分, 没有之一. 阅读全文
posted @ 2019-12-01 21:29 致于数据科学家的小陈 阅读(1860) 评论(0) 推荐(0) 编辑
摘要:索引重塑reshape 阅读全文
posted @ 2019-11-27 20:18 致于数据科学家的小陈 阅读(422) 评论(0) 推荐(0) 编辑
摘要:数据合并, 拼接 阅读全文
posted @ 2019-11-25 23:59 致于数据科学家的小陈 阅读(500) 评论(0) 推荐(0) 编辑
摘要:多层索引 阅读全文
posted @ 2019-11-25 00:27 致于数据科学家的小陈 阅读(1056) 评论(0) 推荐(0) 编辑
摘要:pandas 中, 关于字符串处理的常用api总结 阅读全文
posted @ 2019-11-23 23:30 致于数据科学家的小陈 阅读(2106) 评论(0) 推荐(0) 编辑
摘要:数据映射, 离散化, 异常值, 重采样, one-hot coding.... 阅读全文
posted @ 2019-11-21 22:13 致于数据科学家的小陈 阅读(1411) 评论(0) 推荐(0) 编辑
摘要:数据清洗-缺失值处理(drop, fill) 阅读全文
posted @ 2019-11-20 22:20 致于数据科学家的小陈 阅读(558) 评论(0) 推荐(0) 编辑
摘要:认识 jupyter地址: pandas objects are equipped(配备的) with a set of common mathematical and statistical methods. Most of these fall into the categrory of red 阅读全文
posted @ 2019-11-17 23:25 致于数据科学家的小陈 阅读(1658) 评论(0) 推荐(0) 编辑
摘要:Pandas will be a major tool of interest throughout(贯穿) much of the rest of the book. It contains data structures and manipulation tools designed to ma 阅读全文
posted @ 2019-11-15 20:35 致于数据科学家的小陈 阅读(489) 评论(0) 推荐(0) 编辑
摘要:之前弄数据库的时候, 测试excel导mysql, 中间用pandas 处理后再入库. 直接上代码, 此种有真意, 尽在不言中. 1 #!/usr/bin/env python 2 # coding: utf-8 3 # author: chenjie131@ke.com 4 5 ''' 6 应用场 阅读全文
posted @ 2019-11-07 14:16 致于数据科学家的小陈 阅读(4057) 评论(0) 推荐(0) 编辑
摘要:Pandas 数据筛选,去重结合group by 需求 今小伙伴有一个Excel表, 是部门里的小伙9月份打卡记录, 关键字段如下: 姓名 , 工号, 日期 , 打卡方式, 时间 , 详细位置, IP地址.... 脱敏数据: | 姓名 | 工号 | 日期 | 方式 | 时间 | ... | | : 阅读全文
posted @ 2019-10-11 21:31 致于数据科学家的小陈 阅读(3793) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示