随笔分类 - Pandas
摘要:将 Excel 多列转多行, 两层循环, 下标取值, 类似指针在 二维数组的移动, 核心就是循环, 和索引
阅读全文
摘要:时间序列 datetime 作为序列索引
阅读全文
摘要:datetime 时间的定义, 计算, 字符串-时间 转换
阅读全文
摘要:数据分析最重要的技巧, 没有之一. 我的分析工作都是用Excel和pandas 来整透视表, 如论深入了解, 还得Excel + 业务分析
阅读全文
摘要:数据的split-apply-聚合, 案例-缺失值-重采样-加权平均-线性回归
阅读全文
摘要:数据分析重点. 同维度下,对不同字段聚合 groupbby(key).agg({'字段1':'aggfunc1', '字段1':'aggfunc2''..}
阅读全文
摘要:group by 过程, 数据分析中,绝对是最为重要的部分, 没有之一.
阅读全文
摘要:pandas 中, 关于字符串处理的常用api总结
阅读全文
摘要:数据映射, 离散化, 异常值, 重采样, one-hot coding....
阅读全文
摘要:数据清洗-缺失值处理(drop, fill)
阅读全文
摘要:认识 jupyter地址: pandas objects are equipped(配备的) with a set of common mathematical and statistical methods. Most of these fall into the categrory of red
阅读全文
摘要:Pandas will be a major tool of interest throughout(贯穿) much of the rest of the book. It contains data structures and manipulation tools designed to ma
阅读全文
摘要:之前弄数据库的时候, 测试excel导mysql, 中间用pandas 处理后再入库. 直接上代码, 此种有真意, 尽在不言中. 1 #!/usr/bin/env python 2 # coding: utf-8 3 # author: chenjie131@ke.com 4 5 ''' 6 应用场
阅读全文
摘要:Pandas 数据筛选,去重结合group by 需求 今小伙伴有一个Excel表, 是部门里的小伙9月份打卡记录, 关键字段如下: 姓名 , 工号, 日期 , 打卡方式, 时间 , 详细位置, IP地址.... 脱敏数据: | 姓名 | 工号 | 日期 | 方式 | 时间 | ... | | :
阅读全文