【pandas实战】数据分类整理

# 原始需求:
# 我想把这个文件按车牌 id 分成若干小文件(小文件是一个车一天的出行)
# 我想提取它停车时间最长的点(将停车时长也计算出来)汇总在一个文件里面

个人理解

# 需求解读:
# 1、按照2列分组,找出3列最大值,存为一个文件
# 2、按照2列分组,每组数据存为一个文件

分析过程

 

 客户给的数据(大小340.3M)存在大量乱码,其次没有列名,应该是加密过

根据需求统计最大值

 

 id分组统计

 

 

输出文件

 

 后面只需要循环上面两步,由于文件比较多,大概6404个,不再展开

 

posted @ 2020-06-04 17:04  HuaBro  阅读(379)  评论(0编辑  收藏  举报