随笔分类 -  数据处理

摘要:import numpy as npx= np.array([1,2]) y =np.array([3,4]) xi, yi = np.meshgrid(x,y) print('xi: \n',xi) print('yi: \n',yi) print('xi.ravel: \n',xi.ravel( 阅读全文
posted @ 2020-03-08 14:26 levylaw 阅读(578) 评论(0) 推荐(0) 编辑
摘要:distinct on (),括号里面的内容是要去重的列,括号外面的内容是你要查询展示的列,两者没有关系,你可以根据某些列去重不必将他们查询出来,最后这个举一个例子就是: //我要查询name和age,根据name和sex去重: select distinct on (name,sex) name, 阅读全文
posted @ 2020-03-06 10:35 levylaw 阅读(860) 评论(0) 推荐(0) 编辑
摘要:最开始容易想到使用聚合函数min(),但很快便发现问题:聚合函数只能保留组内的共同字段(即group by的字段)和应用了聚合函数的字段,其他的字段并没有保留。换言之,聚合函数反映的是组的特征,而不能筛选出组中具有这一特征的样本行。 此时应该用下列函数: row_number() over (par 阅读全文
posted @ 2020-02-27 15:52 levylaw 阅读(1137) 评论(0) 推荐(0) 编辑
摘要:import pandas as pd from dateutil.parser import parse #测试数据 test_dict = {0: {'startTime': 20190825131028, 'value': 1097}, 1: {'startTime': 20190825132 阅读全文
posted @ 2020-02-17 10:30 levylaw 阅读(575) 评论(0) 推荐(0) 编辑
摘要:import pandas as pd import os #文件路径注意用\\ inputfilepath = 'C:\\Users\\Administrator\\AAA\\BBB\\' outputfilepath = 'C:\\Users\\Administrator\\AAA\\' df_ 阅读全文
posted @ 2020-02-16 12:19 levylaw 阅读(1331) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示