随笔分类 - 数据处理
摘要:import numpy as npx= np.array([1,2]) y =np.array([3,4]) xi, yi = np.meshgrid(x,y) print('xi: \n',xi) print('yi: \n',yi) print('xi.ravel: \n',xi.ravel(
阅读全文
摘要:distinct on (),括号里面的内容是要去重的列,括号外面的内容是你要查询展示的列,两者没有关系,你可以根据某些列去重不必将他们查询出来,最后这个举一个例子就是: //我要查询name和age,根据name和sex去重: select distinct on (name,sex) name,
阅读全文
摘要:最开始容易想到使用聚合函数min(),但很快便发现问题:聚合函数只能保留组内的共同字段(即group by的字段)和应用了聚合函数的字段,其他的字段并没有保留。换言之,聚合函数反映的是组的特征,而不能筛选出组中具有这一特征的样本行。 此时应该用下列函数: row_number() over (par
阅读全文
摘要:import pandas as pd from dateutil.parser import parse #测试数据 test_dict = {0: {'startTime': 20190825131028, 'value': 1097}, 1: {'startTime': 20190825132
阅读全文
摘要:import pandas as pd import os #文件路径注意用\\ inputfilepath = 'C:\\Users\\Administrator\\AAA\\BBB\\' outputfilepath = 'C:\\Users\\Administrator\\AAA\\' df_
阅读全文