数据处理 - 随笔分类 - levylaw

numpy中使用meshgrid创建网格坐标的方法

摘要：import numpy as npx= np.array([1,2]) y =np.array([3,4]) xi, yi = np.meshgrid(x,y) print('xi: \n',xi) print('yi: \n',yi) print('xi.ravel: \n',xi.ravel( 阅读全文

posted @ 2020-03-08 14:26 levylaw 阅读(600) 评论(0) 推荐(0)

postgresql中distinct on ()的用法

摘要：distinct on ()，括号里面的内容是要去重的列，括号外面的内容是你要查询展示的列，两者没有关系，你可以根据某些列去重不必将他们查询出来，最后这个举一个例子就是： //我要查询name和age，根据name和sex去重： select distinct on (name,sex) name, 阅读全文

posted @ 2020-03-06 10:35 levylaw 阅读(903) 评论(0) 推荐(0)

postgresql选出各分组内某字段值最小的记录

摘要：最开始容易想到使用聚合函数min()，但很快便发现问题：聚合函数只能保留组内的共同字段（即group by的字段）和应用了聚合函数的字段，其他的字段并没有保留。换言之，聚合函数反映的是组的特征，而不能筛选出组中具有这一特征的样本行。此时应该用下列函数： row_number() over (par 阅读全文

posted @ 2020-02-27 15:52 levylaw 阅读(1193) 评论(0) 推荐(0)

将表某列时间信息转为datetime格式

摘要：import pandas as pd from dateutil.parser import parse #测试数据 test_dict = {0: {'startTime': 20190825131028, 'value': 1097}, 1: {'startTime': 20190825132 阅读全文

posted @ 2020-02-17 10:30 levylaw 阅读(651) 评论(0) 推荐(0)

pandas合并多个csv文件

摘要：import pandas as pd import os #文件路径注意用\\ inputfilepath = 'C:\\Users\\Administrator\\AAA\\BBB\\' outputfilepath = 'C:\\Users\\Administrator\\AAA\\' df_ 阅读全文

posted @ 2020-02-16 12:19 levylaw 阅读(1372) 评论(0) 推荐(0)

levylaw

随笔分类 - 数据处理

公告