Pandas - 随笔分类 - C羽言

Pandas使用时间索引筛选时报错 AssertionError: <class 'numpy.ndarray'>

摘要：I came across the similar problem, my solution was: make sure the index is type of 'DatetimeIndex', I do this: df.index = pd.to_datetime(df.index) sor 阅读全文

posted @ 2023-03-02 22:11 C羽言阅读(43) 评论(0) 推荐(0) 编辑

DataFrame进行for循环

摘要：#方案一 for index,row in df.iterrows(): a=row['A'] b=row['cond'] #86 ms ± 5.51 ms per loop (mean ± std. dev. of 7 runs, 10 loops each) #方案二 for i in rang 阅读全文

posted @ 2023-03-02 10:39 C羽言阅读(177) 评论(0) 推荐(0) 编辑

DataFrame添加删除列行等基础操作

摘要：#第1列添加C列 df.insert(0, 'C', 1) 阅读全文

posted @ 2023-03-01 17:39 C羽言阅读(34) 评论(0) 推荐(0) 编辑

pandas删除最后一行

摘要：方法1 df=df[:-1] 方法2 # To remove last n rows df.head(-n) # To remove first n rows df.tail(-n) 方法3 df.drop(df.index[-1], inplace=True) 总结：在 1000 行的 Data 阅读全文

posted @ 2023-02-22 15:53 C羽言阅读(245) 评论(0) 推荐(0) 编辑

Pandas显示所有行

摘要：当你试图打印一个超过预定义行和列数的大数据框架时，结果将被截断。请看下面的例子，以便更好地理解。 # importing numpy library import pandas as pd # importing diabetes dataset from sklearn from sklearn. 阅读全文

posted @ 2023-02-21 12:46 C羽言阅读(1453) 评论(0) 推荐(0) 编辑

pandas中DataFrame重置索引的几种方法

摘要：在pandas中，经常对数据进行处理而导致数据索引顺序混乱，从而影响数据读取、插入等。 import pandas as pd import numpy as np df = pd.DataFrame(np.arange(20).reshape((5, 4)),columns=['a', 'b', 阅读全文

posted @ 2023-02-21 12:41 C羽言阅读(1314) 评论(0) 推荐(0) 编辑

pandas 中创建求和行和求和列

摘要：import pandas as pd df = pd.DataFrame( {"Undergraduate": {"Straight A's": 240, "Not": 3_760},"Graduate": {"Straight A's": 60, "Not": 440},}) #Total su 阅读全文

posted @ 2023-02-21 12:37 C羽言阅读(37) 评论(0) 推荐(0) 编辑

分段取得最小值

摘要：input import pandas as pd import numpy as np A=[17,18,21,15,18,19,22,16,30,50,] cond=[False,True,False,False,False,True,False,False,True,False] df=pd. 阅读全文

posted @ 2022-07-14 22:33 C羽言阅读(26) 评论(0) 推荐(0) 编辑

将列值作为索引来取值

摘要：input import pandas as pd import numpy as np d={'trade_date':['2021-08-10','2021-08-11','2021-08-12','2021-08-13','2021-08-14','2021-08-15','2021-08-1 阅读全文

posted @ 2022-07-11 09:13 C羽言阅读(39) 评论(0) 推荐(0) 编辑

pandas :按另一列的值移动一列

摘要：我们可以使用 numba解决方案: from numba import jit @jit def dyn_shift(s, step): assert len(s) == len(step), "[s] and [step] should have the same length" assert i 阅读全文

posted @ 2022-07-07 19:25 C羽言阅读(52) 评论(0) 推荐(0) 编辑

A列与B列上一行的值比较 B列也要与A列上一行的值比较

摘要：这样看的话，就是交叉比较，每一个值都只和另一列的上一行值有关，那么我们完全可以将a列和b列拆分开，按照这种交叉形式重新组合出c列和d列，也就是将a列和b列的每个元素交叉互换一下。 a = [0, 1, 2, 3] b = [a, b, c, d] c = [0, b, 2, d] d = [a, 1 阅读全文

posted @ 2022-07-02 09:32 C羽言阅读(51) 评论(0) 推荐(0) 编辑

df.where的用法总结

摘要：1、pd.Series( ).where( cond ) 可以过滤不满足cond的值并赋予NaN空值 s = pd.Series(range(5)) s.where(s > 0) 0 NaN 1 1.0 2 2.0 3 3.0 4 4.0 2、pd.Series( ).mask(cond) 使用时，阅读全文

posted @ 2022-07-01 14:23 C羽言阅读(600) 评论(0) 推荐(0) 编辑

pandas获得两列或更多列的行最小值

摘要：如果要获取mininum两列或更多列的行，请使用pandas.DataFrame.min并指定axis=1。 data['min_c_h'] = data[['flow_h','flow_c']].min(axis=1) # display(data) flow_c flow_d flow_h mi 阅读全文

posted @ 2022-07-01 13:55 C羽言阅读(609) 评论(0) 推荐(0) 编辑

DataFrame上次符合条件的行索引

摘要：大佬1 import pandas as pd import numpy as np df = pd.DataFrame(np.random.random((10,3)), columns = ['A', 'B', 'C']) def _get_last_index(arr): res = arr[ 阅读全文

posted @ 2022-06-29 19:15 C羽言阅读(86) 评论(0) 推荐(0) 编辑

DataFrame每一行与上一行对比后赋值然后下一行再跟赋值后的上一行对比

摘要：import pandas as pd df = pd.DataFrame(np.random.random((10, 3)), columns=['A', 'B', 'C']) def _update_min(arr): mini = arr.min() # get minimum value d 阅读全文

posted @ 2022-06-27 15:06 C羽言阅读(241) 评论(0) 推荐(0) 编辑

DataFrame计算上次符合条件到现在的位置

摘要：想实现类似通达信BARSLAST 上次条件成立到现在的位置得到大佬帮助，帮我写了以下代码 import pandas as pd import numpy as np df = pd.DataFrame(np.random.random((10,4)), columns = ['A', 'B', 阅读全文

posted @ 2022-06-26 08:53 C羽言阅读(101) 评论(0) 推荐(0) 编辑

DataFrame查看列的数据类型以及数据类型转换

摘要：Q：合并列的过程中发现了合并失败的情况，原因是列的数据类型不一样 1、假如读了一个csv表，读成了DataFrame 2、查看列的数据类型 df.dtypes#查看所有列的数据类型 df['A'].dtypes#查看列名为"A"那列的数据类型 3、把列名为"A"的数据类型转换成int类型 df['A 阅读全文

posted @ 2022-06-25 09:07 C羽言阅读(440) 评论(0) 推荐(0) 编辑

pandas计算过去N行中出现的次数

摘要：我需要帮助查找值在过去的“n”行中出现的次数。我知道，但我想不出该怎么办。下面的“X”标记给定的值并计算n=3的结果，因此每第3行，它就会计算“1”在过去3行中出现的次数。 X results (n=3) 1 1 1 2 1 3 0 2 0 1 0 0 0 0 1 1 1 2 解决方案：试试rol 阅读全文

posted @ 2022-06-25 09:05 C羽言阅读(72) 评论(0) 推荐(0) 编辑

pd_to_datetime时间戳转换到本地时间

摘要：直接用pd_to_datetime显示的时间与本地时间差8小时方法一继续使用pd.to_datetime，使用orgin字段控制一下起始时间，暂没有找到优雅的直接控制时区的办法 data["date_orgin"] = pd.to_datetime(data["timestamp"],unit 阅读全文

posted @ 2022-06-22 14:11 C羽言阅读(794) 评论(0) 推荐(0) 编辑

DataFrame转换为字典

摘要：该to_dict()方法将列名设置为字典键将“ID”列设置为索引然后转置DataFrame是实现此目的的一种方法。to_dict()还接受一个’orient’参数，您需要该参数才能输出每列的值列表。否则，{index: value}将为每列返回表单的字典。可以使用以下行完成这些步骤： >>> df 阅读全文

posted @ 2022-06-20 09:24 C羽言阅读(2779) 评论(0) 推荐(0) 编辑

C羽言

随笔分类 - Pandas

搜索

随笔分类