摘要:
Z检验 statsmodels.stats.weightstats.ztest() import statsmodels.stats.weightstats as sw 参数详解: x1:待检验数据集; x2:待检验数据集;默认为None,双样本检验时不为None; value:在一个样本中,val 阅读全文
摘要:
原文链接:https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html 一文看懂pandas的透视表pivot_table 一、概述 1.1 什么是透视表? 透视表是一种可以对数据动态排布并且分类汇总的表格格式。或许大多数人都在Excel使用过数据透视表 阅读全文
摘要:
df.duplicated() 参数详解: subset:检测重复的数据范围。默认为数据集的所有列,可指定特定数据列; keep: 标记哪个重复数据,默认为‘first’。1.‘first’:标记重复数据第一次出现为True;‘last’:标记重复数据最后一次出现为True;False:标记所有重复 阅读全文
摘要:
概述 df.info():主要介绍数据集各列的数据类型,是否为空值,内存占用情况; df.describe(): 主要介绍数据集各列的数据统计情况(最大值、最小值、标准偏差、分位数等等)。 df.info() #导入数据 data1=pd.read_csv(r'E:\data_analysis\AB 阅读全文
摘要:
表与表之间的数据运算 #构建数据集df1=pd.DataFrame(np.random.random(32).reshape(8,4),columns=list('ABCD')) df2=pd.DataFrame(np.arange(1,33).reshape(8,4),columns=list(' 阅读全文
摘要:
concat函数基本介绍: 功能:基于同一轴将多个数据集合并 pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,keys=None, levels=None, names=None, verify_int 阅读全文