2020年8月14日
摘要: 1.皮尔森相关系数(Pearson)评估两个连续变量之间的线性关系 -1 ≤ p ≤ 1p接近0代表无相关性p接近1或-1代表强相关性 代码: #相关系数显著性检验 import numpy as np import scipy.stats as stats import scipy x=np.ar 阅读全文
posted @ 2020-08-14 18:30 小小喽啰 阅读(6940) 评论(0) 推荐(0) 编辑
摘要: 前面已经有了一篇信用卡的文章,拓展不同方法 前面的处理方式都一样,主要不同的是从缺失值开始的: #导入模块 import pandas as pd import numpy as np from scipy import stats import seaborn as sns import matp 阅读全文
posted @ 2020-08-14 10:13 小小喽啰 阅读(1638) 评论(0) 推荐(0) 编辑
摘要: df.as_matrix()可将dataframe数据转换成数组,和df.values 用法一致,但是现在一般使用values ,二者返回的都是数组 #原始DataFrame import pandas as pd import numpy as np df=pd.DataFrame(np.aran 阅读全文
posted @ 2020-08-14 10:08 小小喽啰 阅读(2317) 评论(0) 推荐(0) 编辑