会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Stitch
博客园
首页
新随笔
联系
管理
订阅
2020年7月2日
pandas、spark计算相关性系数速度对比
摘要: pandas、spark计算相关性系数速度对比 相关性计算有三种算法:pearson、spearman,kenall。 在pandas库中,对一个Dataframe,可以直接计算这三个算法的相关系数correlation,方法为:data.corr() 底层是依赖scipy库的算法。 为了提升计算速
阅读全文
posted @ 2020-07-02 15:55 MyStitch
阅读(2409)
评论(0)
推荐(0)
编辑
公告