Centos6.8 安装spark-2.3.1 以及 scala-2.12.2
摘要:一、Spark概述 Spark 是一个用来实现快速而通用的集群计算的平台。 在速度方面,Spark 扩展了广泛使用的 MapReduce 计算模型,而且高效地支持更多计算模式,包括交互式查询和流处理。 在处理大规模数据集时,速度是非常重要的。速度快就意味着我们可以进行交互式的数据操作,否则我们每次操
阅读全文
概率论公式
摘要:记录个人觉得讲解比较清楚的公式 1、条件概率/全概率/贝叶斯公式 https://blog.csdn.net/qq_31073871/article/details/81077386 2、边缘概率/联合概率 https://blog.csdn.net/LMJ15009207299/article/d
阅读全文