08 2019 档案

摘要:ApacheFlink起源于Stratosphere项目,Stratosphere是在2010~2014年由3所地处柏林的大学和欧洲的一些其他的大学共同进行的研究项目,2014年4月Stratosphere的代码被复制并捐赠给了Apache软件基金会,参加这个孵化项目的初始成员是Stratosphe 阅读全文
posted @ 2019-08-20 09:23 HandsomeEric 阅读(1928) 评论(0) 推荐(0)
摘要:1. 线性回归 什么是回归? 从大量的函数结果和自变量反推回函数表达式的过程就是回归。线性回归是利用数理统计中回归分析来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 一元线性回归: 只包括一个自变量()和一个因变量(),且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归 阅读全文
posted @ 2019-08-06 21:40 HandsomeEric 阅读(3186) 评论(0) 推荐(0)
摘要:1. 数据本地化的级别: ① PROCESS_LOCAL task要计算的数据在本进程(Executor)的内存中。 ② NODE_LOCAL a) task所计算的数据在本节点所在的磁盘上。 b) task所计算的数据在本节点其他Executor进程的内存中。 ③ NO_PREF task所计算的 阅读全文
posted @ 2019-08-05 09:51 HandsomeEric 阅读(1697) 评论(0) 推荐(0)
摘要:① 搭建Spark集群的时候要给Spark集群足够的资源(core,memory) 在spark安装包的conf下spark-env.sh SPARK_WORKER_CORES --worker节点的可用核数 SPARK_WORKER_MEMORY SPARK_WORKER_INSTANCE 在提交 阅读全文
posted @ 2019-08-02 15:31 HandsomeEric 阅读(2447) 评论(0) 推荐(0)