摘要:
原文:http://www.linuxidc.com/Linux/2016-09/134941.htm 1、卸载系统自带的jdk 1.1、查看该操作系统上是否已经安装了jdk [root@xhTest-1 ~]# rpm -qa | grep jdk 1.2、删除系统自带的jdk [root@xhT 阅读全文
摘要:
一、什么是Spark(火花)? 是一种快速、通用处理大数据分析的框架引擎。 二、Spark的四大特性 1.快速:Spark内存上采用DAG(有向无环图)执行引擎非循环数据流和内存计算支持。 内存上比MapReduce快速100倍,磁盘上快10倍左右 MapReduce存储读取在磁盘上,大数据批量处理 阅读全文