03 2017 档案
摘要:get list of job's process IDs JOB_LIST=(hadoopjob−list2>/dev/null|grepjob|awk′print$1′)killalljobsforJOBinJOB_LIST do hadoop jo
阅读全文
摘要:Spark 概述 Apache Spark是一个快速和通用的集群计算系统。它提供Java,scala,Python、R语言的APIs,以及支持一般执行图形的优化引擎。 它还支持一组丰富的高级工具,包括用于SQL和结构化数据处理的Spark SQL,用于机器学习的MLlib,用于图形处理的GraphX
阅读全文