03 2017 档案

kill 掉所有正在运行的hadoop jobs
摘要:get list of job's process IDs JOB_LIST=$(hadoop job -list 2> /dev/null | grep job_ | awk '{print $1}') kill all jobs for JOB in $JOB_LIST do hadoop jo 阅读全文

posted @ 2017-03-24 09:49 chaplinthink 阅读(240) 评论(0) 推荐(0)

Spark2.1.0官方文档
摘要:Spark 概述 Apache Spark是一个快速和通用的集群计算系统。它提供Java,scala,Python、R语言的APIs,以及支持一般执行图形的优化引擎。 它还支持一组丰富的高级工具,包括用于SQL和结构化数据处理的Spark SQL,用于机器学习的MLlib,用于图形处理的GraphX 阅读全文

posted @ 2017-03-04 15:14 chaplinthink 阅读(229) 评论(0) 推荐(0)

导航