随笔档案「2017年3月」 - chaplinthink

03 2017 档案

kill 掉所有正在运行的hadoop jobs

摘要：get list of job's process IDs JOB_LIST=$(hadoop job -list 2> /dev/null | grep job_ | awk '{print $1}') kill all jobs for JOB in $JOB_LIST do hadoop jo 阅读全文

posted @ 2017-03-24 09:49 chaplinthink 阅读(240) 评论(0) 推荐(0)

Spark2.1.0官方文档

摘要：Spark 概述 Apache Spark是一个快速和通用的集群计算系统。它提供Java，scala,Python、R语言的APIs，以及支持一般执行图形的优化引擎。它还支持一组丰富的高级工具，包括用于SQL和结构化数据处理的Spark SQL，用于机器学习的MLlib，用于图形处理的GraphX 阅读全文

posted @ 2017-03-04 15:14 chaplinthink 阅读(229) 评论(0) 推荐(0)

chaplinthink

03 2017 档案

kill 掉所有正在运行的hadoop jobs

Spark2.1.0官方文档

导航