随笔分类 - Spark Shell
摘要:不多说,直接上干货! 前言 打开spark的命令行后,发现输错字符了,但是无法退格或者删除,这是比较苦恼的问题。 这个问题,得看你是用Xshell,还是SecureCRT。 一般是出现在SecureCRT里。 Xshell里解决办法: 然后,将 替换成 也许,有些人的xshell不可行,则ctrl
阅读全文
摘要:不多说,直接上干货! 最近,开始,进一步学习spark的最新版本。由原来经常使用的spark-1.6.1,现在来使用spark-2.2.0-bin-hadoop2.6.tgz。 前期博客 Spark on YARN模式的安装(spark-1.6.1-bin-hadoop2.6.tgz + hadoo
阅读全文
摘要:不多说,直接上干货! REPL Read-Eval-Print-Loop,即交互式shell,以交互式方式来编程。 那么,什么是REPL呢,如下就是 Spark REPL (scala) (python) (其他) 这里不多说 Spark shell Spark的scala REPL,支持使用sca
阅读全文
摘要:不急,循序渐进,先打好基础 Spark shell的原理 首先,我们清晰定位找到这几个。 1、spark-shell 2、 spark-submit 3、spark-class 4、SparkSubmit.scala 5、SparkILoop.scala createSparkContext的源码
阅读全文
摘要:不多说,直接上干货! 获得垃圾链接数据集的命令如下: wget http://www-stat.stanford.edu/~tibs/ElemStatLearn/datasets/spam.data scala> val inFile = sc.textFile("./spam.data) 这行代码
阅读全文