随笔 - 597  文章 - 4  评论 - 445  阅读 - 424万

随笔分类 -  Spark+Storm

error: not found: value sqlContext/import sqlContext.implicits._/error: not found: value sqlContext /import sqlContext.sql/Caused by: java.net.ConnectException: Connection refused
摘要:1、今天启动启动spark的spark-shell命令的时候报下面的错误,百度了很多,也没解决问题,最后想着是不是没有启动hadoop集群的问题 ,可是之前启动spark-shell命令是不用启动hadoop集群也是可以启动起来的。今天突然报错了。 2、然后启动hadoop集群以后出现如下所示: 阅读全文
posted @ 2018-05-24 11:10 别先生 阅读(1593) 评论(0) 推荐(0) 编辑
Spark的Streaming + Flume进行数据采集(flume主动推送或者Spark Stream主动拉取)
摘要:1、针对国外的开源技术,还是学会看国外的英文说明来的直接,迅速,这里简单贴一下如何看: 2、进入到flume的conf目录,创建一个flume-spark-push.sh的文件: [hadoop@slaver1 conf]$ vim flume-spark-push.sh 配置一下这个文件,flum 阅读全文
posted @ 2018-04-24 10:53 别先生 阅读(2611) 评论(0) 推荐(0) 编辑
Spark的Streaming和Spark的SQL简单入门学习
摘要:1、Spark Streaming是什么? 2、Spark与Storm的对比 a、Spark开发语言:Scala、Storm的开发语言:Clojure。 b、Spark编程模型:DStream、Storm编程模型:Spout/Bolt。 c、Spark和Storm的对比介绍: Spark: Stor 阅读全文
posted @ 2018-04-23 17:24 别先生 阅读(744) 评论(0) 推荐(0) 编辑
INFO JobScheduler: Added jobs for time 1524468752000 ms/INFO MemoryStore: Block input-0-1524469143000 stored as bytes in memory/完全分布式 ./bin/run-example streaming.NetworkWordCount localhost 9999无法正常运行
摘要:1、完全分布式 ./bin/run-example streaming.NetworkWordCount localhost 9999无法正常运行: 2、启动过程如上所示,下面就是问题,当在nc -lk 9999命令窗口,输入例如hello world hello world hadoop worl 阅读全文
posted @ 2018-04-23 16:46 别先生 阅读(2492) 评论(0) 推荐(0) 编辑
exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org/hadoop/ConnectionRefused
摘要:1、虽然,不是大错,还说要贴一下,由于我运行run-example streaming.NetworkWordCount localhost 9999的测试案例,出现的错误,第一感觉就是Spark没有启动导致的: 2、启动Spark的脚本命令: [hadoop@slaver1 spark-1.5.1 阅读全文
posted @ 2018-04-23 15:35 别先生 阅读(8100) 评论(0) 推荐(0) 编辑
执行Spark运行在yarn上的命令报错 spark-shell --master yarn-client
摘要:1、执行Spark运行在yarn上的命令报错 spark-shell --master yarn-client,错误如下所示: 解决方法如下所示: 参考文章:https://blog.csdn.net/chengyuqiang/article/details/69934382 HADOOP_CONF 阅读全文
posted @ 2018-04-22 21:43 别先生 阅读(4327) 评论(0) 推荐(0) 编辑
18/03/18 04:53:44 WARN TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources
摘要:1:遇到这个问题是在启动bin/spark-shell以后,然后呢,执行spark实现wordcount的例子的时候出现错误了,如: 执行上面操作之前我是这样启动我的spark-shell的,如下所示: 问题就出现在这里,首先你要知道自己笔记本的内存大小,如果你租的服务器内存应该可以满足你的需求,这 阅读全文
posted @ 2018-03-18 20:06 别先生 阅读(7972) 评论(2) 推荐(0) 编辑
java.net.ConnectException: Call From slaver1/192.168.19.128 to slaver1:8020 failed on connection exception: java.net.ConnectException: Connection refused; For more details see: http://wiki.apache.org
摘要:1:练习spark的时候,操作大概如我读取hdfs上面的文件,然后spark懒加载以后,我读取详细信息出现如下所示的错误,错误虽然不大,我感觉有必要记录一下,因为错误的起因是对命令的不熟悉造成的,错误如下所示: 2:错误原因如下所示: 我使用了如下所示命令来读取hdfs上面的文件,scala> va 阅读全文
posted @ 2018-03-18 15:42 别先生 阅读(2318) 评论(0) 推荐(0) 编辑
Spark核心RDD、什么是RDD、RDD的属性、创建RDD、RDD的依赖以及缓存、
摘要:1:什么是Spark的RDD??? 2:RDD的属性: 3:创建RDD: 4:RDD编程API: 4.1:Transformation: RDD中的所有转换都是延迟加载的,也就是说,它们并不会直接计算结果。相反的,它们只是记住这些应用到基础数据集(例如一个文件)上的转换动作。只有当发生一个要求返回结 阅读全文
posted @ 2018-02-23 18:25 别先生 阅读(1606) 评论(0) 推荐(0) 编辑
在IDEA中编写Spark的WordCount程序
摘要:1:spark shell仅在测试和验证我们的程序时使用的较多,在生产环境中,通常会在IDE中编制程序,然后打成jar包,然后提交到集群,最常用的是创建一个Maven项目,利用Maven来管理jar包的依赖。 2:配置Maven的pom.xml: <?xml version="1.0" encodi 阅读全文
posted @ 2018-02-23 18:03 别先生 阅读(16187) 评论(0) 推荐(1) 编辑
Caused by: java.net.ConnectException: Connection refused: master/192.168.3.129:7077
摘要:1:启动Spark Shell,spark-shell是Spark自带的交互式Shell程序,方便用户进行交互式编程,用户可以在该命令行下用scala编写spark程序。 启动Spark Shell,出现的错误如下所示: 2:解决方法,是你必须先启动你的Spark集群,这样再启动Spark Shel 阅读全文
posted @ 2018-02-22 17:58 别先生 阅读(13976) 评论(0) 推荐(0) 编辑
Spark入门,概述,部署,以及学习(Spark是一种快速、通用、可扩展的大数据分析引擎)
摘要:1:Spark的官方网址:http://spark.apache.org/ 2:Spark特点: Spark的算子分为两类,一类叫做Transformation转换,一类叫做Action动作。Transformation延迟执行,当计算任务触发Action时候才会真正开始计算。 3:Spark的部署 阅读全文
posted @ 2018-01-03 21:05 别先生 阅读(1654) 评论(0) 推荐(0) 编辑
一脸懵逼学习Storm的搭建--(一个开源的分布式实时计算系统)
摘要:Storm的官方网址:http://storm.apache.org/index.html 1:集群部署的基本流程(基本套路): 集群部署的流程:下载安装包、解压安装包、修改配置文件、分发安装包、启动集群; 1:安装一个zookeeper集群,之前已经部署过,这里省略,贴一下步骤; 安装配置zooe 阅读全文
posted @ 2017-11-01 09:31 别先生 阅读(655) 评论(0) 推荐(1) 编辑
一脸懵逼学习Storm---(一个开源的分布式实时计算系统)
摘要:Storm的官方网址:http://storm.apache.org/index.html 1:什么是Storm? Storm是一个开源的分布式实时计算系统,可以简单、可靠的处理大量的数据流。被称作“实时的hadoop”。Storm有很多使用场景:如实时分析,在线机器学习,持续计算, 分布式RPC, 阅读全文
posted @ 2017-10-31 16:53 别先生 阅读(1563) 评论(1) 推荐(1) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示