06 2019 档案
摘要:Spark Streaming输入 //*************** Spark Streaming 的输入 ************** 1、 文件数据源 1、Spark Streaming通过streamingContext.fileStream[KeyClass, ValueClass, I
阅读全文
摘要:Spark Sql //************** Spark SQL ******************* 1、Spark SQL 是Spark套件中的一个模块,他将数据的计算任务通过SQL的形式转换成了RDD的计算,类似于Hive通过SQL的形式将数据的计算任务转换成了MapReduce。 2、Spark SQL的特点: 1、和Spark Core的无缝集成,我可以在写整...
阅读全文
摘要:import com.bigdata.kafka.originalLog.HDFSOutputStreamPool; import com.bigdata.kafka.originalLog.StringUtil; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream;...
阅读全文
摘要:进入新公司已经快半个月了,目前很迷茫,没有自己想做的spark开发,初步了解了公司项目流程,感觉java写的一些模块真难啊,佩服别人的java 开发水平 ,思路与逻辑判断 ,代码架构与封装都感觉完美,但我看来就是很乱的感觉 ,熟悉一个新项目 又得从头开始 熟悉数据的来龙去脉 ,这次的项目不是传统的数
阅读全文