青衫仗剑 - 博客园

2018年3月11日

摘要：转自:https://www.cnblogs.com/jun1019/p/6256514.html Kafka存储机制问题：如何保证消息消费的有序性呢？比如说生产者生产了0到100个商品，那么消费者在消费的时候安装0到100这个从小到大的顺序消费，那么kafka如何保证这种有序性呢？难度就在于，生阅读全文

posted @ 2018-03-11 17:02 青衫仗剑阅读(284) 评论(0) 推荐(0) 编辑

2018年3月10日

Kafka核心概念(转)

摘要：转自:https://blog.csdn.net/liyiming2017/article/details/82805479 1、Kafka集群结构实际上kafka的结构图是有些区别的，现在我们看下面的图： producer和consumer想必大家都很熟悉，一个生产消息，一个消费掉消息。这里就不阅读全文

posted @ 2018-03-10 19:05 青衫仗剑阅读(381) 评论(0) 推荐(0) 编辑

Kafka介绍及集群搭建

摘要：简介 Kafka是一个开源的，分布式的，高吞吐量的消息系统。随着Kafka的版本迭代，日趋成熟。大家对它的使用也逐步从日志系统衍生到其他关键业务领域。特别是其超高吞吐量的特性，在互联网领域，使用越来越广泛，生态系统也越来的完善。同时，其设计思路也是其他消息中间件重要的设计参考。 Kafka原先的开发阅读全文

posted @ 2018-03-10 16:50 青衫仗剑阅读(503) 评论(0) 推荐(0) 编辑

2018年2月18日

Spark之使用SparkSql操作mysql和DataFrame的Scala实现

摘要：通过读取文件转换成DataFrame数据写入到mysql中从mysql中读取数据到DataFrame中阅读全文

posted @ 2018-02-18 22:07 青衫仗剑阅读(1755) 评论(0) 推荐(0) 编辑

Spark之 SparkSql整合hive

摘要：整合： 1，需要将hive-site.xml文件拷贝到Spark的conf目录下，这样就可以通过这个配置文件找到Hive的元数据以及数据存放位置。 2，如果Hive的元数据存放在Mysql中，我们还需要准备好Mysql相关驱动，比如：mysql-connector-java-5.1.35.jar。阅读全文

posted @ 2018-02-18 21:35 青衫仗剑阅读(630) 评论(0) 推荐(0) 编辑

Spark之使用SparkSql操作Hive的Scala程序实现

摘要：依赖 scala代码 hive-site.xml 还需要把hdfs上的user/hive/warehouse目录 chmod 777，不然程序访问不了会报错阅读全文

posted @ 2018-02-18 21:21 青衫仗剑阅读(3876) 评论(0) 推荐(0) 编辑

Spark之 RDD转换成DataFrame的Scala实现

摘要：依赖 RDD转化成DataFrame:通过StructType指定schema RDD转化成DataFrame:利用反射机制推断schema 阅读全文

posted @ 2018-02-18 20:58 青衫仗剑阅读(1835) 评论(0) 推荐(0) 编辑

2018年2月15日

Spark之 SparkSql、DataFrame、DataSet介绍

摘要： SparkSql SparkSql是专门为spark设计的一个大数据仓库工具，就好比hive是专门为hadoop设计的一个大数据仓库工具一样。特性： DataFrame DataFrame前身叫SchemaRDD,在spark1.3.0之后把schemaRDD改名为DataFrame,DataFr 阅读全文

posted @ 2018-02-15 16:53 青衫仗剑阅读(422) 评论(0) 推荐(0) 编辑

Spark之 RDD

摘要：简介 RDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。 Resilient：弹性，它表示的含义rdd的数据是可以保存在内存中或者是磁盘中。 Distributed：它的数据阅读全文

posted @ 2018-02-15 16:18 青衫仗剑阅读(353) 评论(0) 推荐(0) 编辑

2018年2月12日

Spark scala和java的api使用

摘要： 1、利用scala语言开发spark的worcount程序（本地运行） 2、利用scala语言开发spark的wordcount程序（集群运行）最后打成jar包到集群上执行 3、利用java语言开发spark的wordcount程序（本地运行）阅读全文

posted @ 2018-02-12 13:22 青衫仗剑阅读(283) 评论(0) 推荐(0) 编辑

剑来

公告