子墨言良

2019年4月30日

摘要： 1.Spark Streaming功能介绍 1）定义 Spark Streaming is an extension of the core Spark API that enables scalable, high-throughput, fault-tolerant stream process 阅读全文

posted @ 2019-04-30 15:31 子墨言良阅读(591) 评论(0) 推荐(0) 编辑

2019年4月28日

Spark SQL快速离线数据分析

摘要： 1.Spark SQL概述 1）Spark SQL是Spark核心功能的一部分，是在2014年4月份Spark1.0版本时发布的。 2）Spark SQL可以直接运行SQL或者HiveQL语句 3）BI工具通过JDBC连接SparkSQL查询数据 4）Spark SQL支持Python、阅读全文

posted @ 2019-04-28 17:08 子墨言良阅读(2280) 评论(0) 推荐(0) 编辑

Spark-HBase集成错误之 java.lang.NoClassDefFoundError: org/htrace/Trace

摘要：在进行Spark与HBase 集成的过程中遇到以下问题： java.lang.IllegalArgumentException: Error while instantiating 'org.apache.spark.sql.hive.HiveSessionStateBuilder': at org 阅读全文

posted @ 2019-04-28 16:47 子墨言良阅读(1802) 评论(0) 推荐(0) 编辑

2019年4月18日

Spark2.X集群运行模式

摘要： 1.几种运行模式介绍 Spark几种运行模式： 1）Local 2）Standalone（Spark自己的集群管理） 3）Yarn 4）Mesos（Spark初期支持）下载IDEA并安装，可以百度一下免费文档。 2.spark Standalone模式配置并测试 1）jdk1.8已经安装 2）sc 阅读全文

posted @ 2019-04-18 17:33 子墨言良阅读(377) 评论(0) 推荐(0) 编辑

Spark on Yarn运行错误：Yarn application has already ended! It might have been killed or unable to launch application master

摘要： Spark on Yarn模式运行错误： bin/spark-shell --master yarn --deploy-mode client #报错查看8088页面上的工作日志错误原因：在执行任务时检测到虚拟机的内存太小，2.2g的虚拟内存实际值，超过了2.1g的上限，不能满足该任务所阅读全文

posted @ 2019-04-18 17:22 子墨言良阅读(1378) 评论(0) 推荐(0) 编辑

2019年4月17日

基于IDEA环境下的Spark2.X程序开发

摘要： 1.Windows开发环境配置与安装下载IDEA并安装，可以百度一下免费文档。 2.IDEA Maven工程创建与配置 1）配置maven 2）新建Project项目 3）选择maven骨架 4）创建项目名称 5）选择maven地址 6）生成maven项目阅读全文

posted @ 2019-04-17 18:54 子墨言良阅读(280) 评论(0) 推荐(0) 编辑

Spark2.X环境准备、编译部署及运行

摘要： 1.Spark概述 Spark 是一个用于大规模数据处理的快速和通用的计算引擎。在速度方面， Spark 扩展了广泛使用的 MapReduce 计算模型，而且高效地支持更多计算模式，包括交互式查询和流处理。在处理大规模数据集时，速度是非常重要的。速度快就意味着我们可以进行交互式的数据操作，否则阅读全文

posted @ 2019-04-17 10:45 子墨言良阅读(302) 评论(0) 推荐(0) 编辑

2019年4月15日

Cloudera HUE大数据可视化分析

摘要： 1.Hue 概述及版本下载 1）概述 Hue是一个开源的Apache Hadoop UI系统，最早是由Cloudera Desktop演化而来，由Cloudera贡献给开源社区，它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行阅读全文

posted @ 2019-04-15 17:31 子墨言良阅读(580) 评论(0) 推荐(0) 编辑

2019年4月13日

Hive与HBase集成进行数据分析

摘要：（一）Hive 概述（二）Hive在Hadoop生态圈中的位置（三）Hive 架构设计（四）Hive 的优点及应用场景（五）Hive 的下载和安装部署 1.Hive 下载 Apache版本的Hive。 Cloudera版本的Hive。这里选择下载Apache稳定版本ap 阅读全文

posted @ 2019-04-13 16:16 子墨言良阅读(574) 评论(0) 推荐(0) 编辑

2019年3月28日

使用bind配置DNS服务（CentOS 6.5）

摘要： DNS域名解析服务(Domain Name System)是用于解析域名与IP地址对应关系的服务，功能上可以实现正向解析与反向解析：正向解析:根据主机名(域名)查找对应的IP地址。反向解析:根据IP地址查找对应的主机名(域名)。工作形式上又分主服务器、从服务器和缓存服务器。主服务器:在特定区阅读全文

posted @ 2019-03-28 14:49 子墨言良阅读(1459) 评论(0) 推荐(0) 编辑

公告