上一页 1 2 3 4 5 6 ··· 14 下一页
摘要: 1.Spark Streaming功能介绍 1)定义 Spark Streaming is an extension of the core Spark API that enables scalable, high-throughput, fault-tolerant stream process 阅读全文
posted @ 2019-04-30 15:31 子墨言良 阅读(591) 评论(0) 推荐(0) 编辑
摘要: 1.Spark SQL概述 1)Spark SQL是Spark核心功能的一部分,是在2014年4月份Spark1.0版本时发布的。 ​ 2)Spark SQL可以直接运行SQL或者HiveQL语句 ​ 3)BI工具通过JDBC连接SparkSQL查询数据 ​ 4)Spark SQL支持Python、 阅读全文
posted @ 2019-04-28 17:08 子墨言良 阅读(2280) 评论(0) 推荐(0) 编辑
摘要: 在进行Spark与HBase 集成的过程中遇到以下问题: java.lang.IllegalArgumentException: Error while instantiating 'org.apache.spark.sql.hive.HiveSessionStateBuilder': at org 阅读全文
posted @ 2019-04-28 16:47 子墨言良 阅读(1802) 评论(0) 推荐(0) 编辑
摘要: 1.几种运行模式介绍 Spark几种运行模式: 1)Local 2)Standalone(Spark自己的集群管理) 3)Yarn 4)Mesos(Spark初期支持) 下载IDEA并安装,可以百度一下免费文档。 2.spark Standalone模式配置并测试 1)jdk1.8已经安装 2)sc 阅读全文
posted @ 2019-04-18 17:33 子墨言良 阅读(377) 评论(0) 推荐(0) 编辑
摘要: Spark on Yarn模式运行错误: bin/spark-shell --master yarn --deploy-mode client #报错 ​ ​ 查看8088页面上的工作日志 错误原因:在执行任务时检测到虚拟机的内存太小,2.2g的虚拟内存实际值,超过了2.1g的上限,不能满足该任务所 阅读全文
posted @ 2019-04-18 17:22 子墨言良 阅读(1378) 评论(0) 推荐(0) 编辑
摘要: 1.Windows开发环境配置与安装 下载IDEA并安装,可以百度一下免费文档。 2.IDEA Maven工程创建与配置 1)配置maven ​ ​ 2)新建Project项目 ​ 3)选择maven骨架 ​ ​ 4)创建项目名称 ​ ​ 5)选择maven地址 ​ ​ 6)生成maven项目 ​ 阅读全文
posted @ 2019-04-17 18:54 子墨言良 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 1.Spark概述 Spark 是一个用于大规模数据处理的快速和通用的计算引擎。 在速度方面, Spark 扩展了广泛使用的 MapReduce 计算模型,而且高效地支持更多计算模式,包括交互式查询和流处理。 在处理大规模数据集时,速度是非常重要的。速度快就意味着我们可以进行交互式的数据操作, 否则 阅读全文
posted @ 2019-04-17 10:45 子墨言良 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 1.Hue 概述及版本下载 1)概述 Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行 阅读全文
posted @ 2019-04-15 17:31 子墨言良 阅读(580) 评论(0) 推荐(0) 编辑
摘要: (一)Hive 概述 ​ (二)Hive在Hadoop生态圈中的位置 ​ (三)Hive 架构设计 ​ ​ (四)Hive 的优点及应用场景 ​ (五)Hive 的下载和安装部署 1.Hive 下载 Apache版本的Hive。 Cloudera版本的Hive。 这里选择下载Apache稳定版本ap 阅读全文
posted @ 2019-04-13 16:16 子墨言良 阅读(574) 评论(0) 推荐(0) 编辑
摘要: DNS域名解析服务(Domain Name System)是用于解析域名与IP地址对应关系的服务,功能上可以实现正向解析与反向解析: 正向解析:根据主机名(域名)查找对应的IP地址。 反向解析:根据IP地址查找对应的主机名(域名)。 工作形式上又分主服务器、从服务器和缓存服务器。 主服务器:在特定区 阅读全文
posted @ 2019-03-28 14:49 子墨言良 阅读(1459) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 14 下一页