摘要: 文章导读: 1. 什么是Calcite? 2. Calcite的主要功能? 3. 如何快速使用Calcite? 什么是Calcite Apache Calcite是一个动态数据管理框架,它具备很多典型数据库管理系统的功能,比如SQL解析、SQL校验、SQL查询优化、SQL生成以及数据连接查询等,但是 阅读全文
posted @ 2019-03-09 11:38 叁金 阅读(2440) 评论(0) 推荐(0) 编辑
摘要: 文章导读: 对称加密 非对称加密 数字证书 Kerberos认证流程 Hadoop生态利用Kerberos认证机制来识别可靠的服务和节点,保障Hadoop集群的安全,那么Kerberos到底是什么?为什么要选择它来进行认证?Kerberos认证的流程又是怎样的呢?让我们带着这些问题看一下这篇文章。 阅读全文
posted @ 2018-11-29 09:38 叁金 阅读(1176) 评论(0) 推荐(0) 编辑
摘要: 问题导读: 1. 什么是数据仓库 2. 数据仓库与数据库的区别 3. 数据仓库的适用场景 Hive作为Hadoop生态圈重要的一员已经被我们所熟知,它作为一个基于Hadoop的数据仓库工具,用来做离线的数据分析工作。那么什么是数据仓库,它与我们经常使用的数据库有什么不同呢? 什么是数据仓库 数据仓库 阅读全文
posted @ 2018-10-29 22:50 叁金 阅读(1378) 评论(0) 推荐(0) 编辑
摘要: 问题导读: Gobblin的架构设计是怎样的? Gobblin拥有哪些组建,如何实现可扩展? Gobblin采集执行流程的过程? 前面我们介绍Gobblin是用来整合各种数据源的通用型ETL框架,在某种意义上,各种数据都可以在这里“一站式”的解决ETL整个过程,专为大数据采集而生,易于操作和监控,提 阅读全文
posted @ 2018-09-13 23:02 叁金 阅读(1574) 评论(0) 推荐(0) 编辑
摘要: 问题导读: Hadoop数据采集框架都有哪些? Hadoop数据采集框架异同及适用场景? Hadoop提供了一个高度容错的分布式存储系统,帮助我们实现集中式的数据分析和数据共享。在日常应用中我们比如要将各种数据采集到HDFS存储服务中去,说到将数据采集到HDFS,我们熟知的框架包括: Apache 阅读全文
posted @ 2018-09-13 22:55 叁金 阅读(2065) 评论(0) 推荐(0) 编辑
摘要: 前面我们提到的HDFS,了解了HDFS的特性和架构。HDFS能够存储TB甚至PB规模的数据是有前提的,首先数据要以大文件为主,其次NameNode的内存要足够大。对HDFS有所了解的同学肯定都知道,NameNode是HDFS的存储着整个集群的元数据信息,比如所有文件和目录信息等等。而且当元数据信息较 阅读全文
posted @ 2018-08-30 13:31 叁金 阅读(937) 评论(0) 推荐(0) 编辑
摘要: 前面我们提到了Ceph是一个支持统一存储架构的分布式存储服务。简单介绍了Ceph的基本概念和基础架构包含的组件,其中最重要的就是底层的RADOS和它的两类守护进程OSD and Monitor。上篇文章我们还挖了一个坑,我们提到了CRUSH。 是的,我们这篇教程就是一篇不完整的Ceph教材,因为我们 阅读全文
posted @ 2018-08-27 21:41 叁金 阅读(1213) 评论(0) 推荐(0) 编辑
摘要: 有人问我,你是如何做到统一存储的?我微微一笑,大声告诉他:Ceph在手,天下我有。 Ceph是一个统一的分布式存储系统,旨在实现出色的性能,可靠性和可扩展性。认了OpenStack做大哥之后更是一发不可收拾,受到大家广泛的关注。当然这都是因为它能提供多样可靠稳定的存储服务。 Ceph支持三种调用模式 阅读全文
posted @ 2018-08-24 18:43 叁金 阅读(592) 评论(0) 推荐(0) 编辑
摘要: 你肯定听过Hadoop,对就是那头奔跑的小象。 Hadoop作为大数据时代代表性的解决方案被大家所熟知,它主要包含两部分内容: HDFS分布式文件存储 MapReduce分布式计算框架 前面我们分析存储方案的发展的时候有提到分布式文件存储的出现是为了解决存储的三大问题:可扩展性,高吞吐量,高可靠性 阅读全文
posted @ 2018-08-22 23:11 叁金 阅读(562) 评论(0) 推荐(0) 编辑
摘要: 什么FAT,NTFS,NFS,DAS,SAN,NAS,OSD这些名词我一个都不认识。 不知道各位大佬对上面的名词了解多少,通过上面的一些名词其实可以大致的看到存储是怎样一步步发展的。其中FAT,NTFS和NFS都是支持特定存储协议的存储系统,DAS,SAN,NAS,OSD是一种存储模型。稍微科普一下 阅读全文
posted @ 2018-08-21 23:22 叁金 阅读(494) 评论(0) 推荐(0) 编辑