上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 37 下一页
摘要: 一、概述 HBase 是一个面向列式存储的分布式数据库,其设计思想来源于 Google 的 BigTable 论文。HBase 底层存储基于 HDFS 实现,集群的管理基于 ZooKeeper 实现。HBase 良好的分布式架构设计为海量数据的快速存储、随机访问提供了可能,基于数据副本机制和分区机制 阅读全文
posted @ 2022-11-05 17:59 大数据老司机 阅读(623) 评论(1) 推荐(0) 编辑
摘要: 一、概述 REmote DIctionary Server(Redis) 是一个由 Salvatore Sanfilippo 写的 key-value 存储系统,是跨平台的非关系型数据库。 Redis有三种集群模式:主从模式,Sentinel(哨兵)模式,Cluster模式,这三种模式环境编排部署都 阅读全文
posted @ 2022-11-05 00:37 大数据老司机 阅读(423) 评论(1) 推荐(0) 编辑
摘要: 一、概述 FineBI 是帆软软件有限公司推出的一款商业智能(Business Intelligence)产品。FineBI 是定位于自助大数据分析的BI工具,能够帮助企业的业务人员和数据分析师,开展以问题导向的探索式分析。 上面是官方的介绍,其实一般我们会将原始数据通过ETL(抽取(extract 阅读全文
posted @ 2022-10-30 23:11 大数据老司机 阅读(1095) 评论(1) 推荐(1) 编辑
摘要: 一、概述 Apache Hudi是一个快速增长的数据湖存储系统,可帮助组织构建和管理PB级数据湖。Hudi通过引入诸如升序、删除和增量查询之类的原语,将流式处理引入到批处理式大数据中。这些功能有助于在统一服务层上更快、更新鲜的数据。Hudi表可以存储在Hadoop分布式文件系统(HDFS)或云存储上 阅读全文
posted @ 2022-10-30 00:31 大数据老司机 阅读(1107) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Hudi(Hadoop Upserts Deletes and Incrementals),简称Hudi,是一个流式数据湖平台,关于Hudi的更多介绍可以参考我以下几篇文章: 大数据Hadoop之——新一代流式数据湖平台 Apache Hudi 大数据Hadoop之——Apache Hud 阅读全文
posted @ 2022-10-29 01:06 大数据老司机 阅读(1162) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Hudi(Hadoop Upserts Deletes and Incrementals),简称Hudi,是一个流式数据湖平台,支持对海量数据快速更新,内置表格式,支持事务的存储层、 一系列表服务、数据服务(开箱即用的摄取工具)以及完善的运维监控工具,它可以以极低的延迟将数据快速存储到HD 阅读全文
posted @ 2022-10-22 18:40 大数据老司机 阅读(1076) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Hudi(Hadoop Upserts Deletes and Incrementals),简称Hudi,是一个流式数据湖平台,支持对海量数据快速更新,内置表格式,支持事务的存储层、 一系列表服务、数据服务(开箱即用的摄取工具)以及完善的运维监控工具,它可以以极低的延迟将数据快速存储到HD 阅读全文
posted @ 2022-10-16 22:21 大数据老司机 阅读(988) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于 阅读全文
posted @ 2022-10-15 19:34 大数据老司机 阅读(3746) 评论(0) 推荐(1) 编辑
摘要: 一、概述 Elasticsearch是一个基于Lucene的搜索引擎。它提供了具有HTTP Web界面和无架构JSON文档的分布式,多租户能力的全文搜索引擎。Elasticsearch是用Java开发的,根据Apache许可条款作为开源发布。 官方文档:https://www.elastic.co/ 阅读全文
posted @ 2022-10-14 00:03 大数据老司机 阅读(339) 评论(0) 推荐(0) 编辑
摘要: 一、概述 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python 等。 官方文档: https://azkaban.readthedocs. 阅读全文
posted @ 2022-10-07 15:46 大数据老司机 阅读(315) 评论(0) 推荐(0) 编辑
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 37 下一页