上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 37 下一页
摘要: 一、概述 Flink核心是一个流式的数据流执行引擎,并且能够基于同一个Flink运行时,提供支持流处理和批处理两种类型应用。其针对数据流的分布式计算提供了数据分布,数据通信及容错机制等功能。 Flink官网:https://flink.apache.org/ 不同版本的文档:https://nigh 阅读全文
posted @ 2022-10-05 09:41 大数据老司机 阅读(2921) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Presto是Facebook开源的MPP(Massively Parallel Processing:大规模并行处理)架构的OLAP(on-line transaction processing:联机事务处理),完全基于内存的并⾏计算,可针对不同数据源,执行大容量数据集的一款分布式SQL 阅读全文
posted @ 2022-10-03 22:22 大数据老司机 阅读(874) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Hive是基于Hadoop的一个数据仓库(Data Aarehouse,简称数仓、DW),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。是用于存储、分析、报告的数据系统。这里只讲部署,相关概念可以参考我这篇文章:大数据Hadoop之——数据仓库Hive Hive 架构 阅读全文
posted @ 2022-10-01 18:23 大数据老司机 阅读(2201) 评论(0) 推荐(0) 编辑
摘要: 一、概述 在 Hadoop 2.0.0 之前,一个集群只有一个Namenode,这将面临单点故障问题。如果 Namenode 机器挂掉了,整个集群就用不了了。只有重启 Namenode ,才能恢复集群。另外正常计划维护集群的时候,还必须先停用整个集群,这样没办法达到 7 * 24小时可用状态。Had 阅读全文
posted @ 2022-09-26 23:46 大数据老司机 阅读(1511) 评论(6) 推荐(0) 编辑
摘要: 一、概述 Hadoop是Apache软件基金会下一个开源分布式计算平台,以HDFS(Hadoop Distributed File System)、MapReduce(Hadoop2.0加入了YARN,Yarn是资源调度框架,能够细粒度的管理和调度任务,还能够支持其他的计算框架,比如spark)为核 阅读全文
posted @ 2022-09-24 18:18 大数据老司机 阅读(3565) 评论(0) 推荐(0) 编辑
摘要: 一、概述 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据 阅读全文
posted @ 2022-09-22 23:43 大数据老司机 阅读(487) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Apache ZooKeeper 是一个集中式服务,用于维护配置信息、命名、提供分布式同步和提供组服务,ZooKeeper 致力于开发和维护一个开源服务器,以实现高度可靠的分布式协调,其实也可以认为就是一个分布式数据库,只是结构比较特殊,是树状结构。官网文档:https://zookeep 阅读全文
posted @ 2022-09-18 22:58 大数据老司机 阅读(534) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Prometheus是一个开源的系统监控和报警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF托管的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,同时也支持多种exporter采集数据,还支持pushgateway进行数据上报,Pr 阅读全文
posted @ 2022-09-18 13:04 大数据老司机 阅读(3602) 评论(0) 推荐(0) 编辑
摘要: 一、概述 Prometheus 最开始是由 SoundCloud 开发的开源监控告警系统,是 Google BorgMon 监控系统的开源版本。在 2016 年,Prometheus 加入 CNCF,成为继 Kubernetes 之后第二个被 CNCF 托管的项目。随着 Kubernetes 在容器 阅读全文
posted @ 2022-09-17 12:11 大数据老司机 阅读(1336) 评论(2) 推荐(0) 编辑
摘要: 一、概述 Pod Disruption Budget (pod 中断 预算) 简称PDB,含义其实是终止pod前通过 labelSelector 机制获取正常运行的pod数目的限制,目的是对自愿中断的保护措施,主动驱逐Pod。Kubernetes version >= 1.7 才支持 PodDisr 阅读全文
posted @ 2022-09-12 11:39 大数据老司机 阅读(1008) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 37 下一页