随笔 - 331,  文章 - 92,  评论 - 54,  阅读 - 60万

随笔分类 -  大数据

kafka概念扫盲
摘要:一、kafka概述 1.1、定义 Kakfa是一个分布式的基于发布/订阅模式的消息队列(message queue),主要应用于大数据的实时处理领域 1.2、消息队列 1.2.1、传统的消息队列&新式的消息队列的模式 上面是传统的消息队列,比如一个用户要注册信息,当用户信息写入数据库后,后面还有一些 阅读全文
posted @ 2020-01-31 22:59 bainianminguo 阅读(31850) 评论(4) 推荐(5) 编辑
Hbase概念原理扫盲
摘要:一、Hbase简介 1、什么是Hbase Hbase的原型是google的BigTable论文,收到了该论文思想的启发,目前作为hadoop的子项目来开发维护,用于支持结构化的数据存储。 Hbase是一个高可靠性(存储在hdfs上,有副本机制),高性能,面向列,非关系型的数据库(类似redis),可 阅读全文
posted @ 2019-12-27 23:39 bainianminguo 阅读(784) 评论(0) 推荐(1) 编辑
HDFS原理概念扫盲
摘要:1、概述 hdfs文件系统主要设计为了存储大文件的文件系统;如果有个TB级别的文件,我们该怎么存储呢?分布式文件系统未出现的时候,一个文件只能存储在个服务器上,可想而知,单个服务器根本就存储不了这么大的文件;退而求其次,就算一个服务器可以存储这么大的文件,你如果想打开这个文件,效率会高吗 hdfs的 阅读全文
posted @ 2019-12-05 00:00 bainianminguo 阅读(1339) 评论(0) 推荐(1) 编辑
zookeeper扫盲
摘要:一、zookeeper概述 a、zookeeper是一个开源的分布式的项目,为分布式业务提供协调服务的apache顶级项目 那什么是分布式的呢,通俗的说就是多个机器可以同时去处理一件事情 b、zookeeper相当于大数据生态体系的润滑剂,保存各个组件的配置文件;zoo是什么意思,动物园的意思,而大 阅读全文
posted @ 2019-12-01 20:07 bainianminguo 阅读(431) 评论(0) 推荐(0) 编辑


< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示