摘要: master服务器和tablet服务器 这些服务器是管理表的,而表又是tablet(分区)组成的。(分区)分散在各个tablet服务器上。 通常一个集群包含3个master服务器(为了保证部分服务器故障时,程序仍能提供服务) master服务器上有一个分区,这个分区保存了系统目录表的元数据。还有一个 阅读全文
posted @ 2020-09-24 23:55 猫七的blog 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 行存储 行存储系统是以行的方式组织数据。行存储适合OLTP在线处理系统。 优点:数据写入更快。 不足,随着OLAP系统(在线分析系统)需求增多,数据写入和查询都不是关注点。变成了数据过滤,统计。 行存储举例 列存储 列存储以列的方式存储数据。 优点:有利于统计 不足:需要将每一列存储到对应的位置。 阅读全文
posted @ 2020-09-24 15:17 猫七的blog 阅读(398) 评论(0) 推荐(0) 编辑
摘要: Kudu介绍 需要实时分析应用场景下,便可能用到Kudu。 2.Kudu提供了更接近于RDBMS的功能和数据模型,提供类似于关系型数据库的存储结构来存储数据,允许用户以和关系型数据库相同的方式插入、更新、删除数据。 3.Kudu仅仅是一个存储层,然而它并不存储数据,而是依赖外部的Hadoop处理引擎 阅读全文
posted @ 2020-09-24 14:11 猫七的blog 阅读(2827) 评论(0) 推荐(1) 编辑