07 2023 档案

摘要:一、Hbase的概念 HBase是Hadoop的生态系统,是建立在Hadoop文件系统(HDFS)之上的分布式、面向列的数据库,通过利用Hadoop的文件系统提供容错能力。如果你需要进行实时读写或者随机访问大规模的数据集的时候,请考虑使用HBase! HBase作为Google Bigtable的开 阅读全文
posted @ 2023-07-31 22:10 业余砖家 阅读(1848) 评论(0) 推荐(0) 编辑
摘要:了解Flush触发条件后,这里产生了一个问题,频繁的flush会产生大量小文件,在对hbase进行查询时会产生大量IOPS,读取性能会受到很大的影响,同时也会给hdfs造成一定压力,hbase提供了一个Compact机制来合并这些HFile,以下对Compact机制做详细介绍。 在hbase中每当有 阅读全文
posted @ 2023-07-31 22:07 业余砖家 阅读(345) 评论(0) 推荐(0) 编辑
摘要:一、HBase数据模型(☆) 1.NameSpace 命名空间,类似于关系型数据库的 Database 概念,每个命名空间下有多个表。HBase有两个自带的命名空间,分别是 hbase 和 default,hbase 中存放的是 HBase 内置的表,default 表是用户默认使用的命名空间。 2 阅读全文
posted @ 2023-07-23 19:39 业余砖家 阅读(415) 评论(0) 推荐(0) 编辑
摘要:1、一般情况下,都是使用鼠标左右键拖动来实现数据的填充的 2、但是填充1200列,下拉拖动就非常麻烦,可以首先定位到A200。 在屏幕左侧中央处找到剪切板下方的“A1”字样,鼠标单击A1文字,输入想要跳转的单元格,如A200,输入完成之后,点击回车即可。 3、将要填充数据的单元格全部选中,选择的单元 阅读全文
posted @ 2023-07-14 12:27 业余砖家 阅读(1181) 评论(0) 推荐(0) 编辑
摘要:使用TPC-H进行性能测试,需要有很多工作配合才能获得较高性能,如建立索引,表数据的合理分布(使用表空间和聚簇技术)等。本文从查询优化技术的角度,对TPC-H的22条查询语句和主流数据库执行每条语句对应的查询执行计划进行分析,目的在于了解各个主流数据库的查询优化技术,以TPC-H实例进一步掌握查询优 阅读全文
posted @ 2023-07-08 10:08 业余砖家 阅读(407) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示