上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 19 下一页
摘要: 欢迎来到第 4 课时“高性能索引”,这一课时的内容包含索引设计和工作原理、索引类型、索引使用技巧、如何创建高性能索引、索引创建规范等 5 个方面。 索引设计和工作原理 先来看看索引设计和工作原理。想创建高性能索引,首先要了解什么是索引。维基百科对其定义:数据库索引是一种数据结构,它以额外的写入和存储 阅读全文
posted @ 2019-12-14 12:20 花未全开*月未圆 阅读(595) 评论(0) 推荐(0) 编辑
摘要: MySQL 体系结构 先看 MySQL 数据库的体系结构,如下图所示。 MySQL 体系结构由 Client Connectors 层、MySQL Server 层及存储引擎层组成。 Client Connectors 层 负责处理客户端的连接请求,与客户端创建连接。目前 MySQL 几乎支持所有的 阅读全文
posted @ 2019-12-13 17:28 花未全开*月未圆 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 直接贴面试题: 怎么保证数据 kafka 里的数据安全? 答: 生产者数据的不丢失kafka 的 ack 机制: 在 kafka 发送数据的时候,每次发送消息都会有一个确认反馈机制,确保消息正常的能够被收到。 如果是同步模式:ack 机制能够保证数据的不丢失,如果 ack 设置为 0,风险很大,一般 阅读全文
posted @ 2019-11-29 20:01 花未全开*月未圆 阅读(1801) 评论(0) 推荐(0) 编辑
摘要: HBase与Hive的对比 1.Hive (1) 数据仓库 Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。 (2) 用于数据分析、清洗 Hive适用于离线的数据分析和清洗,延迟较高。 (3) 基于HDFS、MapReduce Hive 阅读全文
posted @ 2019-11-29 19:53 花未全开*月未圆 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 环境准备 新建项目后在pom.xml中添加依赖: <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifactId> <version>1.3.1</version> </dependency> 阅读全文
posted @ 2019-11-29 19:51 花未全开*月未圆 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 一、服务端调优 1、参数配置 1)、hbase.regionserver.handler.count:该设置决定了处理RPC的线程数量,默认值是10,通常可以调大,比如:150,当请求内容很大(上MB,比如大的put、使用缓存的scans)的时候,如果该值设置过大则会占用过多的内存,导致频繁的GC, 阅读全文
posted @ 2019-11-29 19:48 花未全开*月未圆 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 第7章 HBase优化 7.1 高可用 在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。 阅读全文
posted @ 2019-11-29 19:36 花未全开*月未圆 阅读(283) 评论(0) 推荐(0) 编辑
摘要: HBase特点 1)海量存储 Hbase适合存储PB级别的海量数据,在PB级别的数据以及采用廉价PC存储的情况下,能在几十到百毫秒内返回数据。这与Hbase的极易扩展性息息相关。正式因为Hbase良好的扩展性,才为海量数据的存储提供了便利。 2)列式存储 这里的列式存储其实说的是列族存储,Hbase 阅读全文
posted @ 2019-11-29 19:32 花未全开*月未圆 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 组成及作用: 用户接口:ClientCLI(hive shell)、JDBC/ODBC(java访问hive)、WEBUI(浏览器访问hive) 元数据:Metastore 元数据包括:表名、表所属的数据库(默认是default)、表的拥有者、列/分区字段、表的类型(是否是外部表)、表的数据所在目录 阅读全文
posted @ 2019-11-29 19:15 花未全开*月未圆 阅读(263) 评论(0) 推荐(0) 编辑
摘要: hive调优是比较大的专题,需要结合实际的业务,数据的类型,分布,质量状况等来实际的考虑如何进行系统性的优化,hive底层是mapreduce,所以hadoop调优也是hive调优的一个基础,hvie调优可以分为几个模块进行考虑,数据的压缩与存储,sql的优化,hive参数的优化,解决数据的倾斜等。 阅读全文
posted @ 2019-11-29 19:10 花未全开*月未圆 阅读(931) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 19 下一页