花未全开*月未圆

2019年12月14日

摘要：欢迎来到第 4 课时“高性能索引”，这一课时的内容包含索引设计和工作原理、索引类型、索引使用技巧、如何创建高性能索引、索引创建规范等 5 个方面。索引设计和工作原理先来看看索引设计和工作原理。想创建高性能索引，首先要了解什么是索引。维基百科对其定义：数据库索引是一种数据结构，它以额外的写入和存储阅读全文

posted @ 2019-12-14 12:20 花未全开*月未圆阅读(634) 评论(0) 推荐(0)

2019年12月13日

MySQL体系结构与存储引擎

摘要： MySQL 体系结构先看 MySQL 数据库的体系结构，如下图所示。 MySQL 体系结构由 Client Connectors 层、MySQL Server 层及存储引擎层组成。 Client Connectors 层负责处理客户端的连接请求，与客户端创建连接。目前 MySQL 几乎支持所有的阅读全文

posted @ 2019-12-13 17:28 花未全开*月未圆阅读(404) 评论(0) 推荐(0)

2019年11月29日

Kafka数据安全性、运行原理、存储

摘要：直接贴面试题：怎么保证数据 kafka 里的数据安全？答：生产者数据的不丢失kafka 的 ack 机制：在 kafka 发送数据的时候，每次发送消息都会有一个确认反馈机制，确保消息正常的能够被收到。如果是同步模式：ack 机制能够保证数据的不丢失，如果 ack 设置为 0，风险很大，一般阅读全文

posted @ 2019-11-29 20:01 花未全开*月未圆阅读(1879) 评论(0) 推荐(0)

Hbase与hive集成与对比

摘要： HBase与Hive的对比 1．Hive (1) 数据仓库 Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系，以方便使用HQL去管理查询。 (2) 用于数据分析、清洗 Hive适用于离线的数据分析和清洗，延迟较高。 (3) 基于HDFS、MapReduce Hive 阅读全文

posted @ 2019-11-29 19:53 花未全开*月未圆阅读(257) 评论(0) 推荐(0)

HBaseAPI

摘要：环境准备新建项目后在pom.xml中添加依赖： <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifactId> <version>1.3.1</version> </dependency> 阅读全文

posted @ 2019-11-29 19:51 花未全开*月未圆阅读(154) 评论(0) 推荐(0)

Hbase优化：（待重点研究）

摘要：一、服务端调优 1、参数配置 1）、hbase.regionserver.handler.count：该设置决定了处理RPC的线程数量，默认值是10，通常可以调大，比如：150，当请求内容很大（上MB，比如大的put、使用缓存的scans）的时候，如果该值设置过大则会占用过多的内存，导致频繁的GC，阅读全文

posted @ 2019-11-29 19:48 花未全开*月未圆阅读(273) 评论(0) 推荐(0)

hbase表的高性能设计

摘要：第7章 HBase优化 7.1 高可用在HBase中Hmaster负责监控RegionServer的生命周期，均衡RegionServer的负载，如果Hmaster挂掉了，那么整个HBase集群将陷入不健康的状态，并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。阅读全文

posted @ 2019-11-29 19:36 花未全开*月未圆阅读(305) 评论(0) 推荐(0)

hbase运行原理

摘要： HBase特点 1）海量存储 Hbase适合存储PB级别的海量数据，在PB级别的数据以及采用廉价PC存储的情况下，能在几十到百毫秒内返回数据。这与Hbase的极易扩展性息息相关。正式因为Hbase良好的扩展性，才为海量数据的存储提供了便利。 2）列式存储这里的列式存储其实说的是列族存储，Hbase 阅读全文

posted @ 2019-11-29 19:32 花未全开*月未圆阅读(248) 评论(0) 推荐(0)

Hive架构与工作原理

摘要：组成及作用：用户接口：ClientCLI（hive shell）、JDBC/ODBC(java访问hive)、WEBUI（浏览器访问hive）元数据：Metastore 元数据包括：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录阅读全文

posted @ 2019-11-29 19:15 花未全开*月未圆阅读(293) 评论(0) 推荐(0)

hive 调优总结

摘要： hive调优是比较大的专题，需要结合实际的业务，数据的类型，分布，质量状况等来实际的考虑如何进行系统性的优化，hive底层是mapreduce，所以hadoop调优也是hive调优的一个基础,hvie调优可以分为几个模块进行考虑，数据的压缩与存储，sql的优化，hive参数的优化，解决数据的倾斜等。阅读全文

posted @ 2019-11-29 19:10 花未全开*月未圆阅读(960) 评论(0) 推荐(0)

花未全开*月未圆

谦虚谨慎，戒骄戒躁，稳中求进，悟道行之

公告