摘要:
一、配置KDC服务 由于使用的是内网机器,这里使用rpm包安装。需要的rpm包括: 服务端:krb5-server, krb5-workstation, krb5-libs,libkadm5 客户端:krb5-workstation, krb5-libs,libkadm5 下载地址:http://m 阅读全文
摘要:
一、在一个有序数组中,查找某个数是否存在,时间复杂度O(logN) 这个基本的二分查找中有一个缺陷,在一些有重复元素的数组中,比如[1,2,2,2,3,3,4],这个数组中,假设我们查找2这个元素,我们会直接返回下标3,如果要寻找最左侧的数,显然不符合了。 public static int bin 阅读全文
摘要:
一、Rowkey设计原则 Rowkey是按照字典顺序排序的,先比较第一个字节,如果相同,然后比对第二个字节,以此类推; 1)长度原则:是一个二进制字节流,可以是任意字符串,最大长度64kb,实际应用中一般为10-100bytes,以byte[]形式保存,一般设计为定长;建议不超过16个字节,设计过长 阅读全文
摘要:
一、HBase读写流程 读流程 1)Client请求zk找到meta表的Region位置,meta中存储着用户表的Region信息; 2)根据命名空间,表名,rowkey等找到对应的Region信息; 3)根据Region信息请求对应的RegionServer,发送请求,查找对应的Region; 4 阅读全文
摘要:
一、HBase的数据模型 1)Table:表名,在创建表时需要指定列族即可,也可以指定一些数据属性、超时时间和压缩算法等;create 'test', {NAME => 'info', VERSIONS => 1, COMPRESSION => 'LZO'},name是列族,compression是 阅读全文
摘要:
一、HADOOP核心模块 HDFS:高吞吐量的分布式文件系统 YARN:用于任务调度和集群资源管理的框架 MapReduce:基于yarn只上,并行处理计算引擎 二、HDFS分布式文件存储系统 特性 1、主从架构:一般情况下HDFS集群有一个NameNode和多个DataNode组成,NameNod 阅读全文
摘要:
一、异或运算(无进位运算) 参加运算的两个对象,按照二进制位进行异或运算,运算规则:0^0=0,0^1=1,1^1=0,相同为0,不同为1 异或运算的性质: 任何一个变量与0异或是其本身(N^0=N) 任何一个变量与自身异或为0(N^N=0) 异或运算满足交换律和结合律 二、使用场景 不使用额外变量 阅读全文
摘要:
一、选择排序 package org.shydow.structure.sort; /** * @author Rainbow * @date 2021/11/29 21:43 * @desc 时间复杂度:O(n^2) */ public class CodeSelectSort { public 阅读全文
摘要:
一、Flume部署与基础应用 部署 1)tar -zxvf apache-flume-1.9.0-bin.tar.gz -C /app,将tar包解压导/app目录 2)添加环境变量 export FLUME_HOME=/app/apache-flume-1.9.0-bin export PATH= 阅读全文
摘要:
一、Flume概述 定义:一个分布式的、高可靠、高可用的日志采集,聚合,传输的系统;具有三个重要的组件:Source,Channel,Sink 结构: 1)Agent:实质上是一个JVM进程,控制event数据从外部日志生产者流向指定的目的地(或者下一个Agent节点),Source负责接收数据到A 阅读全文