摘要:
* 三大类过滤器: * 1. 比较过滤器 * 2. 专用过滤器 * 3. 包装过滤器 比较运算符 * LESS < * LESS_OR_EQUAL <= * EQUAL = * NOT_EQUAL <> * GREATER_OR_EQUAL >= * GREATER > * NO_OP 排除所有 比 阅读全文
摘要:
jdbc连接数据库6步 1.注册驱动 2.创建数据库连接对象、 3.创建数据库操作对象 4.对数据库进行操作 5.解决查询结果 6.关闭数据库资源 Hbase api基础我们要做的任务 1、如何创建一张表 2、如何删除一张表 3、如何向hbase表中插入一列数据 4、如何向hbase表中插入一批数据 阅读全文
摘要:
什么是hbase? HBase是一个高可靠,高性能,面对列可伸缩的分布式文件系统,可以存储海量的结构化,半结构化,非结构化数据(底层是按照字节数组存储的) (HBase利用HDFS作为文件存储系统,利用zookeeper作为元数据的元数据存储) HBase 与 HDFS 比较 HBase内部使用哈希 阅读全文
摘要:
什么是数据仓库? 数据仓库是面向主题的,集成的,随时间变化的,非易失的集合。 数据仓库的模型 星型模型 事实表连接着多个维度表,是单维度的每个维度上不存在再连接维度表了 特点: 不存在渐变维度,非正规化,有冗余数据,查询效率比较高 数据仓库的模型-- 雪花模型 多个维度表连接着事实表且每个维度表上会 阅读全文
摘要:
一:什么是hive (面试题) 1.hive是数据仓库建模的工具之一 2.我们可以向hive传入一条交互式的sql,在海量数据中查询分析得到结果的平台 hive 的特点 1.可扩展性 hive可以自由的扩展集群的规模,一般情况下不需要重启服务 2.延展性 hive支持自定义函数,用户可以根据自己的需 阅读全文
摘要:
apache Hive官网下载 apache-hive-3.1.2-bin.tar.gz 华为镜像站下载MySQL mysql-connector-java-8.0.29.jar /usr/local/soft/jars 上传到该目录下 1、解压 该目录下解压 到上一个目录下 tar -zxvf a 阅读全文
摘要:
* 客户端通过hadoop fs -put/bigdata命令 将元数据切分成块存放在HDFS上,且每一个块我们给大小128M * 之后我们将每一个block块通过逻辑切片,切成一个个split()切片,一般,我们的默认切片大小跟block块保持一致,如果我们读到最后一个block块, 与前一个bl 阅读全文
摘要:
google三篇论文 GFS MapReduce数据计算 BigTable 什么是hadoop? :Hadoop是一个适合海量数据的分布式存储和分布式计算的平台。 **Hadoop Common**:基础型功能 **Hadoop Distributed File System (HDFS™)**:一 阅读全文
摘要:
持久化机制 将我们的内存数据 通过数据持久化写入磁盘中实现持化、 Redis官方提供了两种不同的持久化方法来将内存的数据存储到硬盘里面分别是: RDB持久化,快照(Snapshot)【默认】 AOF (Append Only File) 只追加日志文件【默认不开启】 1.快照(snapshot)(关 阅读全文
摘要:
数据库操作指令 查看当前数据库中的所有键 key * 1.对于一个redis服务而言,包含默认有16个数据库给我们使用,从0开始编号,共15号数据库,默认使用的是0号数据库 切换库,select 库号 举例:使用1号库:select 1 库和库之间数据不共享 库和库之间的键可以重名 2.Redis中 阅读全文