10 2023 档案

摘要:因为传统数仓的不足,大家希望使用上分布式存储,也就是HDFS。然而使用HDFS后发现,基于数据库的数据仓库用SQL就能做查询,现在换到HDFS上面,只能用Mapreduce任务去做分析。给分析代码极大的不便,因此需要一个框架,使用SQL来做HDFS的查询。Hive正是基于类似SQL的语言完成对hdf 阅读全文
posted @ 2023-10-30 17:20 做个读书人 阅读(35) 评论(0) 推荐(0) 编辑
摘要:1、HDFS HDFS是Hadoop分布式文件系统。一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中NameNode作为主服务器,管理文件系统的命名空间和客户端对文件的访问操作;集群中的DataNode管理存储的数据。 2、MapReduce MapReduce是一个软件 阅读全文
posted @ 2023-10-30 15:58 做个读书人 阅读(188) 评论(0) 推荐(0) 编辑
摘要:拉链表是一种维护历史状态,以及最新状态数据的一种表。拉链表根据拉链粒度的不同,去除了一部分不变的记录,通过拉链表可以很方便的还原出拉链时点的客户记录,实际上相当于快照。 拉链表特征 1)记录一个事物从开始,一直到当前状态的所有变化的信息; 2)每次上报的都是历史记录的最终状态,是记录在当前时刻的历史 阅读全文
posted @ 2023-10-18 14:23 做个读书人 阅读(76) 评论(0) 推荐(0) 编辑
摘要:“::”是Java 8 引入的新特性之一,常常被称作为方法引用,提供了一种不执行方法的方法。使用“::”可以进一步简化一些使用了lambda表达式的代码,让代码更加简洁。 用法1:省略lamda表达式 public class Test01 { public static void main(Str 阅读全文
posted @ 2023-10-17 18:18 做个读书人 阅读(1040) 评论(0) 推荐(0) 编辑