12 2022 档案
摘要:简单选择排序 简单选择排序时间复杂度分析 最好、最差、平均时间复杂度都是O(n^2),因为无论你是否完全有序,还是完全逆序,都需要找出后边的最小值进行替换。 特殊的选择排序--希尔排序 希尔排序时间复杂度分析 最坏时间复杂度为O(n) 当n在某个范围内时,可达O(n^1.3)
阅读全文
摘要:堆排序:不稳定排序 选择排序:不稳定排序 希尔排序:不稳定排序 快速排序:不稳定排序
阅读全文
摘要:堆介绍 堆可以分为大根堆和小根堆,是一个完全二叉树,而堆排序是根据堆这种数据结构设计的一种排序。 大根堆和小根堆 大根堆:每个结点的值都大于左孩子和右孩子的值,称之为大根堆。 小根堆:每个节点的值都小于左孩子和右孩子的值,称之为小根堆。 建堆的两种方法(筛选法建堆和插入法建堆) 筛选法建堆排序过程
阅读全文
摘要:介绍 **稳定性:**2个相等的数,在排序前后的顺序不变,就说这个排序算法是稳定。 好处 从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。 例子 **基数排序:**先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。 图解
阅读全文
摘要:10.24.8.5 # 切换用户 su - hive # 查看表文件 [hive@hadoop-0001 ~] hdfs dfs -
阅读全文
摘要:压缩格式的设置 set mapred.output.compression= |压缩格式|工具|算法|扩展名|是否支持分割|Hadoop编码/解码器| | | | | | | | |default||deflate|.deflate|No|org.apache.hadoop.io.compress.
阅读全文
摘要:1. 文件存储格式 TextFile SequeceFile RCFile ORCFile PARQuet 2. 说明 |格式|导入数据方式| |--|--| |textfile|将数据文件直接拷贝到hdfs上,不进行处理| |SequenceFile, RCFile, ORCFile, PARQu
阅读全文
摘要:sql语句 (SELECT * FROM t1 WHERE {subquery_where_condition}) a JOIN (SELECT * FROM t2 WHERE {subquery_where_condition}) b ON {on_condition} WHERE {where_
阅读全文
摘要:1. 什么是行式存储和列式存储? 2. 行式存储分析? 缺点: -- 行式在读取数据的时候,所查询的目标只涉及少数几项属性,但由于这些目标数据埋藏在各行数据单元中,而行单元又特别大,必须读取每一条完整的行记录,从而使得读取效率大大降低。 -- 可以加索引或给表分区进行优化。 优点: -- 1. 适合
阅读全文