12 2022 档案

摘要:简单选择排序 简单选择排序时间复杂度分析 最好、最差、平均时间复杂度都是O(n^2),因为无论你是否完全有序,还是完全逆序,都需要找出后边的最小值进行替换。 特殊的选择排序--希尔排序 希尔排序时间复杂度分析 最坏时间复杂度为O(n) 当n在某个范围内时,可达O(n^1.3) 阅读全文
posted @ 2022-12-30 09:52 jsqup 阅读(14) 评论(0) 推荐(0) 编辑
摘要:堆排序:不稳定排序 选择排序:不稳定排序 希尔排序:不稳定排序 快速排序:不稳定排序 阅读全文
posted @ 2022-12-29 17:59 jsqup 阅读(12) 评论(0) 推荐(0) 编辑
摘要:堆介绍 堆可以分为大根堆和小根堆,是一个完全二叉树,而堆排序是根据堆这种数据结构设计的一种排序。 大根堆和小根堆 大根堆:每个结点的值都大于左孩子和右孩子的值,称之为大根堆。 小根堆:每个节点的值都小于左孩子和右孩子的值,称之为小根堆。 建堆的两种方法(筛选法建堆和插入法建堆) 筛选法建堆排序过程 阅读全文
posted @ 2022-12-29 11:32 jsqup 阅读(57) 评论(0) 推荐(0) 编辑
摘要:介绍 **稳定性:**2个相等的数,在排序前后的顺序不变,就说这个排序算法是稳定。 好处 从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。 例子 **基数排序:**先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。 图解 阅读全文
posted @ 2022-12-26 18:00 jsqup 阅读(37) 评论(0) 推荐(0) 编辑
摘要:10.24.8.5 # 切换用户 su - hive # 查看表文件 [hive@hadoop-0001 ~]hdfs dfs -ls /user/hive/warehouse/bibase.db/ # 查看某一张表磁盘上的小文件 [hive@hadoop-0001 ~] hdfs dfs - 阅读全文
posted @ 2022-12-26 16:06 jsqup 阅读(20) 评论(0) 推荐(0) 编辑
摘要:压缩格式的设置 set mapred.output.compression= |压缩格式|工具|算法|扩展名|是否支持分割|Hadoop编码/解码器| | | | | | | | |default||deflate|.deflate|No|org.apache.hadoop.io.compress. 阅读全文
posted @ 2022-12-08 15:26 jsqup 阅读(27) 评论(0) 推荐(0) 编辑
摘要:1. 文件存储格式 TextFile SequeceFile RCFile ORCFile PARQuet 2. 说明 |格式|导入数据方式| |--|--| |textfile|将数据文件直接拷贝到hdfs上,不进行处理| |SequenceFile, RCFile, ORCFile, PARQu 阅读全文
posted @ 2022-12-07 15:53 jsqup 阅读(49) 评论(0) 推荐(0) 编辑
摘要:sql语句 (SELECT * FROM t1 WHERE {subquery_where_condition}) a JOIN (SELECT * FROM t2 WHERE {subquery_where_condition}) b ON {on_condition} WHERE {where_ 阅读全文
posted @ 2022-12-07 15:25 jsqup 阅读(191) 评论(0) 推荐(0) 编辑
摘要:1. 什么是行式存储和列式存储? 2. 行式存储分析? 缺点: -- 行式在读取数据的时候,所查询的目标只涉及少数几项属性,但由于这些目标数据埋藏在各行数据单元中,而行单元又特别大,必须读取每一条完整的行记录,从而使得读取效率大大降低。 -- 可以加索引或给表分区进行优化。 优点: -- 1. 适合 阅读全文
posted @ 2022-12-02 15:05 jsqup 阅读(101) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示