07 2023 档案

摘要:# 二叉堆 二叉堆具有两个性质, 结构性和排序性. ## 结构性质 堆是一棵除了底层以外都被完全填满的二叉树, 叫做完全二叉树, 而最底层从左到右都是满的, 右侧允许有空缺 ![image.png](https://cdn.nlark.com/yuque/0/2023/png/492896/1690 阅读全文
posted @ 2023-07-24 00:45 Aitozi 阅读(305) 评论(0) 推荐(1) 编辑
摘要:# 机制 链表中查询的效率的复杂度是O(n), 有没有办法提升这个查询复杂度呢? 最简单的想法就是在原始的链表上构建多层索引. ![image.png](https://img2023.cnblogs.com/blog/697236/202307/697236-20230723151642781-1 阅读全文
posted @ 2023-07-23 00:37 Aitozi 阅读(206) 评论(0) 推荐(1) 编辑
摘要:在Delta Lake官网上提到的一篇新一代湖仓架构的论文. 这篇论文由Databricks团队2021年发表于CIDR会议. 这个会议是对sigmod和vldb会议的补充. 可以看到这篇论文和前一篇Delta Lake: High-Performance ACID Table Storage ov 阅读全文
posted @ 2023-07-15 21:40 Aitozi 阅读(277) 评论(0) 推荐(0) 编辑
摘要:论文发表于 2020年, 研究数据湖产品的很好的学习资料. # 概要 开篇很明确的表明了为什么要做Delta lake这样一个产品. Databricks尝试将数据仓库直接架在云上对象存储之上, 这种尝试的过程中遇到了对象存储的一些问题, 为了解决这些问题, 提出了Delta lake这套技术方案. 阅读全文
posted @ 2023-07-13 23:07 Aitozi 阅读(308) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示