摘要: ​简介:介绍 Lakehouse 搜索引擎的设计思想,探讨其如何使用缓存,辅助数据结构,存储格式,动态文件剪枝,以及 vectorized execution 达到优越的处理性能。 作者:李洁杏,Databrick资深软件工程师 一、Lakehouse搜索引擎设计背景 1. 数据仓库和Lakehou 阅读全文
posted @ 2022-05-13 15:36 阿里云云栖号 阅读(195) 评论(0) 推荐(0) 编辑
摘要: ​简介:Delta Lake是一个开源存储层,它为数据湖带来了可靠性。Delta Lake提供了ACID事务、可扩展的元数据处理,并统一了流式处理和批处理数据处理。Delta-Lake运行在现有数据湖之上,并且与Apache Spark API完全兼容。希望本篇能让大家更深入了解Delta Lake 阅读全文
posted @ 2022-05-13 14:14 阿里云云栖号 阅读(176) 评论(0) 推荐(0) 编辑
摘要: ​简介:阿里云EMR 自2020年推出 Remote Shuffle Service(RSS)以来,帮助了诸多客户解决 Spark 作业的性能、稳定性问题,并使得存算分离架构得以实施。为了更方便大家使用和扩展,RSS 在2022年初开源(https://github.com/alibaba/Remo 阅读全文
posted @ 2022-05-13 11:49 阿里云云栖号 阅读(309) 评论(0) 推荐(0) 编辑
摘要: ​简介:Delta Lake 是 DataBricks 公司开源的、用于构建湖仓架构的存储框架。能够支持 Spark,Flink,Hive,PrestoDB,Trino 等查询/计算引擎。作为一个开放格式的存储层,它在提供了批流一体的同时,为湖仓架构提供可靠的,安全的,高性能的保证。 DeltaLa 阅读全文
posted @ 2022-05-13 10:51 阿里云云栖号 阅读(442) 评论(0) 推荐(0) 编辑
摘要: ​简介:随着互联网安全规范的普及,使用 HTTPS 技术进行通信加密,实现网站和 APP 的可信访问,已经成为公认的安全标准。本文将介绍针对 HTTPS 协议做压力测试的关注点,以及使用 PTS 做 HTTPS 压测的技术优势和最佳实践。 作者:拂衣 引言 随着互联网安全规范的普及,使用 HTTPS 阅读全文
posted @ 2022-05-13 09:45 阿里云云栖号 阅读(119) 评论(0) 推荐(0) 编辑