摘要:
简单来说,批流一体是一种大数据处理架构,它用同一套技术框架去同时处理两种数据:历史的海量数据(批)和实时的流动数据(流)。 要理解它,先分开看批和流这两个基础概念。 1. 批:处理“静止的、完整的数据集” 含义:批处理是把数据先存起来,攒成一个大块(一个“批”),然后一次性计算。这个数据集是有边界的 阅读全文
posted @ 2026-04-25 23:37
飘来荡去evo
阅读(38)
评论(0)
推荐(0)
摘要:
StarRocks 和 iceberg、Hudi的对比,StarRocks 能够替代数据湖么 StarRocks 和数据湖(如 Iceberg、Hudi)是互补关系,而非替代关系。它们一起构成了现代数据平台“存算分离”的理想模型,也就是湖仓一体(Lakehouse)。简单来说,数据湖负责“存”,而 阅读全文
posted @ 2026-04-25 00:43
飘来荡去evo
阅读(71)
评论(0)
推荐(0)

浙公网安备 33010602011771号