数据中台:Snowflake的独特技术优势

Snowflake已于2020年9月16日正式上市,市值超过700亿美元。该公司成立于2012年,致力于为企业提供数据云平台,帮助客户打破数据孤岛,方便企业运用和分享数据,并从中获得数据价值和商业洞见。Snowflake提供的产品技术服务在国内更多被称为数据中台。当然,它独特的技术优势是获得资本亲赖的原因之一。

 

云端原生性

Snowflake提出了data-warehouse-as-a-service(DaaS)的概念,可以简单理解为原生于云端并专注于数据仓库的SaaS服务。Snowflake的云端原生性,和很多数据仓库提供商支持云端服务并非同一概念。其他云服务巨头,例如Oracle,Teradata,Netezza,尽管或多或少支持云端,因为本身产品架构的局限性,他们常常被证明并不能良好地解决很多现代企业面对的各种数据需求与问题。

 独特的架构

    Snowflake提出了独特的存算以及管理服分离的架构。SnowflakeShared-nothing的基上提出了Multi-cluster, shared data的概念。种架构的关在于将存底分离,从本上解决了传统架构的痛点。

从存储层来看,Snowflake将所有表自动划分为接近固定大小的micro-partition,用以支持更加高级的time travel和data sharing功能。即使对数据库进行了clone,在逻辑上有了两个数据库,而底层的存储仍然只有一个版本。从计算层来看,Snowflake用T-shirt尺寸定义了算力,相比较其他云计算资源,极大地简化了provision的过程。用户可以随时提高或降低计算资源来应对需求,而且这些不同计算资源看到的数据都来自同一版本。从服务层来看,是另一个我认为Snowflake服务层非常独立。它由众多global services组成,涵盖operation management,optimization,tuning,security,availability,metadata,caching等任务。它解决了数据仓库易用性的问题,大大降低了需要的管理和运维成本,是其他竞争对手所不能比拟的。

技术上坚持中立、开放原

    在美国,亚马逊AWS、微Azure、谷歌云云服们竞争力平台生完善础设大,客户资源丰富,Snowflake打通公有云平台,提供中立性、按需付在数据迁移与共享等方面,提供更大灵活性数据共享开放原将数据提供商、合作伙伴和客户联合起来,采用平台的客越多,就可以与其他客、合作伙伴和数据提供商交更多的数据,提升平台所有用的价

在国内,有没有类似Snowflake的公司呢,实际上在国内类似产品更多被称为数据中台,而且2019年是国内数据中台的元年,近期我们发现国内有家面向数字化转型落地的公司成立7年以来一直在打造数据中台产品,这家公司叫国云数据。最近国云数据创始人马晓东接受了亿欧网等媒体的采访并对标其数据中台为中国版的Snowflake。国云数据提供的数据中台在技术方面与Snowflake很类似。

该数据中台源于阿里顶级技术架构,但却不与任何云平台、数据工具或者是数据库进行绑定,而且可兼容对接客户自有的业务系统,无需推倒重来,从而节省企业成本,提高业务运营效率。数据中台支持基于中台向上做应用的二次开发,实现技术、业务、管理等人员联动使用的同时又保障了客户的使用安全、数据安全。此外,国云数据与Snowflake一样,在数据中台规划之初就运用云原生技术,存算分离,读写分离技术历经7年优化升级,已经做到极致。

    随着企业数字化转型加剧,在国内的与Snowflake类似的数据中台产品层出不穷,数据中台已成为热门赛道,未来市场容量在千亿级,我们也期待着中国的Snowflake早日迎来敲钟之日。

posted @   大数据分析  阅读(1270)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示