Azure Data Lake Storage Gen2 优势

优势

Azure Data Lake Storage Gen2 旨在处理 EB 规模的数据的这种多样性和数量,同时按照设计,可处理数百 GB 的安全吞吐量。 因此,使你可以灵活地将 Data Lake Storage Gen2 用作实时和批处理解决方案的基础。 下面是 Azure Data Lake Storage Gen 2 带了的附加优势的列表:

Hadoop 兼容访问

Data Lake Storage Gen2 的一个主要优势是可以如同数据存储在 Hadoop 分布式文件系统中一样来处理数据。 此功能使你可以将数据存储在一个位置,并通过各种计算技术(包括 Azure Databricks、HDInsight 和 SQL 数据仓库)进行访问而无需在各个环境之间移动数据,从而可实现高效使用,同时尽可能降低成本。

安全性

Data Lake Storage Gen2 支持访问控制列表 (ACL) 和 POSIX 权限。 可以为存储在 Data Lake 中的数据,在目录或文件级别上设置权限粒度级别。 这种安全性可通过各种技术(包括 Hive 和 Spark)或使用实用工具(如 Azure 存储资源管理器)进行配置。 此外,所有存储的数据都可使用 Microsoft 或客户托管的密钥进行静态加密。

性能

Azure Data Lake Storage 将存储的数据组织为十分类似于文件系统的目录和子目录层次结构,从而可以更易于导航。 因此,数据处理需要的计算资源较少,这进而可减少时间和成本。

数据冗余

Azure Data Lake Storage Gen2 利用 Azure Blob 复制模型,这类模型使用本地冗余存储 (LRS) 在单个数据中心内提供数据冗余,或使用异地冗余存储选项向次要区域提供数据冗余。 此功能可确保数据在遭遇灾难时始终可用并且受保护。

posted @ 2019-03-01 14:39  JackSun924  阅读(793)  评论(0编辑  收藏  举报