上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 35 下一页
摘要: 定义与功能 定义:元数据是描述数据的数据,它提供了关于数据的内容、格式、来源、关系、质量等多方面的信息。就像图书馆的图书目录一样,元数据帮助用户在复杂的数据环境中理解、定位、管理和使用数据。 功能: 数据发现与理解:元数据帮助数据使用者了解数据的存在、位置和基本含义。例如,在一个大型企业的数据仓库中 阅读全文
posted @ 2024-12-17 14:26 软件职业规划 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 定义与概念 主数据(Master Data)是指在企业或组织内各个业务系统中共享的、具有高业务价值的核心业务实体数据。这些数据在整个企业范围内是一致、准确且完整的,通常是企业进行业务操作和决策的关键依据。例如,客户信息(包括客户名称、联系方式、信用等级等)、产品信息(产品编号、名称、规格、价格等)、 阅读全文
posted @ 2024-12-17 14:22 软件职业规划 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 定义与目标 定义:数据治理是一个组织为确保数据的质量、一致性、安全性和合规性而采取的一系列管理活动和流程。它涉及到数据的整个生命周期,从数据的产生、采集、存储、处理到共享和销毁。 目标:主要目标包括提高数据质量,确保数据的准确性、完整性、及时性和一致性;保障数据安全,防止数据泄露、篡改和滥用;促进数 阅读全文
posted @ 2024-12-17 14:20 软件职业规划 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 身份认证与访问控制 多因素认证:采用多因素认证机制,如密码、手机验证码、指纹或面部识别等组合,增加用户身份认证的安全性。 基于角色的访问控制(RBAC):通过将权限与特定角色关联,根据用户的角色分配相应的访问权限,实现数据的细粒度访问控制。 访问审计与跟踪:记录用户的访问行为,包括访问时间、访问的数 阅读全文
posted @ 2024-12-17 14:17 软件职业规划 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 统一存储层 存储系统选型:通常基于分布式文件系统,如Hadoop HDFS,具有高可扩展性和容错性,能应对大规模数据存储。也常采用云存储,如AWS S3,提供了按需扩展的存储资源。 数据格式支持:支持多种数据格式,结构化数据可采用Parquet、ORC等列存储格式,提升查询性能;半结构化数据以JSO 阅读全文
posted @ 2024-12-17 14:15 软件职业规划 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 存储资源测算 数据存储容量估算 数据湖部分:与单纯的数据湖存储类似,需要考虑数据的来源、增长速度、数据类型和存储需求差异。包括业务数据、日志文件、物联网数据等多种数据源。对于结构化数据,要考虑其表结构和记录增长;半结构化和非结构化数据则要考虑文件大小和数量的增长。例如,一个互联网公司的用户行为数据( 阅读全文
posted @ 2024-12-17 14:14 软件职业规划 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 数据摄入层 数据收集方式 批量摄入:这是一种常见的数据摄入方式,适用于将大量的历史数据或周期性产生的数据导入数据湖。例如,企业可以每天、每周或每月将业务系统(如ERP、CRM)中的数据以文件(如CSV、Parquet)或数据库备份的形式批量导入数据湖。这种方式可以利用ETL(抽取、转换、加载)工具, 阅读全文
posted @ 2024-12-17 14:12 软件职业规划 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 存储资源测算 数据量估算 历史数据和增长趋势:分析数据湖的数据来源,包括业务系统、物联网设备、社交媒体等。确定现有数据量,并预估数据的增长速度。例如,对于一个电商企业的数据湖,其用户行为数据(如浏览记录、购买记录)可能每天新增数GB,并且随着业务的拓展和用户数量的增加,增长率可能达到每月10% - 阅读全文
posted @ 2024-12-17 14:11 软件职业规划 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 数据源层 数据来源多样性:数据仓库的数据源非常广泛,包括企业内部的业务系统(如ERP系统、CRM系统、SCM系统等)、各种数据库(如关系型数据库、非关系型数据库)、文件系统(如日志文件、CSV文件、XML文件等),以及外部数据(如市场调研数据、社交媒体数据等)。这些数据源提供了构建数据仓库所需的原始 阅读全文
posted @ 2024-12-17 14:08 软件职业规划 阅读(31) 评论(0) 推荐(0) 编辑
摘要: 数据存储容量估算 数据量增长预估:首先需要考虑数据仓库的数据来源,包括业务系统数据库、日志文件、外部数据等。分析每个数据源的数据增长速度,例如,业务系统中的交易数据可能按照每月10%的速度增长,日志文件数据可能随着用户活动的增加而线性增长。 历史数据保留策略:确定需要保留多少历史数据。不同类型的数据 阅读全文
posted @ 2024-12-17 14:06 软件职业规划 阅读(32) 评论(0) 推荐(0) 编辑
上一页 1 ··· 23 24 25 26 27 28 29 30 31 ··· 35 下一页