读DAMA数据管理知识体系指南01数据管理(上)
1. 数据管理
1.1. 数据是一种至关重要的企业资产
-
1.1.1. 数据和信息能使他们洞察顾客、产品和服务,帮助企业创新并实现其战略目标
-
1.1.2. 很少有组织能将他们的数据作为一项资产进行积极管理,并从中获得持续价值
-
1.1.3. 从数据中获取的价值不可能凭空产生或依赖于偶然,需要有目标、规划、协作和保障,也需要管理和领导力
1.2. 数据管理(Data Management)是为了交付、控制、保护并提升数据和信息资产的价值,在其整个生命周期中制订计划、制度、规程和实践活动,并执行和监督的过程
1.3. 数据管理专业人员(Data Management Professional)是指从事数据管理各方面的工作(从数据全生命周期的技术管理工作,到确保数据的合理利用及发挥作用),并通过其工作来实现组织战略目标的任何人员
1.4. 数据管理活动的范围广泛,包括从对如何利用数据的战略价值做出一致性决定,到数据库的技术部署和性能提升等所有方面
-
1.4.1. 数据管理需要技术的和非技术的双重技能
-
1.4.2. 管理数据的责任必须由业务人员和信息技术人员两类角色共同承担,这两个领域的人员需要相互协作,确保组织拥有满足战略需求的高质量数据
1.5. 数据和信息不仅是企业为获取未来价值而投资的资产,它们对大多数组织的日常运营也至关重要,因而被称为信息经济的“货币”“生命之血”,甚至“新的石油”
- 1.5.1. 一个组织可能没有从数据分析中获得价值,但是绝对无法在没有数据的情况下开展业务
2. 业务驱动因素
2.1. 信息和知识是竞争优势的关键
-
2.1.1. 拥有关于客户、产品、服务和运营的可靠、高质量数据的组织,能够比没有数据或数据不可靠的组织做出更好的决策
-
2.1.2. 如果不能像管理资本一样管理好数据,就会浪费和失去机会
2.2. 数据管理的主要驱动力也是使组织能够从其数据资产中获取价值
3. 目标
3.1. 理解并支撑企业及其利益相关方(包括客户、员工和业务合作伙伴等)的信息需求得到满足
3.2. 获取、存储、保护数据和确保数据资产的完整性
3.3. 确保数据和信息的质量
3.4. 确保利益相关方的数据隐私和保密性
3.5. 防止数据和信息未经授权或被不当访问、操作及使用
3.6. 确保数据能有效地服务于企业增值的目标
4. 基本概念
4.1. 数据也被理解为以数字形式存储的信息
-
4.1.1. 尽管数据不仅限于已数字化的信息,而且与数据库中的数据相同,数据管理的原则也适用于纸面上的数据
-
4.1.2. 个人事实信息可以被汇总、分析并用于营利,以及改善健康或影响公众政策等
-
4.1.3. 数据是这个世界中与某个事实结合在一起的一种真实表达
- 4.1.3.1. “事实”并不总是简单或直接的
-
4.1.4. 数据是一种表示方法,它代表的是除自身以外的事物
-
4.1.5. 数据既是对其所代表对象的解释,也是必须解释的对
-
4.1.6. 语境可被视为数据的表示系统,该系统包括一个公共词汇表和一系列组件之间的关系,如果知道这样一个系统的约定,就可解释其中的数据
-
4.1.7. 数据被称为“信息的原材料”
4.2. 要利用各种数据而不被其容量和增长速度所压倒,需要可靠的、可扩展的数据管理实践
4.3. 组织总是需要管理其数据,但技术变化扩展了这种管理的需求范围,因为它们已改变了人们对数据是什么的理解
- 4.3.1. 随着技术的迅速发展以及人类产生、获取和挖掘有意义数据能力的提升,加强有效管理数据变得十分必要
4.4. 信息则被称为“在上下文语境中的数据”
4.5. 金字塔模型用于分层描述位于底层的数据、信息、知识与位于顶层的智慧之间的关系
4.6. 金字塔有助于描述数据需要良好管理的原因,但这种表示方式为数据管理带来了几个异议
-
4.6.1. 基于数据是简单存在的假设。但数据并不是简单存在,而是要被创造出来的
-
4.6.2. 将数据到智慧描述为一个自下而上的逐级序列,但未认识到创建数据首先需要知识
-
4.6.3. 金字塔模型意味着数据和信息是分开的,但事实上这两个概念是相互交织并相互依赖的
- 4.6.3.1. 数据是信息的一种形式,信息也是数据的一种形式
4.7. 数据是一种组织资产
-
4.7.1. 资产是一种经济资源,能被拥有或控制、持有或产生价值
-
4.7.2. 数据已经被广泛认可为一种企业资
-
4.7.3. 如今的组织依靠数据资产做出更高效的决定,并拥有更高效的运营
-
4.7.4. 想要保持竞争力的企业必须停止基于直觉或感觉做出决策,而是使用事件触发和应用分析来获得可操作的洞察力
- 4.7.4.1. 数据驱动包括认识到必须通过业务领导和技术专业知识的合作关系,以专业的规则高效地管理数据
5. 数据管理原则
5.1. 数据管理和其他形式的资产管理具有共同的特性
- 5.1.1. 数据管理也必须平衡战略和运营需求
5.2. 数据是有独特属性的资产
-
5.2.1. 数据是一种资产,但相比其他资产,其在管理方式的某些方面有很大差异
-
5.2.2. 数据资产在使用过程中不会产生消耗
5.3. 数据的价值可以用经济术语来表示
-
5.3.1. 将数据称为资产意味着它有价值
-
5.3.2. 虽然有技术手段可以测量数据的数量和质量,但还未形成这样做的标准来衡量其价值
5.4. 管理数据意味着对数据的质量管理
-
5.4.1. 确保数据符合应用的要求是数据管理的首要目标
-
5.4.2. 为了管理质量,组织必须了解利益相关方对质量的要求,并根据这些要求度量数据
5.5. 管理数据需要元数据
-
5.5.1. 管理任何资产都需要首先拥有该项资产的数据
-
5.5.2. 用于管理和如何使用数据的数据都称为元数据
-
5.5.3. 元数据源于与数据创建、处理和使用相关的一系列流程,包括架构、建模、管理、治理、数据质量管理、系统开发、IT和业务运营以及分析
5.6. 数据管理需要规划
5.7. 数据管理须驱动信息技术决策
- 5.7.1. 数据和数据管理与信息技术和信息技术管理紧密结合
5.8. 数据管理是跨职能的工作
5.9. 数据管理需要企业级视角
5.10. 数据管理需要多角度思考
- 5.10.1. 数据是流动的,数据管理必须不断发展演进,以跟上数据创建的方式、应用的方式和消费者的变化
5.11. 数据管理需要全生命周期的管理,不同类型数据有不同的生命周期特征
5.12. 数据管理需要纳入与数据相关的风险
-
5.12.1. 数据除了是一种资产外,还代表着组织的风险
-
5.12.2. 数据可能丢失、被盗或误用
-
5.12.3. 组织必须考虑其使用数据的伦理影响
-
5.12.4. 数据相关风险必须作为数据生命周期的一部分进行管理
5.13. 有效的数据管理需要领导层承担责任
- 5.13.1. 为了达到目标,不仅需要管理技巧,还需要来自领导层的愿景和使命
6. 数据与其他资产的区别
6.1. 实物资产是看得见、摸得着、可以移动的,在同一时刻只能被放置在一个地方
6.2. 数据不同,它不是有形的
6.3. 尽管数据的价值经常随着时间的推移而变化,但它是持久的、不会磨损的
6.4. 数据很容易被复制和传送,但它一旦被丢失或销毁,就不容易重新产生了
6.5. 数据是动态的,可以被用于多种目的
6.6. 数据被多次使用产生了更多的数据,大多数组织不得不管理不断提升的数据量和越来越复杂的数据关系
6.7. 数据也是组织了解自身的手段
-
6.7.1. 它是描述其他资产的元资产(meta-asset)
-
6.7.2. 它为组织的洞察力提供了基础
6.8. 大多数业务交易涉及信息交换
- 6.8.1. 大多数信息是以电子方式交换的,从而创建了一个数据流
7. 数据价值
7.1. 价值(Value)是一件事物的成本和从中获得利益的差额
7.2. 对于数据而言,无论是数据的成本还是利润都没有统一标准,这些计算会变得错综复杂
7.3. 每个组织的数据都是唯一的,因此评估数据价值需要首先计算在组织内部持续付出的一般性成本和各类收益
7.4. 获取和存储数据的成本
7.5. 如果数据丢失,更换数据需要的成本
7.6. 数据丢失对组织的影响
7.7. 风险缓解成本和与数据相关的潜在风险成本
7.8. 改进数据的成本
7.9. 高质量数据的优势
7.10. 竞争对手为数据付出的费用
7.11. 数据潜在的销售价格
7.12. 创新性应用数据的预期收入
7.13. 数据的价值是上下文相关的(对一个组织有价值的东西可能对另一个组织没有价值),而且往往是暂时的(昨天有价值的东西今天可能没有价值)
- 7.13.1. 在一个组织中,某些类型的数据可能会随着时间的推移而具有一致的价值
7.14. 重视数据,是重视数据管理活动的基础
8. 数据质量
8.1. 确保高质量的数据是数据管理的核心
8.2. 组织想要管理自己的数据是因为他们想要使用它,如果他们不能依靠这些数据来满足企业需求,那么收集、存储、保护和访问数据就是一种浪费
8.3. 通常假设数据是可靠且值得信任的,直到他们有确凿证据开始怀疑
- 8.3.1. 一旦他们不再相信数据可靠,重新获得信任就变得很困难
8.4. 低质量的数据会对这些决策产生负面影响
- 8.4.1. 低质量的数据对任何组织来说都是代价高昂的
8.5. 很多低质量数据的成本是隐藏的、间接的,因此很难测量
- 8.5.1. 其他如罚款等直接成本则是非常容易计算的
8.6. 低质量数据的成本主要来源
-
8.6.1. 报废和返工
-
8.6.2. 解决方法和隐藏的纠正过程
-
8.6.3. 组织效率低下或生产力低下
-
8.6.4. 组织冲突
-
8.6.5. 工作满意度低
-
8.6.6. 客户不满意
-
8.6.7. 机会成本,包括无法创新
-
8.6.8. 合规成本或罚款
-
8.6.9. 声誉成本
8.7. 高质量数据的作用
-
8.7.1. 改善客户体验
-
8.7.2. 提高生产力
-
8.7.3. 降低风险
-
8.7.4. 快速响应商机
-
8.7.5. 增加收入
-
8.7.6. 洞察客户、产品、流程和商机,获得竞争优势
8.8. 管理数据质量并不是一次性的工作
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
2024-02-22 读十堂极简人工智能课笔记09_读后总结与感想兼导读
2023-02-22 读Java实战(第二版)笔记17_反应式编程