上一页 1 2 3 4 5 6 7 8 9 10 ··· 15 下一页
摘要: •技术元数据:存储位置、数据模型、数据库表、字段长度、字段类型、ETL脚本、SQL脚本、 接口程序、数据关系等•业务元数据:业务定义、业务术语、 业务规则、业务指标等•管理元数据:数据所有者、数据质量定责、数据安全等级等。 描述数据的数据 数据 业务元数据(描述数据定义的数据) 1. 企业数据标准; 阅读全文
posted @ 2024-01-08 14:17 粒子先生 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 一、数据治理中的核心元素——元数据 元数据(metadata)是关于数据的组织、数据域及其关系的信息,简单来说,元数据就是被用来描述数据的数据。 数据治理的前提是要有数据,并且要求数据类型全、量大,并尽可能的覆盖数据流转的各个环节,而元数据是“所有系统、文档和流程中包含的所有数据的语境。是生数据的知 阅读全文
posted @ 2024-01-08 14:12 粒子先生 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 一、MOF的定义 MOF (Meta Object Facility) 称为元对象设施或者元对象机制,是OMG 组织为了帮助销售商、开发者和用户更好的使用元模型和元数据技术而制定的。 MOF最初是OMG( Object Management Group, 对象管理组织) 在1996年一个征求建议书( 阅读全文
posted @ 2024-01-08 14:10 粒子先生 阅读(181) 评论(0) 推荐(0) 编辑
摘要: [ { "category": "ENTITY", "guid": "00b4a314-1185-4cd4-84e9-20275990d58d", "createdBy": "hadoop", "updatedBy": "hadoop", "createTime": 1615973091411, " 阅读全文
posted @ 2024-01-08 13:41 粒子先生 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 预定义系统类型 Atlas自带了一些预定义的系统类型。我们在前面的部分中看到了一个示例(DataSet)。在本节中,我们将看到更多这些类型并了解它们的重要性。 Referenceable:该类型表示可以使用名为qualifiedName的唯一属性搜索的所有实体。 { "category": "ENT 阅读全文
posted @ 2024-01-08 13:40 粒子先生 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 注册hook 编辑sqoop‐site.xml,添加如下配置 <property> <name>sqoop.job.data.publish.class</name> <value>org.apache.atlas.sqoop.hook.SqoopHook</value> </property> 引 阅读全文
posted @ 2024-01-08 13:33 粒子先生 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 修改atlas-application.properties 添加atlas.hook.hive.synchronous=false atlas.hook.hive.numRetries=3 atlas.hook.hive.queueSize=10000 atlas.cluster.name=pri 阅读全文
posted @ 2024-01-08 13:32 粒子先生 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 简介 Atlas是Hadoop生态的元数据管理框架,有以下功能特性: 元数据类型:支持多种Hadoop和非Hadoop元数据的预定义类型,提供元数据定义新类型的能力,类型可以具有原始属性、复杂属性、对象引用,可以从其他类型继承。 分类:提供动态创建分类的能力,元数据实体可以与多个分类相关联,具有分类 阅读全文
posted @ 2024-01-08 13:29 粒子先生 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 转自:https://blog.csdn.net/zwgdft/article/details/83215977 Elasticsearch中的概念很多,本文将从笔者在实践过程中遇到的问题出发,逐步详细介绍 Global Ordinals 和 High Cardinality ,这也是笔者的认知过程 阅读全文
posted @ 2024-01-08 13:24 粒子先生 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 转自:https://cloud.tencent.com/developer/article/1361266 背景 Elasticsearch由一些Elasticsearch进程(Node)组成集群,用来存放索引(Index)。为了存放数据量很大的索引,Elasticsearch将Index切分成多 阅读全文
posted @ 2024-01-08 13:23 粒子先生 阅读(56) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 15 下一页