摘要: 一、前期准备 正确的数据观 详细的调研 数据域设计 二、建设方法论 识别三种对象 建设数据类目体系 设计主题域及类目体系 三、数据资产建设的步骤 产品选择 技术方案设计 数据资源了解 数据仓库模型设计 数据开发规划制定 数据仓库建设 数据应用支撑 阅读全文
posted @ 2020-10-22 20:36 lenomail 阅读(394) 评论(0) 推荐(0)
摘要: 数据源盘点 一、数据资源的分类 按数据格式划分:结构化、半结构化、非结构化数据 按存储形式划分:数据库、文件、流、数据服务 按数据描述内容划分:实体数据、交易数据、行为数据、统计结果数据 按数据归属地划分:内部数据、外部数据 按主题划分:企业业务的核心实体和业务过程进行划分 数据资源规划 基础数据 阅读全文
posted @ 2020-10-22 20:24 lenomail 阅读(315) 评论(0) 推荐(0)
摘要: HDFS架构 HDFS架构包含三个部分:NameNode,DataNode,Client。 NameNode:NameNode用于存储、生成文件系统的元数据。运行一个实例。 DataNode:DataNode用于存储实际的数据,将自己管理的数据块上报给NameNode ,运行多个实例。 Client 阅读全文
posted @ 2020-10-22 11:42 lenomail 阅读(386) 评论(0) 推荐(0)