上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 45 下一页
摘要: 一、hbase数据模型 完整的官方文档的翻译,参考:https://www.cnblogs.com/simple-focus/p/6198329.html 1.rowkey 与nosql数据库们一样,row key是用来检索记录的主键。访问HBASE table中的行,只有三种方式: 1.通过单个r 阅读全文
posted @ 2018-03-01 20:38 ---江北 阅读(529) 评论(0) 推荐(0) 编辑
摘要: 一、概述 1.什么是Hbase 根据官网:https://hbase.apache.org/ Apache HBase™ is the Hadoop database, a distributed, scalable, big data store. HBASE是一个高可靠性、高性能、面向列、可伸缩 阅读全文
posted @ 2018-03-01 14:25 ---江北 阅读(607) 评论(0) 推荐(0) 编辑
摘要: 一、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型, 星型架构是一种非正规 阅读全文
posted @ 2018-02-28 18:26 ---江北 阅读(16824) 评论(1) 推荐(0) 编辑
摘要: 一、概述 数据模型是数据管理的分析工具和交流的有力手段;同时,还能够很好地保证数据的一致性,是实现商务智能(Business Intelligence)的重要基础。因此建立、管理一个企业级的数据模型,应该遵循标准的命名和设计规范。 二、命名规范 1.表属性规范 表名 ODS层表名 前缀为ODS_应用 阅读全文
posted @ 2018-02-28 16:40 ---江北 阅读(10896) 评论(0) 推荐(2) 编辑
摘要: 一、什么是数据模型 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。 数据仓库模型是数据模型中针对特 阅读全文
posted @ 2018-02-28 15:58 ---江北 阅读(1227) 评论(0) 推荐(0) 编辑
摘要: 一、简介 1.什么是数据仓库 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented )、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策和信息的全局共享。 //请熟练记忆 阅读全文
posted @ 2018-02-28 14:49 ---江北 阅读(1351) 评论(0) 推荐(0) 编辑
摘要: 推荐书籍:《网站分析实战——如何以数据驱动决策,提升网站价值》 相关随笔:http://blog.csdn.net/u014033218/article/details/76847263 一、网站点击流数据分析项目业务背景 1.什么是点击流数据 1.web访问日志 日志示例: 2.点击流数据模型 点 阅读全文
posted @ 2018-02-27 20:21 ---江北 阅读(5214) 评论(0) 推荐(1) 编辑
摘要: 一、概述 1.sqoop是什么 从其官网:http://sqoop.apache.org/ Apache Sqoop(TM) is a tool designed for efficiently transferring bulk data between Apache Hadoop and str 阅读全文
posted @ 2018-02-27 13:59 ---江北 阅读(495) 评论(0) 推荐(0) 编辑
摘要: 一、概述 很多时候,很多工具类其实spring中就已经提供,常用的工具类有: 参考:https://www.cnblogs.com/langtianya/p/3875103.html 内置的resouce类型 UrlResource ClassPathResource FileSystemResou 阅读全文
posted @ 2018-02-26 21:19 ---江北 阅读(2203) 评论(0) 推荐(0) 编辑
摘要: 一、概述 1.azkaban是什么 通过官方文档:https://azkaban.github.io/ Azkaban is a batch workflow job scheduler created at LinkedIn to run Hadoop jobs. Azkaban resolves 阅读全文
posted @ 2018-02-26 17:28 ---江北 阅读(956) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 45 下一页
TOP