随笔分类 -  数据仓库入门

摘要:Hive创建删除数据库和Mysql存在许多相似之处,也有一些不同之处 创建数据库 Create database lagou 查看数据库 Show databases 删除数据库 (1)删除空数据库 Drop datebase 数据库名 drop database 学生 (2)如果删除的数据库不存在 阅读全文
posted @ 2022-08-04 21:07 萧六弟 阅读(44) 评论(0) 推荐(0) 编辑
摘要:Hive简介 Hive是基于Hadoop的数据仓库工具,可以对存储在HDFS上的文件数据集进行查询和分析处理。可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询语言 HiveQL,在做查询时将HQL语句转换成MapReduce任务,在Hadoop层进行执行。主要用途:做离线数据分析,比直接 阅读全文
posted @ 2022-07-30 16:09 萧六弟 阅读(85) 评论(0) 推荐(0) 编辑
摘要:1.数据治理 企业数据治理的重点与难点就是在于如何落地。数据治理不仅仅是一个技术问题,而是一个复杂的、系统性的管理问题! 数据治理是一个宽泛的概念,只要有数据的地方,就会存在数据治理的问题,由于历史原因,我们已经上了一个又一个的系统,我们可以选择从源头介入来进行治理,但这样的难度非常大,成本非常高, 阅读全文
posted @ 2022-07-30 11:38 萧六弟 阅读(240) 评论(0) 推荐(0) 编辑
摘要:1.什么是数据仓库? 数据仓库,英文名称Data Warehouse,简写为DW。数据仓库顾名思义,是一个很大的数据存储集合。 出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。 数据仓库 阅读全文
posted @ 2022-07-29 22:15 萧六弟 阅读(255) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示