摘要:
1、数据仓库搭建 数据仓库搭建 前提条件,Hadoop,hive 数据仓库分层作用1、控制数据访问权限2、减少重复计算,减少重复开发3、为了更好的管理数据4、让表使用者更方便使用数据 数据规范1、分词规范,ODS,DWD,DWS,ADS,DIM,每个公司分层的方式是不一样的,2、命令规范,库命名规范 阅读全文
posted @ 2022-08-24 19:51 liudehaos 阅读(102) 评论(0) 推荐(0) 编辑
|
|||
摘要:
1、数据仓库搭建 数据仓库搭建 前提条件,Hadoop,hive 数据仓库分层作用1、控制数据访问权限2、减少重复计算,减少重复开发3、为了更好的管理数据4、让表使用者更方便使用数据 数据规范1、分词规范,ODS,DWD,DWS,ADS,DIM,每个公司分层的方式是不一样的,2、命令规范,库命名规范 阅读全文
posted @ 2022-08-24 19:51 liudehaos 阅读(102) 评论(0) 推荐(0) 编辑
摘要:
一、TopN问题 需要确定使用什么排名函数,包含三种函数:row_number()、rank()、dense_rank() 每个班级的分数为前3名的学生 1 --建表语句 2 create table score(sid string, class string, score int) 3 row 阅读全文
posted @ 2022-08-24 14:41 liudehaos 阅读(266) 评论(0) 推荐(0) 编辑
摘要:
hs面试总结: 1 服务器传输命令 -- scp -r ./** node1:`pwd` -- 远程文件拷贝程序,是secure copy program的的缩写 -r (递归) 2. 查看服务器运行情况以及cpu,运用哪个命令 top:查看服务器各个进程情况 df -h:linux查看系统内存(硬 阅读全文
posted @ 2022-08-24 10:07 liudehaos 阅读(38) 评论(0) 推荐(0) 编辑 |
|||