摘要: 数据同步工具:离线同步 sqoop /DataX 实时同步 cannal/Flink CDC 权限管理(kerberos,CDH cloudmanager=> sentry ,HDP ambari=>ranger;其中后两者可以做到目录级别用户级别权限管理) 数据质量监控工具-Apache Grif 阅读全文
posted @ 2020-04-16 16:06 再见傅里叶 阅读(315) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/selfsojourner/article/details/80476741 星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高 雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,因此它 阅读全文
posted @ 2020-04-16 11:17 再见傅里叶 阅读(1352) 评论(0) 推荐(0) 编辑