05 2020 档案

摘要:为了将数据仓库设计过程中excel中设计的物理模型高效转换成标准的Hive建表语句,我用 python开发了如下的工具 createDdlSql.py: 功能:实现将excel中的物理模型转换成建表语句文件 输入:当前目录文件名为“数据模型.xls”或“数据模型.xlsx”的excel,模型结尾必须 阅读全文
posted @ 2020-05-30 14:07 夏天换上冬装 阅读(549) 评论(0) 推荐(0) 编辑
摘要:在实践数据仓库的建设中,越发感受到规范的重要性,总结出以下几点。 模型设计图 阅读全文
posted @ 2020-05-28 20:45 夏天换上冬装 阅读(173) 评论(0) 推荐(1) 编辑
摘要:环境:win10 +hadoop2.7.1,服务器hadoop2.6.0+spark2.2.1+hive1.1.0 代码: 1 import org.apache.spark.sql.Dataset; 2 import org.apache.spark.sql.Row; 3 import org.a 阅读全文
posted @ 2020-05-25 20:33 夏天换上冬装 阅读(3465) 评论(0) 推荐(0) 编辑