随笔分类 - 大数据
摘要:很多时候我们需要把excel数据需要导入数仓,每次有新数据就需要重新开发模板,或者需要对某个数据进行校验时就需要重新修改代码,鉴于这种现状,我个人觉得可以通过规则引擎很好的解决这个问题,此文只是线下导数系统的开头,主要是对Urule集成Springboot的一个例子。 Urule规则引擎在使用时分为
阅读全文
摘要:为了方便使用Spark的同学提交任务以及加强任务管理等原因,经调研采用Livy比较靠谱,下图大致罗列一下几种提交平台的差别。 本文会以基于mac的单机环境搭建一套Spark+Livy+Hadoop来展示如何提交任务运行,本文只针对框架能够运行起来,至于各个组件参数怎么配置性能更好,各位兄弟就自行找度
阅读全文