摘要:
01.Spark--安装Spark 01.下载安装包 spark-2.1.0-bin-hadoop2.7.tgz 以下是Spark的官方下载地址: https://www.apache.org/dyn/closer.lua/spark/spark-2.3.0/spark-2.3.0-bin-hado 阅读全文
摘要:
Kettle 版权声明:原创作品,谢绝转载!否则将追究法律责任。个人学习工作中的一些笔记和Demo,后期会继续补充和完善.未经本人允许谢绝转载。 作者:Steven(丁振春) 学习六重:重目标,重思路,重方法,重实践,重习惯,重总结。 Kettle 01.Kettle安装包(pdi-ce-8.2.0 阅读全文
该文被密码保护。 阅读全文
摘要:
项目具体技术简介 Kettle 缓慢变化维(拉链表):时间维度,脚本生成,时间维度生成之后不会变化,SCD问题我们使用拉链表来解决; Hive kettle:导出数据的工具 Spark SQL:计算引擎 Kylin:计算引擎,进行预计算之后的多维统计分析可以达到亚秒级别。 项目环境介绍 业务数据量 阅读全文
摘要:
Umeng项目day04 ###1.reddis引入确保硬件信息一致 收的ngix的Web服务器,用反向代理。做负载均衡。设备id号,要保证发送的机型是一致的。不能今天发送的和第二天发送的是不一致的,这样导致后面的数据没法统计。在这里做的时候需要保证数据是一致的。同时这个手机可以安装多个App.这里 阅读全文
摘要:
统计指标 ######版权声明:原创作品,谢绝转载!否则将追究法律责任。个人学习工作中的一些笔记和Demo,后期会继续补充和完善. 作者:Steven(丁振春) ######学习六重:重目标,重思路,重方法,重实践,重习惯,重总结。 1、概述 统计指标主要是统计设备数,因此所谓的用户活跃数也是指设备 阅读全文
摘要:
azkaban调度 ######版权声明:原创作品,谢绝转载!否则将追究法律责任。个人学习工作中的一些笔记和Demo,后期会继续补充和完善. 作者:Steven(丁振春) ######学习六重:重目标,重思路,重方法,重实践,重习惯,重总结。 1、概述 azkaban是一套调度系统,常用大数据作业调 阅读全文
该文被密码保护。 阅读全文
摘要:
hive自定义UDTF函数叉分函数 ######版权声明:原创作品,谢绝转载!否则将追究法律责任。个人学习工作中的一些笔记和Demo,后期会继续补充和完善. 作者:Steven(丁振春) ######学习六重:重目标,重思路,重方法,重实践,重习惯,重总结。 1、介绍 从聚合体日志中需要拆解出来各子 阅读全文
摘要:
hive数据仓库建设 ######版权声明:原创作品,谢绝转载!否则将追究法律责任。个人学习工作中的一些笔记和Demo,后期会继续补充和完善. 作者:Steven(丁振春) ######学习六重:重目标,重思路,重方法,重实践,重习惯,重总结。 1、设计原生日志表 原生日志表用来存放上报的原始日志, 阅读全文