摘要: 17-网站流量日志分析-数据处理流程 18-网站流量日志分析-数据采集 19-网站流量日志分析-数据预处理 SOH为\001分隔符 20-网站流量日志分析-获取PageView表模型 21-网站流量日志分析-获取Visit表模型 2代表在session中访问了几个页面 22-网站流量日志分析-hiv 阅读全文
posted @ 2020-04-07 17:40 Curedfisher 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 15-网站流量日志分析-分析模型 16-网站流量日志分析-分析指标 阅读全文
posted @ 2020-04-07 14:56 Curedfisher 阅读(197) 评论(0) 推荐(0) 编辑
摘要: Day 07 1. Azkaban介绍 1.1. 为什么需要Azkaban 一个完整的数据分析系统通常都是由大量任务单元组成 shell脚本程序 java程序 mapreduce程序 hive脚本等 各任务单元之间存在时间先后及前后依赖关系, 为了很好地组织起这样的复杂执行计划, 需要一个工作流调度 阅读全文
posted @ 2020-04-07 14:44 Curedfisher 阅读(409) 评论(0) 推荐(0) 编辑
摘要: 10-sqoop入门介绍 11-sqoop安装 cd /export/servers/hadoop‐3.1.1/conf/ cp sqoop‐env‐template.sh sqoop‐env.sh vim sqoop‐env.sh export HADOOP_COMMON_HOME/export/ 阅读全文
posted @ 2020-04-07 06:57 Curedfisher 阅读(574) 评论(0) 推荐(0) 编辑