六、Kafka 用户日志上报实时统计之分析与设计

一、项目整体概述

  • 简述项目的背景

背景:
用户行迹
企业运营

  • 分析项目的目的
通过对项目的分析,可以初步得到以下目的:
•实时掌握用户动态
•根据实时统计结果,适度推广
•统计分析效果,快速合理的调整

二、Producer 模块分析

  • 分析生产数据来源
在用户上报日志中,每条日志记录代表用户的一次活动状态,示例数据如下:
 
121.40.174.237 yx12345 [21/July/2015 13:25:45 +0000] chrome
 
appid_5 "http://www.***.cn/sort/channel/2085.html"
 
示例数据所包含的信息量,如下图所示:
 

 

  • Flume 到 Kafka 流程分析
数据源生产流程分析,如下图所示:

 

三、Consumer 模块分析

  • 消费数据来源分析
消费数据源统计的KPI指标,如下图所示:
 

 

  • Kafka 到 Storm 流程分析
数据源消费流程分析,如下图所示:
 

 

四、项目整体设计

1.项目详细设计流程

项目详细设计流程,如下图所示:

2.KPI 指标设计

KPI 指标设计,如下图所示:
 
本节我们项目进行了整体分析,并指导大家去分析 Kakfa 的 Producer 模块和 Consumer 模块,以及帮助大家去设计项目的开发流程等知识,应该掌握以下知识:
•项目的背景和目的
•分析 Producer 模块和 Consumer 模块
•项目的整体开发流程
•KPI 指标的设计
 

posted on   pony1223  阅读(1341)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端
历史上的今天:
2017-10-13 JAVA提高三:反射总结

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示