Fork me on GitHub

实时--1.0 需求分析| 整体架构

 

1. 需求分析

离线T+1 需求

     一般是根据前一日的数据生成报表等数据,虽然统计指标、报表繁多,但是对时效性不敏感。
实时T+0 需求

    主要侧重于对当日数据的实时监控,通常业务逻辑相对离线需求简单一下,统计指标也少一些,但是更注重数据的时效性,以及用户的交互性。

即席需求

   临时需求,可用即席查询如Impala、Presto、 Kylin、 Druid等

关于日志埋点 发送的两种策略:

  ① 周期性发送,把一段时间的日志,积攒起来,周期性的发送到后台;对日志后台收集系统压力小;非实时

  ② 直接发送,时效性非常好,后台收集压力大;

1.1 实时需求

1、当日用户首次登录(日活)分时趋势图,昨日对比

从项目的日志中获取用户的启动日志,如果是当日第一次启动,纳入统计。将统计结果保存到ES中,利用Kibana进行分析展示

   日志服务器 --- Kafka --- Spark --- Hbase

   

2、当日新增付费用户(首单)分析(ods+dwd) 

按省份|用户性别|用户年龄段,统计当日新增付费用户首单平均消费及人数占比;无论是省份名称、用户性别、用户年龄,订单表中都没有这些字段,需要订单(事实表)和维度表(省份、用户)进行关联,形

成宽表后将数据写入到ES,通过Kibana进行分析以及图形展示。

   

3、订单明细实付金额分摊以及交易额统计(dws) 

   

4、ADS聚合及可视化(ads)  

  以热门品牌统计为案例

   

2. 统计架构图

2.1 实时架构

2.2 离线架构

    

 

posted @   kris12  阅读(583)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
levels of contents
点击右上角即可分享
微信分享提示