摘要: 1、项目需求 (1)统计页面的浏览量PV 使用mapreduce统计 (2)统计各个省份的浏览量 省、市 ip统计 (3)统计页面的访问量 各个页面的访问量 url 各页面的ID 2、数据离线处理流程 (1)LogServer:很多的服务器(集群外) 前端客户在访问的时候,会请求日志并在LogSer 阅读全文
posted @ 2021-07-21 14:43 酱汁怪兽 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 1、用户行为日志概述 (1)每一次访问的行为(访问、搜索)产生的日志 点进来花了多少时间加入购物车、花了多少时间下单、花了多少时间支付,这些对电商品台都是很重要的。 (2)历史行为数据(已完成的订单) (3)综合(1)和(2),开始系统推荐 (4)推荐系统是为了订单的转化量 (5)浏览器设置 更多工 阅读全文
posted @ 2021-07-21 13:58 酱汁怪兽 阅读(610) 评论(0) 推荐(0) 编辑