大数据离线分析平台 需求分析(二)
一、数据展示系统(bigdata_dataapi)总述
bigdata_dataapi项目的主要目标有两个:第一个就是我们需要提供一个提供json数据的Rest API;另外一个目标就是提供一个展示结果的demo页面。bigdata_dataapi使用spring+mybatis+mysql来搭建提供rest api的项目框架,使用highcharts来进行demo页面的搭建。在本次项目中,我们将所有的API高度聚合,最终我们只会提供两个API,然后在API中根据参数的不同进行不同操作。
二、数据展示系统(bigdata_dataapi)结构
三、bigdata_dataapi展示页面介绍
概述
该文档的主要目标就是描述本次项目最终七个分析模块的界面展示。这里使用之前介绍的的数据展示界面mode。
工作流
在我们的demo展示中,我们使用jquery+highcharts的方式调用程序后台提供的rest api接口,获取json数据,然后通过jquery+css的方式进行数据展示。工作流程如下:
分析
1、总述
在本次项目中我们分别从七个大的角度来进行分析,分别为:用户基本信息分析模块、浏览器信息分析模块、地域信息分析模块、用户浏览深度分析模块、外链数据分析模块、订单分析模块以及事件分析模块。下面就每个模块进行最终展示的分析。
注意几个概念:
1. 用户/访客:表示同一个浏览器代表的用户。唯一标示用户
2. 会员:表示网站的一个正常的会员用户。
3. 会话:一段时间内的连续操作,就是一个会话中的所有操作。
4. Pv:访问页面的数量
5. 在本次项目中,所有的计数都是去重过的。比如:活跃用户/访客,计算uuid的去重后的个数。
2、用户基本信息分析模块
用户基本信息分析模块主要是从用户/访客和会员两个主要角度分析浏览相关信息,包括但不限于新增用户,活跃用户,总用户,新增会员,活跃会员,总会员以及会话分析等。下面就各个不同的用户信息角度来进行分析:
用户分析
该分析主要分析新增用户、活跃用户以及总用户的相关信息。
新访客:老访客(活跃访客中) = 1:7~10
会员分析
该分析主要分析新增会员、活跃会员以及总会员的相关信息。
会话分析
该分析主要分析会话个数、会话长度和平均会话长度相关的信息。
Hourly分析
该分析主要分析每天每小时的用户、会话个数以及会话长度的相关信息。
3、浏览器信息分析模块
在用户基本信息分析的基础上添加一个浏览器这个维度信息。
浏览器用户分析
同用户分析。
浏览器会员分析
同会员分析。
浏览器会话分析
同会话分析。
浏览器PV分析
分析各个浏览器的pv值。
4、地域信息分析模块
主要分析各个不同省份的用户和会员情况。
活跃访客地域分析
分析各个不同地域的活跃访客数量。
跳出率分析
分析各个不同地域的跳出率情况。
5、用户访问深度分析模块
该模块主要分析用户的访问记录的深度
6、外链数据分析模块
主要分析各个不同外链端带来的用户访问量数据。
外链偏好分析
分析各个外链带来的活跃访客数量。
外链会话(跳出率)分析
分析会话相关信息,并计算相关会话跳出率的情况。
7、订单数据分析模块
主要分析订单的相关情况
8、事件分析模块
在本次项目中,只选用一个事件案例进行分析,就是订单相关的一个事件分析。
RestAPI
一、概述
该文档的主要作用是为了开发人员参考可以参考本文档,了解bigdata_dataapi后台程序的开发方式以及rest api的提供方式。
二、程序后台执行工作流
工作流如下所示:
三、分析
1、API概述
bigdata_dataapi系统单独的提供一个rest api来获取数据,我们通过不同的参数来决定不同类型的分析数据调用。Rest api可以返回一个json格式的数据。数据格式如下:
{ "code": 200, "msg": "success", "data": [ { "$pv": 25, "date": "2015-12-12" }, { "$pv": 23, "date": "2015-12-11" } ] } |
在返回json格式的数据中,其中code是返回值,msg是描述信息,data是具体的分析数据数组,其中只有当code的值为200的时候,data才会有数据。Code值可选如下:
Code值 |
含义 |
200 |
成功 |
204 |
没有数据 |
500 |
服务器异常 |
2、具体API描述
在这里我们先不介绍具体的api格式,到我们做bigdata_dataapi的时候我们再填充文档。