博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

网站流量指标(10个)SQL草稿

1、网站流量指标(10个)
(1)UV
UV是指独立访客,表示不同的、通过互联网访问、浏览一个网页的用户。
UV是衡量用户“人数”的重要指标,能够反映来到网站的用户“数量”。
比如,一个访客从同一个IP地址来访问某个网站N次,访问次数记为N,但UV(独立访客数)= 1。
此外,UV的定义只与时间有关,与其他任何行为都无关。

final:
select count(1) from
(select DISTINCT user_id from youpin_sys_analysis.oneday_system_response where user_id is not null) as a;

(2)PV
PV是指页面浏览量。用户每一次对网站中的某个页面访问均被记录1次。
用户对同一个页面的多次访问,访问量累计。
PV的本质是衡量页面被浏览的“绝对数量”。

final:
select count(0) from youpin_sys_analysis.oneday_system_response where event_name is not null;

(3)Visit
Visit是指访问次数。该指标反映了有多少“人次”来到网站。
Visit与UV相结合可以评估网站来了多少“人”,且黏性如何。
例如,一个网站每天的UV是10,但访问数是300,反映了该网站的每个UV可以带来30次访问。
Visit的定义与UV类似,只是Visit的默认定义时间不是1天,而是30分钟,
即用户在30分钟内重复打开网站,Visit只计为1;
若超过了30分钟,则将该次访问记录为一个新的访问。
所以,一个UV可以产生多个Visit。

fianl:
select count(0) from
(select user_id,substring(start_datetime,1,13) time_hour,
case when substring(start_datetime,15,2)/30>1 then 1 else 0 end hour_part
from youpin_sys_analysis.oneday_system_response
group by user_id,time_hour,hour_part)a;

(4)新访问占比
新访问占比 = 新访问量 / (新访问量 + 老访问量)。
新访问占比是用来定义所有访问中新访问的占比情况,反映了站外渠道或网站吸引新用户的能力。
新访问占比高意味着市场扩大和新用户不断进入。
所以,新访问占比是评估站外引流效果的重要指标,对于以吸引新用户关注为目的的渠道具有重要意义。
在新访问占比的公式中,新访问量是指之前没有访问记录,第一次访问该网站的用户数量。
如果用户在当天既有第一次访问,又产生了第二次访问,则新访问量和老访问量同时增加1。

粒度:每天
新访问量:首次访问量
老访问量:非首次访问量

--过滤出每天的数据
create table one_day as
select * from youpin_sys_analysis.oneday_system_response where substring(start_datetime,1,10) =''

--每人的首次visit记录
select user_id,substring(mi,1,13) time_hour,
case when substring(mi,15,2)/30>1 then 1 else 0 end hour_part from
(select user_id,min(start_datetime) mi from youpin_sys_analysis.oneday_system_response group by user_id) as a
group by user_id;

--每人的visit记录
select user_id,substring(start_datetime,1,13) time_hour,
case when substring(start_datetime,15,2)/30>1 then 1 else 0 end hour_part
from youpin_sys_analysis.oneday_system_response
group by user_id,time_hour,hour_part;

--占比
select
(select count(1) from
(select user_id,substring(mi,1,13) time_hour,
case when substring(mi,15,2)/30>1 then 1 else 0 end hour_part from
(select user_id,min(start_datetime) mi from youpin_sys_analysis.oneday_system_response group by user_id) as a
group by user_id)b)/
(select count(1) from
(select user_id,substring(start_datetime,1,13) time_hour,
case when substring(start_datetime,15,2)/30>1 then 1 else 0 end hour_part
from youpin_sys_analysis.oneday_system_response
group by user_id,time_hour,hour_part)a);

 

(5)实例数
实例数是一个特殊的流量指标,它用来衡量站内自定义对象的触发次数(如某个按钮、某个功能区、某个下拉菜单等的触发次数)。
实例数的计数原理是每次监测的代码触发一次,则实例数增加1。
比如,网站设置点击某个功能区为自定义对象,该功能区今日被点击50次,则关于该功能区的实例数为50。

粒度:小时
实例:我的举报

test:
select distinct event_name from youpin_sys_analysis.system_response where event_name is not null;

final:
select substring(start_datetime,1,13) time_hour,count(*)
from youpin_sys_analysis.oneday_system_response
where event_name = 'MyReport' group by time_hour;

(6)访问深度
访问深度 = PV(或UV) / 访问次数。
访问深度是衡量用户访问质量的重要指标,是指用户在一次浏览网站的过程中,所浏览的网站的页数,可以用来评估用户看了多少个页面。
访问深度越大意味着用户对网站的内容越感兴趣。
不过,访问深度不一定总是越高越好,访问深度过高可能意味着用户在网站中迷失了方向而找不到目标内容。

粒度:每天

PV/UV
select
(select count(0) from youpin_sys_analysis.oneday_system_response where event_name is not null)/
(select count(1) from
(select DISTINCT user_id from youpin_sys_analysis.oneday_system_response where user_id is not null) as a)

UV/访问数:
select
(select count(1) from
(select DISTINCT user_id from youpin_sys_analysis.oneday_system_response where user_id is not null) as a)/
(select count(1) from
(select user_id,substring(start_datetime,1,13) time_hour,
case when substring(start_datetime,15,2)/30>1 then 1 else 0 end hour_part
from youpin_sys_analysis.oneday_system_response
group by user_id,time_hour,hour_part) a);

PV/访问数:
select
(select count(0) from youpin_sys_analysis.oneday_system_response where event_name is not null)/
(select count(1) from
(select user_id,substring(start_datetime,1,13) time_hour,
case when substring(start_datetime,15,2)/30>1 then 1 else 0 end hour_part
from youpin_sys_analysis.oneday_system_response
group by user_id,time_hour,hour_part) a);

(7)停留时间
停留时间包括两类,第一类是页面停留时间(下一个页面请求的时间戳 - 当前页面时间戳),
第二类是网站停留时间(在网站中最后一次请求的时间戳 - 第1次请求的时间戳)。
通过分析停留时间可以判断网站或某个页面对用户是否具有足够的吸引力。
但停留时间并不意味着用户真的“停留”或“浏览”,比如用户可能打开网页后离开计算机,或使用多Tab浏览器同时打开多个页面。

页面停留时间
last_page
next_page
leave_datetime
select * from youpin_sys_analysis.oneday_system_response

网站停留时间

(8)跳出率
跳出率 = 跳出的访问数量 / 落地页访问数量。
跳出是指用户在到达落地页之后,没有单击第二个页面就离开网站的行为。
跳出率则是指只浏览了一个页面就离开网站的访问次数占总访问次数的百分比。
通常来说,跳出率可以用来评估用户进入网站后的第一反应情况。
跳出率过高意味着站外流量的质量低,或者是网站的页面设计有问题,导致用户不愿意继续浏览。
不过,有些时候跳出率高并不一定是坏事,还需要结合当初设置这个页面的目标进行具体分析。
例如,某些电商网站的购物车或者结算页面,单击支付后会跳到第三方支付平台,那么这个网页的跳出率高属于正常现象。
而落地页是指访问者当前所处的特定页面。
在公式中,“跳出的访问数量”表示的是通过搜索关键词或单击站外链接进入网站仅浏览了第一个页面就离开的访问次数,该页面指的是落地页。
而“落地页访问次数”指的是用户访问落地页产生的所有访问次数。
简单来理解,跳出率就是指访问了入口页面(例如网站首页)就离开的访问量与所产生总访问量(包含跳出的,也包含进一步深入访问的)的百分比。

跳出的方式:
点击返回
点击主页


(9)退出率
退出率 = 当前页面退出的访问量 / 当前页面的总访问量。退出是指用户从网站离开,而没有进一步动作的行为。
退出率指的是在某个页面退出的访问量占该页面总访问量的比例。
通过退出率可以对网站页面进行分析。
如果一个页面的退出率比较高,则这个页面的内容或者是页面设计可能存在一些问题,使用户不愿意继续留存,这种时候就需要及时对页面进行相应的优化。
虽然页面的退出率越低越好,但某些特殊情况下出现高退出率也是正常的。
比如,网站中的客服页面,当用户的问题得到解答之后退出,也属于正常情况。
退出率和跳出率要做区分,跳出率仅针对是落地页(一般是网站打开后的第一个页面),而网站中的所有页面都有退出率。

退出的方式:
退出应用

(10)产品页转化率
产品页转化率 = 产品页访问次数 / 总访问次数。
通常情况下,用户要完成订单,需要先浏览产品页查看产品信息,确认产品信息之后才能继续购物车流程。
所以产品页转化率是用户订单转化过程中的重要指标。
在上述公式中,“产品页访问次数”是指产品页被访问的总次数,而“总访问次数”是指网站被访问的总次数。

posted @ 2022-08-22 21:03  CHANG_09  阅读(289)  评论(0编辑  收藏  举报