案例分析–仅关注Bounce Rate是不够的
Bounce Rate (中文:跳出率【GA叫法】、蹦失率【宋星娱乐叫法】、1 – 二跳率【国内普遍叫法】、单页面访问率【百度统计叫法】)一直是本站搜索引擎来源的重要关键词之一。
从事网站分析的朋友们都清楚该度量在网站分析过程中的重要作用:了解用户在 Landing Page (登陆页) 的参与度,帮助网站优化页面,帮助优化流量来源。然而,如果 Bounce Rate 不值得信赖怎么办?
作为网站优化过程中的重要度量 Bounce Rate,一般是可靠的。但如果有问题的流量过来的话, Bounce Rate 就会受到污染,而失去可靠性。早在2007年10月,扫地老僧就撰文写过题为《购买流量总结》的文章,描述了问题流量对 Bounce Rate 的影响。
我简单的总结该文章内容:在不同时期从两个流量出售网站上购买流量后,一股流量使 Landing Page 的 Bounce Rate 达到 99.73%,一股流量使 Landing Page 的 Bounce Rate 达到 46.28%。作者深入分析结果是两股流量都没有价值,前者对页面的点击互动极少,后者对页面的点击互动不合乎常理。
这说明 Bounce Rate 是很容易被操纵的,我称之为“被管理”。通过虚假互动的作用,可以让它很高,也可以让它很低。
如果“设置”导入的流量不做任何行为,就可以让 Bounce Rate 升高;
如果“设置”导入的流量具有点击行为,就可以让 Bounce Rate 降低。
让我们看看两个页面的案例,来了解 Bounce Rate 在虚假互动影响下的“腐败”:
[ Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]
案例一:
在某年的4月至5月期间,某站的 Bounce Rate 只有66.92%,这是一个“非常好”的网站。这么好质量的网站,用户都关注了什么内容呢?我把 Top 10 Content 的数据导出来(考虑到隐私,我把页面URI进行了适当的省略):
网页 | 综合浏览量 | 唯一身份综合浏览量 |
/200904/family/holiday.html | 90387 | 90318 |
/200904/family/index.html | 55107 | 53032 |
20081225039201_shtml | 2541 | 2510 |
20081218035601_shtml | 2494 | 2446 |
20090422045701_shtml | 2459 | 2458 |
bottomfile_hzhb_shtml | 2194 | 2172 |
bottomfile_gyhc_shtml | 2109 | 2088 |
bottomfile_tgzn_shtml | 2074 | 2056 |
bottomfile_ggfw_shtml | 2068 | 2046 |
bottomfile_sytk_shtml | 2061 | 2034 |
这些红色字体的内容是什么呢?经查验,大量的互动行为都点击在页面底部的:合作伙伴(hzhb)、投稿指南(tgzn)、广告服务(ggfw)、使用条款(sytk) ……
所以一切都非常逻辑清晰了:绝大部分流量都是没有价值的、作弊的!尽管有大量的互动点击行为,Bounce Rate “被”降低,可是这些互动行为都不合常理地点击页面的底部。
[ Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]
案例二
在案例一中,虚假互动行为全部集中在页面的底部。我们知道页面“头部Header”与“底部Footer”往往是一个网站共用的。这样虚假的流量通过“设置”后,无论登陆该站哪个指定页面都能进行统一的“一套虚假互动”,从而使整个大站下的所有 Landing Page 页面 Bounce Rate 得到“被优化”。
案例二将描述更高明的虚假互动。按照常理,一个页面最受欢迎且最容易被点击的内容都在第一二屏。所以作为 Landing Page ,页面中的大部分点击行为都会集中在页面的中上部。下边是我引用的Google的标准点击热图(Heat Map)。
与案例一不同,这个案例的 Bounce Rate 一点也不出众。打开GA,查看其 Bounce Rate 有87.88%,而且一直非常的稳定,这是不容易引起人们注意的。然而,最危险的欺骗,往往是在最平凡的外表下的。起初没有发现这页面的问题所在,可是当对 Landing Page 进行 Heat Map 分析的时候,问题出现了:
用户在点击推广广告,来到 Landing Page 后的互动行为中最受欢迎的10大点击链接如下表,分散地点击在不同的位置上。
Top 10 Content | Hits | |
1 | XXX | 587 |
2 | XXXX | 523 |
3 | XXXXX | 387 |
4 | Xxxxxxxx | 328 |
5 | Xxxxxxxxx | 323 |
6 | Xxxxxxxxxx | 320 |
7 | Xxxxxxxxxxx | 313 |
8 | Xxxxxxxxxxxxx | 308 |
9 | Xxxxxxxxxxxxxx | 308 |
10 | xxxxxxxxxxxxxxx | 269 |
于是,我把这10大点击内容标注在页面上。结果发现,这些内容都是在页面中第三屏以下的内容。令人惊讶的是,排名第一的链接居然是页面的底部偏上。后来再仔细研究,第一屏与第二屏众多链接内容,居然没有一个能排进前20名。
所以逻辑已经清晰:虚假互动行为是可以“被管理”的,可以分散地“被点击”页面中的多个内容,Bounce Rate 也将会“被”降低。也就是说,实际的这个页面真正 Bounce Rate 至少有99%以上,之所有能够到87.88%,完全是虚假互动行为所致。
[ Tenly Wu 版权所有欢迎转载,但请事先在下方评论知会作者,并注明出处]
有人问:也许第一二屏的内容的确就不吸引人,下面的内容就足够的吸引人。事实上,在实际案例背后,分析师还有项目的更多佐证信息帮助研究判断,在此有限篇幅就不作冗余说明。主要的思想是为了说明:虚假互动行为是能够“被管理”的。
聪明的你也许会想到,如果虚假互动行为“管理”得好,全部集中在第一二屏的话,Heatmap 研究估计就没有作用了。那还有没有一种有效的办法可以快速识别虚假互动呢?
有方法的!在我被“虚假互动”持续困扰一年后,通过Google Analytics工具,找到一个不错的方法。敬请关注下周文章:《新度量——深度互动时间》