Google Analytics中的两种数据采样

采样是Google Analytics处理大量数据时的一种方法。可以快速完成查询并生成所需报告。如果你的网站每个月有几百万的综合浏览量,就需要用到采样。Google Analytics中的采样分为客户端采样和报告采样两种。

客户端采样

默认情况下Google Analytics会追踪网站的所有流量。但当网站流量超过一定量时,会产生一些问题。

1 、超过Google Analytics数据库存储每日记录的上限。

2 、在报告中触发自动采样。

客户端采样是通过手动修改网站的追踪代码,按照预先设定的百分比直接从网站中收集采样数据的。实施起来很简单,在追踪代码中调用_setSampleRate()然后设置一个采样百分比作为参数就可以了。设置客户端采样后,Google Analytics将不在追踪网站的所有流量,而是按照设定的采样比例收集流量数据。

客户端采样代码:

1
2
pageTracker._setSampleRate('80');//传统追踪代码的采样设置,采样率80%
_gaq.push(['_setSampleRate','80']);//异步追踪代码的采样设置,采样率80%

客户端采样时一个不可逆的过程,当设置了采样后,配置文件及报告中将只显示采样后的数据。而网站中未被采集的数据将无法找回。所以,你可以试着将采样数据发送到一个配置文件中,而将未采样的原始数据保留在另一个配置文件中。

1
2
3
4
5
6
7
8
9
10
<!—Bluewhale GA tracking code begin-->
<script type="text/javascript" src="http://www.google-analytics.com/ga.js"></script>
<script type="text/javascript">
var pageTracker = _gat._getTracker("UA-1111111-1");
pageTracker._trackPageview();
var pageTracker = _gat.getTracker("UA-1111111-2");
pageTracker._setSampleRate('80');
pageTracker._trackPageview();
</script>
<!-- Bluewhale GA tracking code end-->

报告采样

 

采样提示信息报告采样是另一种采样方法,无论之前是否设置了客户端采样,当报告中的数据满足一定条件时,采样都会被自动触发。当报告采样被触发后,报告的顶部会出现黄色的采样通知。例如:当对报告中的超过50万访次的度量进行维度交叉细分时,报告采样就会被触发。同时在报告顶部有黄色标记提示:此时报告中的部分数据为采样数据。

在采样报告中,一部分值是系统的估算值,而另一部分值是真实值。例如:在下面的采样报告中,总访问次数和报告记分卡中的值是真实值,而维度组合和访次的详细报告值是估算值。

采样中的真实数据和估算数据

采样数据可信度

在采样报告的详细报告中,每个数据后面都会有一个置信区间来表示数据的可信度,一般分为三种情况,完全可信,在某个范围内可信,和不可信。区间范围的大小表示数据的可信度。置信区间越小表示数据越可信。当置信区间为0时表示数据没有经过采样或估算,完全准确。不过这种情况一般不会出现在采样报告中。

置信区间

在上图的采样报告中,第一个访次数据的置信区间显示大于0,表示已经很接近真实值了。第二个访次的数据是20,519,置信区间+/-2%,表示这个指标真实值的范围在20,109—20,929之间。

不可信采样数据

在某些情况下,采样报告的数据可信区间会显示为一个*号。这表示样本数据所占比例过小,这类数据不可信。(转:蓝鲸网站分析

posted @ 2011-08-05 14:02  肥刺猬  阅读(338)  评论(0编辑  收藏  举报