AB实验基本流程

    知识点
        基本流程
        实验分层问题
        最小样本量计算
            均值类
            比值类
        SRM检验
        指标检验
            比值类
            均值类
        关于统计检验显著性问题
        参考资料

基本流程

确定基本流程和假设，确认做这个功能是为了提升/降低什么指标。
开发相关功能
设计分层实验，进行流量分配。通过PowerAnalysis计算最小样本量。
实验达到最小样本量后，进行SRM检验，检验分流是否符合预期，若不符合预期，则回去检查分流系统正确性。
若通过SRM检验，进行效果分析，得出实验结论。

实验分层问题

流量正交要求层与层之间必须相互独立。
同一层可以有多个实验，但流量不能有交集。
一般采用MD5哈希算法来进行ID的分流。

　　4. 流量分配采用先上小流量，再上大流量的方法进行。

最小样本量计算
均值类
实验采用双边检验，原假设如下：

H0:μA−μB=0
H1:μA−μB<>0

样本计算公式如下：

nA=knB  nB=(1+1/k)(σ( $z$ )/(μA−μB))²

    其中， μ B 是当前的数据， μ A 是预期改进后的数据值。k为 n A 和 n B的比值，这个值一般情况下，我们都默认为1，即AB两组样本量相等，方便做严谨的实验对比， σ 需要根据历史数据估计。
    因此，计算均值类指标的最小样本量需要如下变量
        α ，显著性水平
        β ，第二类错误
        δ，预期提升值( μ A − μ B)
        σ , μ B，历史均值和标准差

同样的，根据已有的参数，我们也可以估计统计的功效 β \beta β是多少，若功效不足，也无法得到实验结论：

比值类

实验采用双边检验，原假设如下：

H0:pA−pB=0
H1:pA−pB≠0

样本计算公式如下：

    其中， p B B是当前的数据， p A是预期改进后的数据值。k为 n A和 n B的比值，这个值一般情况下，我们都默认为1，即AB两组样本量相等，方便做严谨的实验对比，跟均值有所不同的是，比值类无需计算方差。
    因此，计算均值类指标的最小样本量需要如下变量
        α ，显著性水平
        β ，第二类错误
        δ，预期提升值( p A − p B )
        p B ，历史均值

同样的，根据已有的参数，我们也可以估计统计的功效 β \beta β是多少，若功效不足，也无法得到实验结论：

    在计算得到最小样本量公式后，根据流量的分配及每日流入的用户数，估算需要天数。理论上需要涵盖完整行为周期(视情况而定，有一定的时间成本)。

SRM检验

    Sample Ratio Mismatch Test，简称样本分流不一致检验。主要检验实验人数分流是否符合预期。
    卡方检验：
        卡方检验，主要有两种用途。1. 推断总体分布与期望分布是否一致。 (test of goodness-of-fit) 2. 推断两个分类变量是否相关或独立。(test of independence/homogenetity) 实验中，主要用来做第一种检验。
        其原假设为：观察频数与期望频数没有差别。
        计算公式：