大家好,欢迎来到IT知识分享网。
 
- 大数定律:实验条件不变,随机实验重复多次,随机事件的频率可以近似为随机事件概率。
 - 对于独立同分布且具有相同期望和方差的n个随机变量,当样本量很大时,样本的均值近似服从标准正态分布N(0,1)。
样本计算公式一般如下:
公式中,一般情况下,α=0.05, z 1 − α 2 \ z_{1-\frac{\alpha }{2} } z1−2α=1.96,α为犯第一类错误的概率,1-α为置信水平。β=0.2, z 1 − β \ z_{1- \beta } z1−β=0.84,β为犯第二类错误的概率,统计功效定义为1-β。
σ \ \sigma σ为样本标准差, δ \ \delta δ代表实验组与对照组预期差值。
当观测指标为绝对值类指标时:
 
当观测指标为比率类指标时:
 
 2、辛普森悖论
 数据分组得到的结论与总体得到结论不一致,称为辛普森悖论。这一现象通常是由于流量分配不均匀导致的,因此需要均匀合理的分割流量。
 流量分割常见的有分流和分层。
 分流是按照地域、性别、年龄等把用户均匀地分为几个组,每个用户只能出现在1个组中。但这存在缺点不能同时做多个实验,效率比较低。
 分层是同一份流量可以分布在多个实验层,也就是说同一批用户可以出现在不同的实验层,前提是各个实验层之间无业务关联,保证这一批用户都均匀地分布到所有的实验层里,达到用户“正交”的效果就可以。所谓的正交分层,其实可以理解为互不影响的流量分层,从而实现流量复用的效果。
 3、显著性检验
 对于样本数>30的通过使用Z检验,通过计算两组均值之差的z值和理论z值比较,判断两组之间的差异是否显著。
 z值得计算:
- 当观测指标为绝对值类指标时:
 - 当观测指标为比率类指标时:
 
- 增加样本量:根据显著性检验的原理,只要实验组和对照组差值及样本方差不变的情况下,样本量足够大,我们总是可以得到显著性的结果。
减少样本均值的方差:减少样本均值方差的方法有减少离群值的影响,缩减方差(CUPED)的方法。 - 更换指标:更换一个方差更小的指标,比如某购物平台,实验指标一开始是用户购买的平均金额,我们可以更换为用户是否购买。对同一批样本,是否购买属于0-1分布,样本的均值方差自然比用户购买的平均金额小很多。
参考文章
【长文干货】AB测试:原理流程、实际案例及面试指南
数据分析岗 | AB实验框架+高频考点(一) 
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/120100.html
                

