ABtest实验原理、流程、应用以及面试常问问题。

ABtest实验原理、流程、应用以及面试常问问题。ABtest 实验相关知识 abtest

大家好,欢迎来到IT知识分享网。

  • 大数定律:实验条件不变,随机实验重复多次,随机事件的频率可以近似为随机事件概率。
  • 对于独立同分布且具有相同期望和方差的n个随机变量,当样本量很大时,样本的均值近似服从标准正态分布N(0,1)。
    样本计算公式一般如下:
    ABtest实验原理、流程、应用以及面试常问问题。
    公式中,一般情况下,α=0.05,   z 1 − α 2 \ z_{1-\frac{\alpha }{2} }  z12α=1.96,α为犯第一类错误的概率,1-α为置信水平。β=0.2,   z 1 − β \ z_{1- \beta }  z1β=0.84,β为犯第二类错误的概率,统计功效定义为1-β。
      σ \ \sigma  σ为样本标准差,   δ \ \delta  δ代表实验组与对照组预期差值。
    当观测指标为绝对值类指标时:
    在这里插入图片描述





当观测指标为比率类指标时:
在这里插入图片描述
2、辛普森悖论
数据分组得到的结论与总体得到结论不一致,称为辛普森悖论。这一现象通常是由于流量分配不均匀导致的,因此需要均匀合理的分割流量。
流量分割常见的有分流和分层。
分流是按照地域、性别、年龄等把用户均匀地分为几个组,每个用户只能出现在1个组中。但这存在缺点不能同时做多个实验,效率比较低。
分层是同一份流量可以分布在多个实验层,也就是说同一批用户可以出现在不同的实验层,前提是各个实验层之间无业务关联,保证这一批用户都均匀地分布到所有的实验层里,达到用户“正交”的效果就可以。所谓的正交分层,其实可以理解为互不影响的流量分层,从而实现流量复用的效果。
3、显著性检验
对于样本数>30的通过使用Z检验,通过计算两组均值之差的z值和理论z值比较,判断两组之间的差异是否显著。
z值得计算:








  • 当观测指标为绝对值类指标时:
    ABtest实验原理、流程、应用以及面试常问问题。
  • 当观测指标为比率类指标时:
    ABtest实验原理、流程、应用以及面试常问问题。
  • 增加样本量:根据显著性检验的原理,只要实验组和对照组差值及样本方差不变的情况下,样本量足够大,我们总是可以得到显著性的结果。
    减少样本均值的方差:减少样本均值方差的方法有减少离群值的影响,缩减方差(CUPED)的方法。
  • 更换指标:更换一个方差更小的指标,比如某购物平台,实验指标一开始是用户购买的平均金额,我们可以更换为用户是否购买。对同一批样本,是否购买属于0-1分布,样本的均值方差自然比用户购买的平均金额小很多。
    参考文章
    【长文干货】AB测试:原理流程、实际案例及面试指南
    数据分析岗 | AB实验框架+高频考点(一)


免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/120100.html

(0)
上一篇 2025-10-31 21:20
下一篇 2025-10-31 21:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信