办公问答网

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 115|回复: 1

【分析方法】业务为什么要听数据的?因为你用了他懂的Excel ...

[复制链接]

1

主题

8

帖子

11

积分

新手上路

Rank: 1

积分
11
发表于 2023-1-5 20:18:58 | 显示全部楼层 |阅读模式
说明1:标题只为引流,业务听不听数据的还是得看你的声量;
说明2:先使用,再探索,探索后,再使用。
在上一篇文章结尾,我强调“要在业务能理解、数据可解释的范畴之内”,进行分析。
这个感想源于至今让我印象深刻的一次汇报。故事是这样的:
确定了大节的营收目标后,业务想知道,需要多大的声量(日活),才能保证基本盘。
有一定经验的分析师知道,可以通过挖掘往年大节日活与营收的关系,进行预测:Excel的相关系数、趋势线功能就能实现。
当我在会上汇报基于这个方法做的数据时,有好几位商务部的同事都震惊了:Excel原来除了能够画图、数据透视之外,还能这么玩!
反过来,他们的震惊也让我感到震惊:一是业务对分析方法的熟练度堪忧,二是就算是常用的Excel,也有很多他们不知道的功能。甚至可以这么说:Excel中,有相当多的功能模块,十分强大好用,但鲜有人知。
这个被我在一定程度上精简夸大了的故事,是为了引出本文主题:
如何用Excel来进行方差分析,评估影响因素。
本文脉络,我在小白板上简单罗列了一下,如图1。



图1 行文结构一览

1、什么是方差分析?

方差分析,目的是为了检查多组之间均值是否相等。首先比较均值,然后用方差来“实锤”。
均值比较是前提,“方差”体现的是计算过程。因而,更准确的名字应该是“均值方差分析”。
“实锤”的过程,用数分黑话来讲,是将不同组之间的差异和组内的差异进行比较,根据比值下结论。
举个例子:
1班和2班分别有40名学生,同一个老师教数学。某次数学考试,成绩下来了,统计后发现,1班的平均成绩比2班高5分。
老师是否能说,1班比2班的数学成绩好吗?(是否存在这样的可能,因为成绩的波动性,恰巧让1班的成绩看起来更高?)
事实上,只有当1班和2班之间的成绩差异,和两个班合起来后总体成绩的差异,“大不相同”,才能得出“1班比2班的数学成绩好”的结论。
方差分析的计算过程如下(不感兴趣的可直接跳过,不影响整体阅读):
第一步,衡量变化程度,计算平方和,

  • 计算两个班的总体平方和,记为SST;
  • 分别计算两个班的平方和,进行相加,记为SSE(组内平方和);
  • 计算两个班之间的平方和,用SST-SSE得到,记为SSA(组间平方和)。
第二步,为消除数据量的影响,引入方差,

  • 组间方差MSA,等于SSA/(班级数-1);
  • 组内方差MSE,等于SSE/(1班学生数+2班学生数-班级数);
  • MSA/MSE大于某个特定值时(F检验临界值),接受原结论。
如果让我重回中学课堂,当老师再一次发出“现在的学生,真是一届不如一届”的感叹时,我一定会问他/她:“老师,下结论前,有做过方差分析吗?”
2、方差分析与AB测试的异同?

方差分析是实现AB测试的一种计算方法,后者囊括前者;两者都基于假设检验。
除了方差分析,AB测试还可以用T检验、Z检验进行计算。假设检验,即先假设结论成立,再去寻找支持结论的证据,如果找不到,就推翻这个假设。
有时我们会出错,原假设明明是对的,但是我们误以为它错了,导致“错杀好人”。
为了保证少犯这种错误,在寻找证据前,要明确这个阈值,一般是5%或1%。
3、如何开展方差分析?

我在工作中,曾经多次手算AB测试的假设检验全过程。真正地体会过,“有飞机大炮不用,非要去用石头长矛“的苦涩滋味。
在进行方差分析的时候,不必手算,Excel就是最好的“飞机大炮”。
拢共只需要三步,就能让业务心服口服:
“把功能加载出来;把数据框选进去;把结果输出出来。”
“把功能加载出来”

按照以下步骤加载Excel的分析功能:【文件】-【选项】-【加载项】-【转到】,在【加载项】文本框中,勾选【分析工具库】,点击【确定】,如图2。图2 加载分析工具库
重新打开Excel,在工具栏的【数据】模块的最右侧,出现【数据分析】选项,如图3。



图3 成功加载【数据分析】模块

单击出现数据分析子项目,选择【方差分析:单因素方差分析】,如图4。



图4 数据分析模块内容

“把数据框选进去”


单击后,出现图5选项框:



图5 单因素方差分析选项框


  • ①为框选数据输入的区域,组与组之间按不同列展示;
  • ②为是否框选了表头;
  • ③为犯错误的概率,默认5%;
  • ④为方差分析结果输出的区域。
“把结果输出出来”

单击确定后,输出如图6的结果,为1班和2班的数学成绩单因素方差分析。



图6 两个班级数学成绩单因素方差分析结果

结果分为两部分:“SUMMARY”的数据对比,“方差分析”的数据结论。在比较1班和2班的均值后,只需关注图中标红的3个指标:

  • F:组间方差与组内方差的比值;
  • P-value:F值对应的概率;
  • Fcrit:在指定显著性水平下,F检验中对应的临界值(查F表)。
那么,在什么时候,1班确实比2班的成绩好呢?
只有当:F>Fcrit,且P-value小于显著性水平的时候,才能“实锤”。
从图6显示,这两个条件均不满足,所以,老师不能得出1班的成绩比2班成绩好的结论。
4、方差分析应用举例

在以控制变量法为基础的AB实验中,比如权衡按钮的样式、调整推荐的策略、确定引流的文案等等,方差分析大有用武之地。
本部分是基于互联网场景进行复现,只为加深印象。如无需要,直接跳到第5部分。
以我曾经分析过的一个AB测试为例(仅关注数据结果部分):
背景是,分析不同颜色对按钮CTR是否有显著影响。对灰色和绿色两种方案,各随机分配了2组画像一致的人群:A、B组为灰色,C、D组为绿色。
颜色相同时,分析不同组之间是否有明显差异(如A与B),来判断实验分流的一致性;
颜色不同时,分析不同组之间是否有明显差异(如B与C),来判断颜色对CTR的影响。
如图7,为四组实验每天的CTR数据。如果要对所有组进行分析,总共需要分析6次。
简单起见,此处仅分析A与B、B与C的数据。



图7 4组实验每天的CTR数据

图8为A与B组的方差分析结果:



图8 A与B组的方差分析结果

由于F<Fcrit,P-value>0.05,A与B之间没有显著的差异,说明实验分流准确有效。
图9为B与C的方差分析结果:



图9 B与C组的方差分析结果

由于F>>Fcrit,且P-value<<0.05,B与C组之间存在显著差异,B组均值小于C组,说明绿色优于灰色。
5、对方差分析的评价

我第一次接触方差分析的时候,不了解背后的统计学知识,只知道通过关注标红的3个指标,就能得到结论。虽然云里雾里,应用得倒是乐此不疲。
如今,对计算过程和统计学原理有了初步的认识,知道结果是怎么来的。实际使用的时候,其实也和之前一样,只是关注这3个指标。
(多说一句,此处不是否认了解底层原理的重要性。使用方差分析,实际上需要满足3个重要前提,由于日常实验中基本满足,所以本文按下不表。)
这就是方差分析的好处:
你可能不需要它是怎么来的,你只需要它是怎么用的。
除此之外,很多东西都是如此:Excel分析库其他功能、Python包、Tableau分析库,手机、WIFI、VPN等等……
最后,再回到本文标题:业务为什么要听数据的?
因为你用了他天天在用的Excel,实现了他从未用过的方差分析,简单干脆地达到了目的。

-End-
回复

使用道具 举报

3

主题

9

帖子

18

积分

新手上路

Rank: 1

积分
18
发表于 2025-6-5 14:24:22 | 显示全部楼层
楼下的接上
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|办公问答网

GMT+8, 2025-7-5 05:00 , Processed in 0.082329 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc. Templated By 【未来科技 www.veikei.com】设计

快速回复 返回顶部 返回列表