登录  | 加入社区

黑狼游客您好!登录后享受更多精彩

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

查看: 382|回复: 0

4大方法,因果关系分析的总结,都在这了

[复制链接]

1010

主题

1010

帖子

0

现金

黑狼菜鸟

Rank: 1

积分
0
发表于 2020-12-24 04:04:47 | 显示全部楼层 |阅读模式 来自 法国

原标题:4大方法,因果关系分析的总结,都在这了

编辑导语:因果关系是一个变乱(即“因”)和第二个变乱(即“果”)之间的关系,此中后一变乱被以为是前一变乱的效果。一样平常来说,因果还可以指一系列因素(因)和一个征象(果)之间的关系。对某个效果产生影响的任何变乱都是该效果的一个因素。本文作者具体先容了数据分析方法中的因果关系推断,我们一起来看一下。

编辑导语:因果关系是一个变乱(即“因”)和第二个变乱(即“果”)之间的关系,此中后一变乱被以为是前一变乱的效果。一样平常来说,因果还可以指一系列因素(因)和一个征象(果)之间的关系。对某个效果产生影响的任何变乱都是该效果的一个因素。本文作者具体先容了数据分析方法中的因果关系推断,我们一起来看一下。

bgsLQbZZIb7Z40QG.jpg

因果关系推断,可以说是数据分析范畴最难的题目之一,辩论许多年也没有定论。常常同砚们被问到:“到底这个题目的缘故原由是什么!”都会以为分析起来很挠头,本日我们体系解说下。

常见方法1:拆解法

最常见的用来求因果关系的方法,是拆解法。把一个效果指标,从多个角度拆解,找到影响它的缘故原由。举例:昨天有4个推广渠道,一共获客100,本日只获客80,问为啥获客少了。

NIZppT0uUkuk0uMz.jpg

睁开全文

拆解法做法(如上图):

看起来答复的很完善,缘故原由找到了!

可这种答法经不起业务部分再问一句:那为什么A转化差了呢?

  • 我也没改文案呀?
  • 投放经费也没少呀?
  • 前后只差1天,为啥差别这么大?
  • 为啥只有A变差了,其他又稳定呢?

一个都答复不上来……

所谓的拆解法,本质上只是通过细分,锁定了题目发生的位置。并不能找到首恶。以是经常被用来发现题目,而不是表明题目(如下图)。

AXlLv2Wkxucvc2YW.jpg

常见方法2:相干系数法

统计学里有相干分析的方法。而且有个看起来很复杂公式(如下图)

Q8Z888tcynu0DT8w.jpg

许多同砚一看就来劲了!于是把两个指标带进去算相干系数,而且还随处百度

  • 相干系数0.99算不算大
  • 相干系数0.9算不算大
  • 相干系数0.8算不算大
  • 相干系数0.7算不算大
  • 反正相干系数充足大,就算是相干了!

这次有一个复杂的公式做支持,应该很科学了吧

这么搞,很轻易搞出来统计学范畴经典的“龙脉梗”

相干分析、回归分析、聚类分析,本质上不是“分析”,而是盘算。通过盘算,得出两列数字大概几列数字之间的关系。至于这个关系到底有没有寄义,盘算公式自己就不负责表明了。因此套到实际中常常搞出来各种奇葩效果。

全部的统计学方法都有雷同的题目,只能表明数据自己的关系,表明不了实际中的关系。更本质地看:是否全部业务举动,外部因素都能量化?完全不是。好比消耗者对品牌的信托,好比产物体验优劣,好比文案感受,是很难量化到一个稳固、可靠的指标的。因此,用统计学方法,可以大范围地筛选过滤指标,但是很难推理出真实因果。

dSnzZ7SNNvotqNTK.jpg

常见方法3:趋势分析法

既然复杂的方法欠好用,有没有简朴的办法?有!好比基于最质朴的感觉:既然A会引发B,那么A产生了B就该产生,A竣事了,B会逐步竣事(大概B死掉)。人们就此总结出了因果推断四大原则:

如许的推断,符合人们的直观逻辑。更紧张的是必要的数据少!只要一个指标走势就能看图语言了。以是非常好用。

yA6A27jq0U14Ag6Q.jpg

BUT,这么干有个很大的题目,就是无法剔除杂糅因素,只能观察到影响最大的谁人因素。更无法看到隐蔽在背后的深层因素。好比观察外因的时间,只能观察到气候、限行这种显着的因素;观察内因的时间,只能观察到贬价这种因素。其他小因素根本观察不到。

因此,这种方法经常用来做清除法,剔除不公道的捏词。好比:“你说气候欠好业绩就欠好,那为啥人家气候差还是有业绩!”至于到底推动业绩的因素是啥?不知道,还得用其他方法分析。

AY8VVM8vaTI8oysd.jpg

常见方法4:控制变量法

想剔除杂糅因素,最好的办法就是分组测试,把样本塞到密封箱子里,然后一组组地测试结果。好比我想测用户对差别文案相应率,理论上,我应该用同样的商品、代价、转化位置,选同一批人,同一个渠道,然后可以开测了:

kgZ0wWGw6DG03OW6.jpg

但是测试本领也有题目:

导致的效果,就是这种测试,得当即时反馈的+封闭信息渠道+个性化推送的场景。是滴,就是雷同打车软件、短视频软件的场景。轻微反馈速率慢一点,好比电商平台搞大数据杀熟,很轻易在消耗者换几个手机号登岸比价的时间被发现。末了照旧哪个自制买哪个……

RyNN4jj2ot71Myf2.jpg

为什么常见方法不管用

综上,我们会发现,在因果推断范畴,险些没有一种方法完全可靠,包罗许多经典的统计学方法和科学实行方法。为什么会如许?

由于本质上,企业谋划是个社会科学题目,不是天然科学题目。天然科学范畴,是有一些物理、化学、数学等底子原理支持的,这些原理是稳固、科学、可量化的,因此可以通过数据统计+科学实行,逐步地发现背后的天然规律。社会科学题目完全不是如许!社会科学题目自己就是多因素共同影响,轻易被人操控改变,感性且激动的。因此在社会科学范畴,很难直接套用天然科学的方法办理题目。

再加上,企业里上班的人,都是有态度、有态度、有计划的。当他们张嘴问:“这个题目到底是由于什么产生的?”大概问“这个功劳到底是由于什么出来的?”的时间,他们的潜意识里装的就是:功劳是我的,多少得蹭一点,锅都是别人的,硬甩也得甩出去。因此纵然有靠谱的方法,各人也不见得就乐意用,纵然有结论,各人也会找其他来由敷衍。

以是面临因果推断的时间,要认真区分题目场景。假如涉及:计划、生产、研发等客观性高一些的部分,可以用各种科学方法认真推断。假如涉及:营销、运营、产物、贩卖这些主观性高的部分,可以参考我之前文章里教的方法,逐步讨论。总之,联合贸易场景,详细题目详细分析,才是办理题目之道。

#专栏作家#

接地气的陈老师,微信公众号:接地气学堂,大家都是产物司理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相干履历。

题图来自Unsplash,基于CC0协议。返回搜狐,检察更多

责任编辑:





上一篇:四年花1.2亿美元文远知行CEO韩旭:2021年主动驾驶小巴会商用 ...
下一篇:原创韩国性感女歌手高调复出!“美艳蛇女”式穿衣风格会是本年的潮水吗? ...
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

 

QQ|申请友链|小黑屋|手机版|Hlshell Inc. ( 豫ICP备16002110号-5 )

GMT+8, 2024-4-28 05:24 , Processed in 0.195687 second(s), 47 queries .

HLShell有权修改版权声明内容,如有任何爭議,HLShell將保留最終決定權!

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表