一篇图文:看懂相关性

一篇图文:看懂相关性相关性是描述客观事物相互间的联系 联系是普遍存在的 这种联系决定了事物间的相关性必然的束缚在时间与空间之中 纠缠在事物运动之间 不必吃惊 冰淇淋的销量与意外溺水死亡率成正比 因为夏天来了

大家好,欢迎来到IT知识分享网。

相关性是描述客观事物相互间的联系,联系是普遍存在的,这种联系决定了事物间的相关性必然的束缚在时间与空间之中,纠缠在事物运动之间;

不必吃惊:冰淇淋的销量与意外溺水死亡率成正比,因为夏天来了。

不必吃惊:啤酒与尿布的组合销售销量更好,因为人物关系有纠缠。

发现相关性不是一件坏事,发现相关性可以帮助我们预测未来,而发现因果关系意味着我们可以改变未来。

1,画点-看分布

从数据点的分布情况可以发现,自变量x和因变量y有着相同的变化趋势,当广告支出的增加后,销售收入也随之增加。二者存在正向的相关性

一篇图文:看懂相关性

2,画线-看走势

对于有明显时间维度的数据,我们选择使用折线图。销售收入与广告支出的走势趋势涨跌一致,可以看出广告支出的增加,销售收入也增加了;这是很明细的相关性。

一篇图文:看懂相关性

3,回归-看拟合

我们可以借助excel对广告支出与销售收入,做各种拟合,比如线性拟合,指数,对数,多项式等。这里简单做了一个线性拟合,从线性拟合函数及R方判定系数:0.8782 说明拟合的很好,数据存在正向的相关性。大家也可以借助R工具去拟合。经典案例:一元线性回归模型的销售预测

一篇图文:看懂相关性

4,如果不行-用公式:

4.1 协方差及协方差矩阵:

R中可以运用cov(data)方法,也可以通过Excel中COVAR()函数直接获得两组数据的协方差值。正值为正相关,0为不相关,负值为负相关;公式如下:

一篇图文:看懂相关性

4.2 相关系数的计算

pearson 相关系数,在R中可以运用cor()。

一篇图文:看懂相关性

4.3 信息熵及互信息

信息熵及互信息 常常用在决策的生长过程中。R中有entropy包可以计算,要求参数是离散值。

一篇图文:看懂相关性

library(infotheo) compute_fun<-function(x,y){ return(entropy(x)+entropy(y)-entropy(cbind(x,y))) } pvalue<-compute_fun(data[,1],data[,2]) 

5,各有千秋

每一种方法,各有千秋,结合场景灵活运用很重要,不要拘于方法案例。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/159292.html

(0)
上一篇 2025-01-16 15:26
下一篇 2025-01-16 15:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信