办公问答网

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 91|回复: 9

用Excel做相关性分析

[复制链接]

1

主题

3

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-1-17 14:54:51 | 显示全部楼层 |阅读模式
一、概念理解
相关关系:变量之间存在着的非严格的不确定的关系,对它们进行深层次的分析,观察它们的密切程度。

相关性分析:对变量之间相关关系的分析,即相关性分析。其中比较常用的是线性相关分析,用来衡量它的指标是线性相关系数,又叫皮尔逊相关系数,通常用r表示,取值范围是[-1,1],





二、实际应用
1、CORREL函数
在Excel中,可以用CORREL函数来计算相关系数,如我们对B列和C列进行分析,可以得到它的相关系数是0.95157,呈强相关。



2、数据分析
Excel里还可以用数据——数据分析——相关系数,这个功能来进行相关分析。数据分析这个功能怎么激活可以百度一下。



这里,我们可以对B C D三列一起进行分析,要注意的是,输入区域不能有非数值型数据,就是表头就不要包含了。



可以得到分析后的结果,列1、列2、列三分别对应B C D列,BC两列的相关系数是0.95157,和我们用CORREL函数计算出来的是一样的;BD两列的相关系数是0.832857,也是强相关;CD两列的相关系数是0.942791.



三、相关分析的呈现方式
还是刚才的数据,我们用折线图来呈现,很直观的可以看出来X1随着Y的增大而增大。呈正相关。



还可以用散点图来表示,横坐标是Y列值,纵坐标是X1列值,通过斜率的关系,可以看出它们呈正相关。



四、为什么要做相关分析
1、简单的相关性分析——如QC
做相关性分析,首先,很明显的一点是,了解两个或几个变量之间的关系,在做QC(质量管理)的时候,在要因确认这一项中会用到相关性分析,我们想要知道我们分析出来的末端因素和目标值之间有无相关关系,从而判断该末端因素对症结的影响程度。如随着工作人员培训次数的减少,产品合格率也降低,则说明工作人员培训不足呈强相关,是引起合格率降低的主要原因。

2、搭建模型时筛选有效的输入变量
原始数据有很多字段,但我们不一定全都将它们输入到模型中,这时要进行对输入变量的筛选,也可以提高分类模型的预测能力。输入的变量过多,可能会导致共线性问题,即输入的自变量之间存在较强的相关关系,多个自变量强相关,这显然是没有必要的,也浪费了资源和效率,只选择其中一个即可,因此用相关性分析可以避免共线性问题。当然解决共线性问题还有其他的方法,如主成分分析、聚类等,以后再细讲吧。

@文章属原创,转载请联系作者,侵权必究
@作者:可乐,在数据分析的道路上努力奔跑
@微信公众号:可乐的数据分析之路
@本文首发于CSDN博客,作者:data_cola

文章精选:
回复

使用道具 举报

1

主题

5

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2023-1-17 14:55:07 | 显示全部楼层
想问下这个函数的相关系数是偏相关系数还是秩相关系数?
回复

使用道具 举报

1

主题

5

帖子

6

积分

新手上路

Rank: 1

积分
6
发表于 2023-1-17 14:55:52 | 显示全部楼层
相关系数
回复

使用道具 举报

2

主题

6

帖子

10

积分

新手上路

Rank: 1

积分
10
发表于 2023-1-17 14:56:27 | 显示全部楼层
谢谢分享
回复

使用道具 举报

3

主题

10

帖子

18

积分

新手上路

Rank: 1

积分
18
发表于 2023-1-17 14:57:21 | 显示全部楼层
深入浅出,受益匪浅,谢谢干货分享!
回复

使用道具 举报

2

主题

11

帖子

11

积分

新手上路

Rank: 1

积分
11
发表于 2023-1-17 14:58:21 | 显示全部楼层
请问那相关系数的检验P值怎么得到呢
回复

使用道具 举报

0

主题

6

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-1-17 14:58:44 | 显示全部楼层
请问同样俩组数据,用这个函数公式求的相关系数和用散点图趋势线求的相关系数值为什么不一样呢?哪个更可靠?
回复

使用道具 举报

3

主题

13

帖子

22

积分

新手上路

Rank: 1

积分
22
发表于 2023-1-17 14:59:38 | 显示全部楼层
一个相关系数r,一个是决定系数R2
回复

使用道具 举报

3

主题

4

帖子

9

积分

新手上路

Rank: 1

积分
9
发表于 2023-1-17 14:59:54 | 显示全部楼层
一直纳闷非数值型数据报错是怎么回事,原来如此,谢谢谢谢
回复

使用道具 举报

1

主题

10

帖子

14

积分

新手上路

Rank: 1

积分
14
发表于 2023-1-17 15:00:42 | 显示全部楼层
请问一下,[思考]这两个功能计算的相关系数有什么区别呢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|办公问答网

GMT+8, 2025-7-6 18:51 , Processed in 0.094826 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc. Templated By 【未来科技 www.veikei.com】设计

快速回复 返回顶部 返回列表