相关系数r的计算公式
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。下面小编为大家带来相关系数r的计算公式,希望对您有所帮助!
相关系数缺点
需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。
相关系数公式
定义式
ρXY=Cov(X,Y)/√[D(X)]√[D(Y)]
公式描述:公式中Cov(X,Y)为X,Y的协方差,D(X)、D(Y)分别为X、Y的方差。
公式
若Y=a+bX,则有:
令E(X) = μ,D(X) = σ
则E(Y) = bμ + a,D(Y) = bσ
E(XY) = E(aX + bX) = aμ + b(σ + μ)
Cov(X,Y) = E(XY) ? E(X)E(Y) = bσ
什么是相关系数
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
相关分析
相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。
在一段时期内出生率随经济水平上升而上升,这说明两指标间是正相关关系;而在另一时期,随着经济水平进一步发展,出现出生率下降的现象,两指标间就是负相关关系。
回归分析与相关分析的区别
1.进行相关分析时不必事先确定两个变量中哪个是自变量哪个是因变量,而进行回归分析时,则必须事先确定自变量和因变量。
2.相关分析中的两个变量都是随机变量,而回归分析中的两变量只有因变量是随机的,自变量是可以控制的量。
3.计算相关系数的两变量是对等的,改变两者的位置并不影响相关系数的数值,而回归分析中对于一种没有明显因果关系的两变量,可以求得两个回归方程,一个为为Y倚X的回归方程,另一个为X倚Y的回归方程
4.相关分析只能分析两变量的相关程度和方向,而回归分析要比相关分析更深入,更具体,它要分析因变量是如何随着自变量的变化而发生变化的。