用途
皮尔森相关系数用来反应两个变量线性相关
的程度,用 $r$ 表示。相关性分为以下三种:
- $r=0$:两个变量不相关。
- $r>0$:Y 与 X 呈正相关,即 Y 随着 X 的增大有增大的趋势。越接近 1,正相关程度越大。
- $r<0$:Y 与 X 呈负相关,即 Y 随着 X 的增大有减小的趋势。越接近 -1,负相关程度越大。
比如,在现实生活中,数据会倾向于认为,人们的消费水平和收入水平呈正相关。这时候就可以勇皮尔森系数去计算这个相关性。
数学计算
皮尔森相关系数一般用 $r$ 表示。该值越大,表明相关性越强。其定义为两个变量之间的协方差和标准差的商,即:
上述定义的是总体的相关系数,对于样本来说,通过估算样本的协方差和标准差,可以得到羊背皮尔森系数,常用小写字母 $r$ 表示,为:
代码
1 | # -*- coding: utf-8 -*- |
实验结果如下: