您的位置:首页 >精选要闻 > 严选问答 >

线性相关系数r的计算公式是什么

导读 【线性相关系数r的计算公式是什么】线性相关系数(通常用符号 r 表示)是衡量两个变量之间线性关系密切程度的统计指标。它的取值范围在 -1 到 1 之间,数值越接近 1 或 -1,表示两变量之间的线性相关性越强;数值接近 0 则表示相关性较弱或无明显线性关系。

线性相关系数r的计算公式是什么】线性相关系数(通常用符号 r 表示)是衡量两个变量之间线性关系密切程度的统计指标。它的取值范围在 -1 到 1 之间,数值越接近 1 或 -1,表示两变量之间的线性相关性越强;数值接近 0 则表示相关性较弱或无明显线性关系。

线性相关系数 r 的计算公式有多种表达方式,但核心思想是基于两个变量的协方差与各自标准差的比值。以下是对该公式的详细总结及表格展示。

一、线性相关系数 r 的基本定义

线性相关系数 r 的计算公式为:

$$

r = \frac{\sum{(x_i - \bar{x})(y_i - \bar{y})}}{\sqrt{\sum{(x_i - \bar{x})^2} \cdot \sum{(y_i - \bar{y})^2}}}

$$

其中:

- $ x_i $ 和 $ y_i $ 是两个变量的观测值;

- $ \bar{x} $ 和 $ \bar{y} $ 分别是 $ x $ 和 $ y $ 的平均值;

- 分子是两变量的协方差;

- 分母是两变量标准差的乘积。

二、线性相关系数 r 的计算步骤

步骤 内容说明
1 收集两组数据 $ (x_1, y_1), (x_2, y_2), ..., (x_n, y_n) $
2 计算 $ \bar{x} = \frac{1}{n}\sum x_i $ 和 $ \bar{y} = \frac{1}{n}\sum y_i $
3 计算每个数据点的 $ (x_i - \bar{x}) $ 和 $ (y_i - \bar{y}) $
4 计算分子:$ \sum{(x_i - \bar{x})(y_i - \bar{y})} $
5 计算分母中的两个平方和:$ \sum{(x_i - \bar{x})^2} $ 和 $ \sum{(y_i - \bar{y})^2} $
6 将分子除以分母的平方根,得到 r 的值

三、线性相关系数 r 的意义

r 值 含义
1 完全正相关
0.8~1 强正相关
0.5~0.8 中等正相关
0.3~0.5 弱正相关
0 无线性相关
-0.3~-0.5 弱负相关
-0.5~-0.8 中等负相关
-0.8~-1 强负相关
-1 完全负相关

四、注意事项

- 线性相关系数 r 只能反映线性关系,不能说明因果关系。

- 数据中存在异常值可能对 r 的计算结果产生较大影响。

- 当样本量较小或数据分布不均匀时,r 的稳定性会降低。

五、总结

线性相关系数 r 是一种重要的统计工具,用于衡量两个变量之间的线性关系强度和方向。通过上述公式和步骤,可以有效地计算出 r 的值,并根据其大小判断变量之间的相关性。在实际应用中,应结合具体数据背景进行分析,避免误读或误导性结论。

项目 内容
公式 $ r = \frac{\sum{(x_i - \bar{x})(y_i - \bar{y})}}{\sqrt{\sum{(x_i - \bar{x})^2} \cdot \sum{(y_i - \bar{y})^2}}} $
范围 -1 到 1
意义 衡量两个变量之间的线性相关程度
用途 用于数据分析、回归分析、预测建模等

如需进一步了解相关系数的使用场景或如何在 Excel 或 Python 中计算,可继续提问。