3.20: LOO回归

1 删一法回归

有许多统计程序——残差分析、折刀方差估计、交叉验证、两步估计、保留样本评估——它们利用在子样本上构建的估计器。特别重要的是我们排除单个观察然后对所有观察重复此操作的情况。这称为删一法 (LOO) 回归。

具体来说,回归系数 β 的删一估计量是使用不包括单个观测值 i 的完整样本构建的最小二乘估计量。这可以写成

(1)β^(i)=(jiXjXj)1(jiXjYj)=(XXXiXi)1(XYXiYi)=(X(i)X(i))1X(i)Y(i)

这里,X(i)Y(i) 是省略了 ith 行的数据矩阵。符号 β^(i)β^i 通常用于表示省略了 ith 观察的估计量。每个观察值都有一个删一估计量,i=1,,n,所以我们有 n 这样的估计量。

Yi 的删一预测值为 Y~i=Xiβ^(i)。这是通过在没有观察 i 的情况下估计样本上的 β,然后使用协变量向量 Xi 预测 Yi 获得的预测值。请注意,Y~i 是真实的预测,因为 Yi 不用于构造 Y~i。这与作为 Yi 的函数的拟合值 Yi 形成对比。

删一残差、预测误差或预测残差是 e~i=YiY~i。预测误差可以用作误差的估计量而不是残差。预测误差是比残差更好的估计量,因为前者是基于真实的预测。

删一法公式 式 1 给人的印象是删一法系数和误差在计算上很麻烦,需要 n 单独的回归。幸运的是,在线性回归的背景下,情况并非如此。 β^(i)e~i 有简单的线性表达式。

1.1 删一估计量和预测误差公式

(2)β^(i)=β^(XX)1Xie~i

(3)e~i=(1hii)1e^i

其中 hii 是影响力值。

式 2 表明,删一法系数可以通过简单的线性运算来计算,不需要使用 n 单独的回归来计算。方程 式 3 的另一个有趣特征是预测误差 e~i 是最小二乘残差 e^i 的简单缩放,缩放取决于影响力值 hii。如果 hii 很小,那么 e~ie^i。但是,如果 hii 很大,那么 e~i 可能与 e^i 完全不同。因此,残差和预测值之间的差异取决于影响力值,即 n 的异常程度。要将 式 3 写成矢量符号,定义

M=(Indiag{h11,..,hnn})1=diag{(1h11)1,,(1hnn)1}

那么 式 3 等价于

(4)e~=Me^

预测误差的一种用途是估计样本外均方误差:

(5)σ~2=1ni=1ne~i2=1ni=1n(1hii)2e^i2

这称为样本均方预测误差。它的平方根 σ~=σ~2 是预测标准误差。

论证 (删一法估计的证明). 我们用定理 3.7 的证明来完成本节。删一估计量 式 1 可以写为

(6)β^(i)=(XXXiXi)1(XYXiYi)

式 6 乘以 (XX)1(XXXiXi)。我们获得

β^(i)(XX)1XiXiβ^(i)=(XX)1(XYXiYi)=β^(XX)1XiYi.

重写

β^(i)=β^(XX)1Xi(YiXiβ^(i))=β^(XX)1Xie~i

式 2。将此表达式预乘以 Xi 并使用影响力值的定义我们得到

Xiβ^(i)=Xiβ^Xi(XX)1Xie~i=Xiβ^hiie~iYiXiβ^(i)=YiXiβ^+hiie~ie~i=e^i+hiie~ie~i=(1hii)1e^i

使用 e^ie~i 的定义,我们得到 e~i=e^i+hiie~i。重写我们得到 式 3