3.15: 矩阵符号
1 模型矩阵
对于许多目的,包括计算,用矩阵表示法编写模型和统计数据很方便。
我们可以将这些
定义
观察
样本总和可以用矩阵表示法编写。例如
因此最小二乘估计量可以写成
式 2 的估计版本是
等价的残差向量是
使用残差向量,我们可以将 (3.16) 写为
将误差平方和标准写为
使用矩阵表示法,我们对大多数估计器都有简单的表达式。这对于计算机编程特别方便,因为大多数语言都允许矩阵表示法和操作。
定理 1 (重要的矩阵表达式)
2 投影矩阵
定义矩阵
请注意
这是投影矩阵的属性。更一般地,对于任何矩阵
举一个重要的例子,如果我们将矩阵
投影矩阵
矩阵
由于这个属性,
当
请注意,在这种情况下
创建一个
投影矩阵
定理 2 (投影矩阵的性质) 任何
是对称的 。 是幂等的 。 。 的特征值为 1 和 0 。 的 特征值等于 1 和 等于 0 。 。
我们通过证明 定理 2 中的主张来结束本节。
第 1 部分成立,因为
为了建立第 2 部分,
对于第 3 部分,
跟踪算子的定义和属性见附录 A.5。
附录 A.11 表明第 4 部分适用于任何幂等矩阵。对于第 5 部分,由于
对于第 6 部分,观察
3 零化矩阵
定义
其中
可以看到,
因此
我们称
例如,
零化矩阵
与 定理 2 类似,我们可以计算
(见习题 3.9。)一个暗示是
如上一节所述,投影矩阵的一个特殊示例出现在
为简单起见,我们通常将右侧写为
我们还可以使用 式 3 为残差向量写一个替代表达式。将
它不依赖于回归系数
4 影响力值
回归矩阵
他们是
影响力值
现在列出了影响力值的一些属性。
定理 3 (影响力值的性质)
。 如果 包含截距。 。
影响力值
通常说,当影响力值都大致相等时,回归设计是平衡的。从 定理 3 我们推导出当
如果某些影响力值与其他影响力值高度不相等,则回归设计是不平衡的。最极端的情况是
最大影响力值 式 4 将根据回归变量的选择而变化。例如,考虑方程 (3.13),对具有
一些推理过程(例如稳健的协方差矩阵估计和交叉验证)对高影响力值很敏感。我们稍后会回到这些问题。
我们现在证明 定理 3。
对于第 1 部分,令
对于第 2 部分分区
对于第 3 部分,
4.1 影响力值的计算
影响力值
第一步,先算出平方化矩阵2:
第二步,对上述矩阵进行行加总求和: