【模型泛化：偏差、方差、噪声】

转载 https://blog.csdn.net/Robin_Pi/article/details/104539998 参考 https://www.jianshu.com/p/3a07adbfa03f 现实中采用最多的方法是通过测试误差来评价学习方法的泛化能力。理论上：泛化误差是模型对未知数据预测的误差，事实上，泛化误差就是所学习到的模型的期望风险参考 https://blog.csdn.net/sollasido/article/details/106130505 误差（error ）：实际预测输出和样本真实输出之间的差异经验误差：同训练误差，即学习器在训练集上的误差泛化误差：同测试误差，即学习器在测试集上的误差,泛化误差越小，泛化能力越强

模型泛化

1. 泛化性能分析
- 1.1 概论
- 1.2 解释工具：”偏差-方差分解“
- - 泛化误差 = 偏差 + 方差 + 噪声
  - 如何直观理解？
  - 噪声：错误标记
  - 方差：数据扰动对模型的影响
  - 偏差：考察模型本身拟合能力
  - 小结
  - 偏差-方差囧境（bias-variance dilemma）
  - 经验误差与泛化能力之间的矛盾
2. 分析：泛化误差评估方法
- 2.1 模型复杂程度的影响
- 2.2 训练程度的影响：使用学习曲线分析
3. 解决办法

在得到模型之后，对模型进行分析~

1. 泛化性能分析

在一个项目中，我们通过设计和训练得到了一个model，该model的泛化可能很好，也可能不尽如人意，其背后的决定因素是什么呢？或者说我们可以从哪些方面去改进从而使下次得到的model更加令人满意呢？

1.1 概论

泛化误差/预测误差学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise). 在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error).
偏差：描述模型输出结果的期望与样本真实结果的差距。（“偏”——偏离，偏离真实的标签。）
方差：描述模型对于给定值的输出稳定性。（在统计学中，方差描述的是这个随机变量的离散程度，也就是该随机变量在其期望值附近的波动程度。）就像打靶一样，偏差描述了我们的射击总体是否偏离了我们的目标，而方差描述了射击准不准。

1.2 解释工具：”偏差-方差分解“ 泛化误差 = 偏差 + 方差 + 噪声

算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise)。在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error)。

假设：

测试样本：X
训练集：D
标记：yd（有可能出现噪声使得 yd != y，即所谓的打标样本不纯）
x 的真实标记：y
在训练集 D 上训练得到的模型：f
模型 f 对 x 的预测输出：f（x；D）
模型 f 对 x 的期望预测输出： f ‾ f ‾ f f‾\overline{f}f f‾ff(x)

以回归任务为例，学习算法的期望预测为：（再次验证，线性回归的本质就是均值预测）