李宏毅《机器学习》学习笔记3

2021/7/17 6:06:54

编程Tag： 验证测试笔记模型学习误差训练李宏毅偏差

本文主要是介绍李宏毅《机器学习》学习笔记3，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

误差

模型的误差来源有两个，分别是误差（bias）和方差（variance）。

不同复杂程度的模型倾向于不同的误差类型，复杂度较低的模型的方差较小，也就更集中，但是偏差较大，易欠拟合；复杂模型离散程度更大，但偏差小，易过拟合。

我们要做的，就是在两种误差中权衡，找出相对平衡的模型。

误差改进

偏差大的模型可能是模型复杂程度不够，要考虑更多变量，增加更多次幂。偏差大的情况下盲目添加更多数据是没用的，因为模型本身表现就不好。
方差大的模型，最简单的改进方法是增加更多训练数据，但很多情况我们拿不到更多的数据，但是可以通过一些技巧修改已有数据来丰富数据（比如对于图像数据可以偏转图像角度）。

模型选择

模型不可简单根据测试成绩挑选，因为已有的测试集代表不了真实情况或者完整测试集。

交叉验证
在训练集中划出一部分作为验证集，通过验证集选出模型后再将验证集放回全部训练集重新训练被选中的模型，然后再在公开测试集上测试。
n折交叉验证
将训练集分为三部分，三部分数据分别作一次验证集，取平均验证成绩最好的模型。最后用全部验证集训练该模型。

这篇关于李宏毅《机器学习》学习笔记3的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

相关编程文章

更多>

2024-12-17机器学习资料入门指南
2024-12-06如何用OpenShift流水线打造高效的机器学习运营体系（MLOps）
2024-12-06基于无监督机器学习算法的预测性维护讲解
2024-12-03【机器学习(六)】分类和回归任务-LightGBM算法-Sentosa_DSML社区版
2024-12-0210个必须使用的机器学习API，为高级分析助力
2024-12-01【机器学习(五)】分类和回归任务-AdaBoost算法-Sentosa_DSML社区版
2024-11-28【机器学习(四)】分类和回归任务-梯度提升决策树(GBDT)算法-Sentosa_DSML社区版
2024-11-26【机器学习(三)】分类和回归任务-随机森林(Random Forest,RF)算法-Sentosa_DSML社区版
2024-11-18机器学习与数据分析的区别
2024-10-28机器学习资料入门指南