易百教程

6、避免过拟合的方法是什么?

当我们有一个小数据集并且模型试图从中学习时,就会发生过度拟合。通过使用大量数据,可以避免过度拟合。但是,如果我们有一个小型数据库并且被迫基于它构建模型,那么我们可以使用一种称为交叉验证的技术。在这种方法中,通常给模型一个已知数据的数据集,在该数据集上运行训练数据集,以及对模型进行测试的未知数据的数据集。交叉验证的主要目的是定义一个数据集以在训练阶段“测试”模型。如果有足够的数据,则使用“等渗回归”来防止过度拟合。