拟合用来表示模型训练质量,有三种状态:拟合、欠拟合、过拟合。
拟合,形象理解:xy坐标轴的散点图,用趋势线去表示变化方向。指模型与样本的契合度。
欠拟合,模型在训练集中表现不好,测试集中表现不好。
过拟合,模型在训练集中表现太好,测试集中表现不好。
拟合达到最优的情况称为——泛化。这时模型在新的数据中表现也好。一般情况下,模型在训练集中学习越久,表现越好,但也越容易过拟合。
奥卡姆剃刀原则:解决相同问题的两个模型,都达到泛化状态,一般选择最简单的模型。