过拟合: Overfitting就是指Ein(在训练集上的错误率)变小,Eout(在整个数据集上的错误率)变大的过程 Underfitting是指Ein和Eout都变大的过程 从上边这个图中,虚线的左侧是underfitting,右侧是overfitting,发生overfitting的主要原因是:使用过于复杂的模型,数据噪音,有限的训练集 机器学习过程中的三个锦囊妙计 Occam's Razor:指的是对训练数据最简单的解释就是最好的,训练的模型可能越简单越好. Sampling Bias:抽…