这一节主要讲如何通过数据来合理的验证模型好不好. 首先,否定了Ein来选模型和Etest来选模型. (1)模型越复杂,Ein肯定越好:但是Eout就不一定了(见上一节的overfitting等) (2)Etest是偷窥训练集,也没有效果 下面,集中讨论已有的数据集切分成train data和test data,怎么切分,怎么验证最合理. Model Selection的流程如下: (1)切分数据,选一个Eval最小的 (2)再用全量数据去训练选出来的那个model 流程搞清楚了,接下来就要看怎么…