交叉验证的目的是为了有在训练集中有更多的数据点,以获得最佳的学习效果,同时也希望有跟多的测试集数据来获得最佳验证.交叉验证的要点是将训练数据平分到k个容器中,在k折交叉验证中,将运行k次单独的试验,每一次试验中,你将挑选k个训练集中的一个作为验证集,剩下k-1个作为训练集,训练你的模型,用测试集测试你的模型.这样运行k次,有十个不同的测试集,将十个测试集的表现平均,就是将这k次试验结果取平均.这样你就差不多用了全部数据去训练,也用全部数据去测试. #!/usr/bin/python ""