这部分主要补充一些cs229没涉及到,但是实际上非常重要,而且是实际中真正会用的一些算法,即集成学习. 集成学习 问题背景 既然我们已经知道了很多学习算法,这些算法最终会输出一个结果.能不能把这些结果进行结合.构造一个性能更好的学习器呢. 首先要明确集成学习和单个基学习器的学习有什么区别. 我们定义分歧为各个基学习器与集成学习器的差距的加权均值: \[ A(h|x)= \sum _ { i = 1} ^ { T } w _ { i } \left( h _ { i } ( x ) - H ( x…