机器学习工程师最熟悉的设置之一是访问大量数据,但需要适度的资源来注释它.处于困境的每个人最终都会经历逻辑步骤,当他们拥有有限的监督数据时会问自己该做什么,但很多未标记的数据,以及文献似乎都有一个现成的答案:半监督学习. 这通常是出现问题的时候. 从历史上看,半监督学习一直是每个工程师作为一种通过仪式进行的兔子洞之一,只是为了发现对普通旧数据标签的新发现.细节对于每个问题都是独一无二的,但从广义上讲,它们通常可以描述如下: 在低数据制度中,半监督培训确实倾向于提高绩效.但在实际环境中,你经常会从“…