1.交叉熵:用来描述通信中将一个概率分布的最优编码用到另一个概率分布的平均比特数 公式: 2.交叉熵是不对称的 3.交叉熵的作用是表达两个概率分布的差异性 设概率分布p(x)和q(x),两个概率分布差异性越大,用分布q表示分布p的交叉熵,比p的熵越大 同理,两个概率分布差异越大,用分布p表示分布q的交叉熵比分布q的熵越大 如果两个分布相同,交叉熵为零 4. The KL divergence of p with respect to q,Dq(p)表示两个分布的差异性,其定义是:
Good Semi-supervised Learning That Requires a Bad GAN 恢复博客更新,最近没那么忙了,记录一下学习. Intro 本文是一篇稍微偏理论的半监督学习的文章,通过证明一个能够生成非目标分布的.低样本密度的样本的生成器,对半监督学习的效果有很大的提升,这样的生成器作者称之为Complement Generator,而提升的原因是生成的bad样本填充了特征空间的低密度区域,从而使得分类的分类面在低密度区域,从而避免了分类面穿过流形的情况,因而能够提升分