考虑一个多分类问题,即预测变量y可以取k个离散值中的任何一个.比如一个邮件分类系统将邮件分为私人邮件,工作邮件和垃圾邮件.由于y仍然是一个离散值,只是相对于二分类的逻辑回归多了一些类别.下面将根据多项式分布建模. 考虑将样本共有k类,每一类的概率分别为,由于,所以通常我们只需要k-1个参数即可 , 为了推导,引入表达式: 上面T(y)是k-1维列向量,其中y = 1, 2, ...k. T(y)i 表示向量T(y)的第i个元素. 还要引入表达式 ,如果大括号里面为真,则真个表达式就为1,否则为0