在之前介绍的线性回归模型中,有一个隐含的假设是自变量均为连续变量,但实际上自变量有时候是分类变量,类似于方差分析中的因素,这种分类自变量在回归分析中,也默认作为连续变量使用,这就会产生一个问题,如果是无序分类变量,那么各类别间没有高低之分,每变化一个单位,对于因变量的影响是相同的,无法分析当中的趋势,虽然可以使用哑变量,但是当分类变量过多或每个变量的类别水平过多时,这种方法非常繁琐,此外,当类别较多时,可能会存在某几个类别对因变量的作用相似,这是可分析的点,但是传统线性模型却将此信息忽略,造成信