背景:使用Logistic回归来预测患有疝气病的马的存活问题,这里的数据包括368个样本和28个特征,疝气病是描述马胃肠痛的术语,然而,这种病并不一定源自马的胃肠问题,其他问题也可能引发疝气病,该数据集中包含了医院检测马疝气病的一些指标,有的指标比较主观,有的指标难以测量,例如马的疼痛级别.另外,除了部分指标主观和难以测量之外,该数据还存在一个问题,数据集中有30%的值是缺失的. 1.准备数据:处理数据中的缺失值 数据中的缺失值是一个非常棘手的问题,那么数据缺失究竟带来了多少问题?假设有100个…