参见原书2.1-2.2节 新数据集就像一个包装好的礼物,它充满了承诺和希望! 但是直到你打开前,它都保持神秘! 一.基础问题的架构.术语,机器学习数据集的特性 通常,行代表实例,列代表属性特征 属性,实例中用于预测的数据其他名称:预测因子 特征 独立变量 输入 标签,需要预测的数据其他名称:结果 目标 依赖变量 响应 2.1.1属性和标签的不同类型决定模型的选择数值变量 类别变量/因素变量 惩罚回归算法只能处理数值变量:SVM 核方法 K最近邻转换:类别变量->数值变量 当标签是数值的,就叫作回…