机器学习主要工作大致分为以下几步,数据预处理,包括数据切分,特征选取,数据缺失值处理,来了解数据.接下来分割数据,分别分出训练集和测试集.第三步,选择模型,使用训练数据训练模型参数,再对测试数据进行预测,保存预测结果.第四步,对预测结果性能分析,根据分析结论调节参数. pandas包处理数据,分析数据 numpy包提供高级的数学运算和高效的向量及矩阵运算能力 pandas.read_csv函数从互联网读取指定数据 查看data数据量和维度 data.shape 使用sklearn.cross_v…