一:sklearn中决策树的参数: 1,criterion: ”gini” or “entropy”(default=”gini”)是计算属性的gini(基尼不纯度)还是entropy(信息增益),来选择最合适的节点. 2,splitter: ”best” or “random”(default=”best”)随机选择属性还是选择不纯度最大的属性,建议用默认. 3,max_features: 选择最适属性时划分的特征不能超过此值. 当为整数时,即最大特征数:当为小数时,训练集特征数*小数: if
sklearn中调用PCA算法 PCA算法是一种数据降维的方法,它可以对于数据进行维度降低,实现提高数据计算和训练的效率,而不丢失数据的重要信息,其sklearn中调用PCA算法的具体操作和代码如下所示: #sklearn中调用PCA函数进行相关的训练和计算(自定义数据)import numpy as npimport matplotlib.pyplot as pltx=np.empty((100,2))x[:,0]=np.random.uniform(0.0,100.0,size=100)x[