Sklearn-RandomForest

在scikit-learn中，RandomForest的分类类是RandomForestClassifier，回归类是RandomForestRegressor，需要调参的参数包括两部分，第一部分是Bagging框架的参数，第二部分是CART决策树的参数。

sklearn官网地址（RandomForestClassifier）：http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html#sklearn.ensemble.RandomForestClassifier

classsklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0,max_features='auto', max_leaf_nodes=None, min_impurity_split=1e-07,bootstrap=True, oob_score=False, n_jobs=1, random_state=None, verbose=0,warm_start=False, class_weight=None)

参数解读

Bagging框架的参数

和GBDT对比，GBDT的框架参数比较多，重要的有最大迭代器个数，步长和子采样比例，调参起来比较费力。但是RF则比较简单，这是因为bagging框架里的各个弱学习器之间是没有依赖关系的，这减小的调参的难度。换句话说，达到同样的调参效果，RF调参时间要比GBDT少一些。下面我来看看RF重要的Bagging框架的参数，由于RandomForestClassifier和RandomForestRegressor参数绝大部分相同，这里会将它们一起讲，不同点会指出。

n_estimators: 也就是弱学习器的最大迭代次数，或者说最大的弱学习器的个数，默认是10。一般来说n_estimators太小，容易欠拟合，n_estimators太大，又容易过拟合，一般选择一个适中的数值。对Random Forest来说，增加“子模型数”（n_estimators）可以明显降低整体模型的方差，且不会对子模型的偏差和方差有任何影响。模型的准确度会随着“子模型数”的增加而提高，由于减少的是整体模型方差公式的第二项，故准确度的提高有一个上限。在实际应用中，可以以10为单位，考察取值范围在1至201的调参情况。
- 对比，Random Forest的子模型都拥有较低的偏差，整体模型的训练过程旨在降低方差，故其需要较少的子模型（n_estimators默认值为10）且子模型不为弱模型（max_depth的默认值为None）；Gradient Tree Boosting的子模型都拥有较低的方差，整体模型的训练过程旨在降低偏差，故其需要较多的子模型（n_estimators默认值为100）且子模型为弱模型（max_depth的默认值为3）。
bootstrap：默认True，是否有放回的采样。
oob_score ：默认识False，即是否采用袋外样本来评估模型的好坏。有放回采样中大约36.8%的没有被采样到的数据，我们常常称之为袋外数据(Out Of Bag, 简称OOB)，这些数据没有参与训练集模型的拟合，因此可以用来检测模型的泛化能力。个人推荐设置为True，因为袋外分数反应了一个模型拟合后的泛化能力。对单个模型的参数训练，我们知道可以用cross validation（cv）来进行，但是特别消耗时间，而且对于随机森林这种情况也没有大的必要，所以就用这个数据对决策树模型进行验证，算是一个简单的交叉验证，性能消耗小，但是效果不错。
criterion：即CART树做划分时对特征的评价标准，分类模型和回归模型的损失函数是不一样的。分类RF对应的CART分类树默认是基尼系数gini,另一个可选择的标准是信息增益entropy，是用来选择节点的最优特征和切分点的两个准则。回归RF对应的CART回归树默认是均方差mse，另一个可以选择的标准是绝对值差mae。一般来说选择默认的标准就已经很好的。

从上面可以看出， RF重要的框架参数比较少，主要需要关注的是 n_estimators，即RF最大的决策树个数。

RF决策树的参数

RF的决策树参数，它要调参的参数基本和GBDT相同，如下:

max_features: RF划分时考虑的最大特征数。可以使用很多种类型的值，默认是"None",意味着划分时考虑所有的特征数；如果是"log2"意味着划分时最多考虑log2N个特征；如果是"sqrt"或者"auto"意味着划分时最多考虑N−−√N个特征。如果是整数，代表考虑的特征绝对数。如果是浮点数，代表考虑特征百分比，即考虑（百分比xN）取整后的特征数，其中N为样本总特征数。一般来说，如果样本特征数不多，比如小于50，我们用默认的"None"就可以了，如果特征数非常多，我们可以灵活使用刚才描述的其他取值来控制划分时考虑的最大特征数，以控制决策树的生成时间。
max_depth: 决策树最大深度。默认为"None"，决策树在建立子树的时候不会限制子树的深度这样建树时，会使每一个叶节点只有一个类别，或是达到min_samples_split。一般来说，数据少或者特征少的时候可以不管这个值。如果模型样本量多，特征也多的情况下，推荐限制这个最大深度，具体的取值取决于数据的分布。常用的可以取值10-100之间。
min_samples_split: 内部节点再划分所需最小样本数，默认2。这个值限制了子树继续划分的条件，如果某节点的样本数少于min_samples_split，则不会继续再尝试选择最优特征来进行划分。默认是2.如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。
min_samples_leaf:叶子节点最少样本数。这个值限制了叶子节点最少的样本数，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝。默认是1,可以输入最少的样本数的整数，或者最少样本数占样本总数的百分比。如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。
min_weight_fraction_leaf：叶子节点最小的样本权重和。这个值限制了叶子节点所有样本权重和的最小值，如果小于这个值，则会和兄弟节点一起被剪枝。默认是0，就是不考虑权重问题。一般来说，如果我们有较多样本有缺失值，或者分类树样本的分布类别偏差很大，就会引入样本权重，这时我们就要注意这个值了。
max_leaf_nodes: 最大叶子节点数。通过限制最大叶子节点数，可以防止过拟合，默认是"None”，即不限制最大的叶子节点数。如果加了限制，算法会建立在最大叶子节点数内最优的决策树。如果特征不多，可以不考虑这个值，但是如果特征分成多的话，可以加以限制，具体的值可以通过交叉验证得到。
min_impurity_split: 节点划分最小不纯度。这个值限制了决策树的增长，如果某节点的不纯度(基于基尼系数，均方差)小于这个阈值，则该节点不再生成子节点，即为叶子节点。一般不推荐改动默认值1e-7。

上面决策树参数中最重要的包括最大特征数max_features，最大深度max_depth，内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf。

splitter: 随机选择属性"random"还是选择不纯度最大"best"的属性，建议用默认 best。
presort:是否对数据进行预分类，以加快拟合中最佳分裂点的发现。默认False，适用于大数据集。小数据集使用True,可以加快训练。是否预排序,预排序可以加速查找最佳分裂点，对于稀疏数据不管用，Bool，auto：非稀疏数据则预排序，若稀疏数据则不预排序

进行预测的几种常用方法

predict_proba(x)：给出带有概率值的结果。每个点在所有label（类别）的概率和为1.
predict(x)：直接给出预测结果。内部还是调用的predict_proba()，根据概率的结果看哪个类型的预测值最高就是哪个类型。
predict_log_proba(x)：和predict_proba基本上一样，只是把结果给做了log()处理。

RandomForest调参实例

#导入需要的库

import pandas as pd

import numpy as np

from sklearn.ensemble import RandomForestClassifier

from sklearn.grid_search import GridSearchCV

from sklearn import cross_validation, metrics

import matplotlib.pylab as plt

%matplotlib inline  

#导入数据，顺便看看数据的类别分布

train= pd.read_csv('C:\\Users\\86349\\Desktop\\train_modified\\train_modified.csv')

target='Disbursed' # Disbursed的值就是二元分类的输出

IDcol= 'ID'

train['Disbursed'].value_counts()  

#可以看到类别输出如下，也就是类别0的占大多数：

0    19680

1      320

Name:Disbursed, dtype: int64  

#接着选择好样本特征和类别输出，样本特征为除去ID和输出类别的列

x_columns = [x for x in train.columns if x not in [target,IDcol]]

X = train[x_columns]

y = train['Disbursed']  

#不管任何参数，都用默认的，拟合下数据看看

rf0 = RandomForestClassifier(oob_score=True, random_state=10)

rf0.fit(X,y)

print rf0.oob_score_

y_predprob = rf0.predict_proba(X)[:,1]

print "AUC Score (Train): %f" % metrics.roc_auc_score(y,y_predprob)

#输出如下：0.98005  AUC Score (Train): 0.999833

#可见袋外分数已经很高（理解为袋外数据作为验证集时的准确率，也就是模型的泛化能力），而且AUC分数也很高（AUC是指从一堆样本中随机抽一个，抽到正样本的概率比抽到负样本的概率 大的可能性）。相对于GBDT的默认参数输出，RF的默认参数拟合效果对本例要好一些。  

#首先对n_estimators进行网格搜索

param_test1= {'n_estimators':range(10,71,10)}

gsearch1= GridSearchCV(estimator = RandomForestClassifier(min_samples_split=100,

                                 min_samples_leaf=20,max_depth=8,max_features='sqrt' ,random_state=10),

                       param_grid =param_test1, scoring='roc_auc',cv=5)

gsearch1.fit(X,y)

gsearch1.grid_scores_,gsearch1.best_params_, gsearch1.best_score_

#输出结果如下：

([mean:0.80681, std: 0.02236, params: {'n_estimators': 10},

  mean: 0.81600, std: 0.03275, params:{'n_estimators': 20},

  mean: 0.81818, std: 0.03136, params:{'n_estimators': 30},

  mean: 0.81838, std: 0.03118, params:{'n_estimators': 40},

  mean: 0.82034, std: 0.03001, params:{'n_estimators': 50},

  mean: 0.82113, std: 0.02966, params:{'n_estimators': 60},

  mean: 0.81992, std: 0.02836, params:{'n_estimators': 70}],

{'n_estimators':60},

0.8211334476626017)  

#这样我们得到了最佳的弱学习器迭代次数，接着我们对决策树最大深度max_depth和内部节点再划分所需最小样本数min_samples_split进行网格搜索。

param_test2= {'max_depth':range(3,14,2), 'min_samples_split':range(50,201,20)}

gsearch2= GridSearchCV(estimator = RandomForestClassifier(n_estimators= 60,

                                 min_samples_leaf=20,max_features='sqrt' ,oob_score=True,random_state=10),

   param_grid = param_test2,scoring='roc_auc',iid=False, cv=5)

gsearch2.fit(X,y)

gsearch2.grid_scores_,gsearch2.best_params_, gsearch2.best_score_

#输出如下：

([mean:0.79379, std: 0.02347, params: {'min_samples_split': 50, 'max_depth': 3},

  mean: 0.79339, std: 0.02410, params:{'min_samples_split': 70, 'max_depth': 3},

  mean: 0.79350, std: 0.02462, params:{'min_samples_split': 90, 'max_depth': 3},

  mean: 0.79367, std: 0.02493, params:{'min_samples_split': 110, 'max_depth': 3},

  mean: 0.79387, std: 0.02521, params:{'min_samples_split': 130, 'max_depth': 3},

  mean: 0.79373, std: 0.02524, params:{'min_samples_split': 150, 'max_depth': 3},

  mean: 0.79378, std: 0.02532, params:{'min_samples_split': 170, 'max_depth': 3},

  mean: 0.79349, std: 0.02542, params:{'min_samples_split': 190, 'max_depth': 3},

  mean: 0.80960, std: 0.02602, params:{'min_samples_split': 50, 'max_depth': 5},

  mean: 0.80920, std: 0.02629, params:{'min_samples_split': 70, 'max_depth': 5},

  mean: 0.80888, std: 0.02522, params:{'min_samples_split': 90, 'max_depth': 5},

  mean: 0.80923, std: 0.02777, params:{'min_samples_split': 110, 'max_depth': 5},

  mean: 0.80823, std: 0.02634, params:{'min_samples_split': 130, 'max_depth': 5},

  mean: 0.80801, std: 0.02637, params:{'min_samples_split': 150, 'max_depth': 5},

  mean: 0.80792, std: 0.02685, params:{'min_samples_split': 170, 'max_depth': 5},

  mean: 0.80771, std: 0.02587, params:{'min_samples_split': 190, 'max_depth': 5},

  mean: 0.81688, std: 0.02996, params:{'min_samples_split': 50, 'max_depth': 7},

  mean: 0.81872, std: 0.02584, params:{'min_samples_split': 70, 'max_depth': 7},

  mean: 0.81501, std: 0.02857, params:{'min_samples_split': 90, 'max_depth': 7},

  mean: 0.81476, std: 0.02552, params:{'min_samples_split': 110, 'max_depth': 7},

  mean: 0.81557, std: 0.02791, params:{'min_samples_split': 130, 'max_depth': 7},

  mean: 0.81459, std: 0.02905, params:{'min_samples_split': 150, 'max_depth': 7},

  mean: 0.81601, std: 0.02808, params:{'min_samples_split': 170, 'max_depth': 7},

  mean: 0.81704, std: 0.02757, params:{'min_samples_split': 190, 'max_depth': 7},

  mean: 0.82090, std: 0.02665, params:{'min_samples_split': 50, 'max_depth': 9},

  mean: 0.81908, std: 0.02527, params:{'min_samples_split': 70, 'max_depth': 9},

  mean: 0.82036, std: 0.02422, params:{'min_samples_split': 90, 'max_depth': 9},

  mean: 0.81889, std: 0.02927, params:{'min_samples_split': 110, 'max_depth': 9},

  mean: 0.81991, std: 0.02868, params:{'min_samples_split': 130, 'max_depth': 9},

  mean: 0.81788, std: 0.02436, params:{'min_samples_split': 150, 'max_depth': 9},

  mean: 0.81898, std: 0.02588, params:{'min_samples_split': 170, 'max_depth': 9},

  mean: 0.81746, std: 0.02716, params:{'min_samples_split': 190, 'max_depth': 9},

  mean: 0.82395, std: 0.02454, params:{'min_samples_split': 50, 'max_depth': 11},

  mean: 0.82380, std: 0.02258, params:{'min_samples_split': 70, 'max_depth': 11},

  mean: 0.81953, std: 0.02552, params:{'min_samples_split': 90, 'max_depth': 11},

  mean: 0.82254, std: 0.02366, params:{'min_samples_split': 110, 'max_depth': 11},

  mean: 0.81950, std: 0.02768, params:{'min_samples_split': 130, 'max_depth': 11},

  mean: 0.81887, std: 0.02636, params:{'min_samples_split': 150, 'max_depth': 11},

  mean: 0.81910, std: 0.02734, params:{'min_samples_split': 170, 'max_depth': 11},

  mean: 0.81564, std: 0.02622, params:{'min_samples_split': 190, 'max_depth': 11},

  mean: 0.82291, std: 0.02092, params:{'min_samples_split': 50, 'max_depth': 13},

  mean: 0.82177, std: 0.02513, params:{'min_samples_split': 70, 'max_depth': 13},

  mean: 0.82415, std: 0.02480, params:{'min_samples_split': 90, 'max_depth': 13},

  mean: 0.82420, std: 0.02417, params:{'min_samples_split': 110, 'max_depth': 13},

  mean: 0.82209, std: 0.02481, params:{'min_samples_split': 130, 'max_depth': 13},

  mean: 0.81852, std: 0.02227, params:{'min_samples_split': 150, 'max_depth': 13},

  mean: 0.81955, std: 0.02885, params:{'min_samples_split': 170, 'max_depth': 13},

  mean: 0.82092, std: 0.02600, params:{'min_samples_split': 190, 'max_depth': 13}],

{'max_depth':13, 'min_samples_split': 110},

0.8242016800050813)  

#已经取了三个最优参数，看看现在模型的袋外分数：

rf1= RandomForestClassifier(n_estimators= 60, max_depth=13, min_samples_split=110,

                                 min_samples_leaf=20,max_features='sqrt' ,oob_score=True,random_state=10)

rf1.fit(X,y)

printrf1.oob_score_

#输出结果为：0.984

#可见此时我们的袋外分数有一定的提高。也就是时候模型的泛化能力增强了。对于内部节点再划分所需最小样本数min_samples_split，我们暂时不能一起定下来，因为这个还和决策树其他的参数存在关联。下面我们再对内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf一起调参。  

#再对内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf一起调参

param_test3= {'min_samples_split':range(80,150,20), 'min_samples_leaf':range(10,60,10)}

gsearch3= GridSearchCV(estimator = RandomForestClassifier(n_estimators= 60,max_depth=13,

                                 max_features='sqrt' ,oob_score=True, random_state=10),

   param_grid = param_test3,scoring='roc_auc',iid=False, cv=5)

gsearch3.fit(X,y)

gsearch3.grid_scores_,gsearch2.best_params_, gsearch2.best_score_

#输出如下：

([mean:0.82093, std: 0.02287, params: {'min_samples_split': 80, 'min_samples_leaf':10},

  mean: 0.81913, std: 0.02141, params:{'min_samples_split': 100, 'min_samples_leaf': 10},

  mean: 0.82048, std: 0.02328, params:{'min_samples_split': 120, 'min_samples_leaf': 10},

  mean: 0.81798, std: 0.02099, params:{'min_samples_split': 140, 'min_samples_leaf': 10},

  mean: 0.82094, std: 0.02535, params:{'min_samples_split': 80, 'min_samples_leaf': 20},

  mean: 0.82097, std: 0.02327, params:{'min_samples_split': 100, 'min_samples_leaf': 20},

  mean: 0.82487, std: 0.02110, params:{'min_samples_split': 120, 'min_samples_leaf': 20},

  mean: 0.82169, std: 0.02406, params:{'min_samples_split': 140, 'min_samples_leaf': 20},

  mean: 0.82352, std: 0.02271, params:{'min_samples_split': 80, 'min_samples_leaf': 30},

  mean: 0.82164, std: 0.02381, params:{'min_samples_split': 100, 'min_samples_leaf': 30},

  mean: 0.82070, std: 0.02528, params:{'min_samples_split': 120, 'min_samples_leaf': 30},

  mean: 0.82141, std: 0.02508, params:{'min_samples_split': 140, 'min_samples_leaf': 30},

  mean: 0.82278, std: 0.02294, params:{'min_samples_split': 80, 'min_samples_leaf': 40},

  mean: 0.82141, std: 0.02547, params:{'min_samples_split': 100, 'min_samples_leaf': 40},

  mean: 0.82043, std: 0.02724, params:{'min_samples_split': 120, 'min_samples_leaf': 40},

  mean: 0.82162, std: 0.02348, params:{'min_samples_split': 140, 'min_samples_leaf': 40},

  mean: 0.82225, std: 0.02431, params:{'min_samples_split': 80, 'min_samples_leaf': 50},

  mean: 0.82225, std: 0.02431, params:{'min_samples_split': 100, 'min_samples_leaf': 50},

  mean: 0.81890, std: 0.02458, params:{'min_samples_split': 120, 'min_samples_leaf': 50},

  mean: 0.81917, std: 0.02528, params:{'min_samples_split': 140, 'min_samples_leaf': 50}],

{'min_samples_leaf':20, 'min_samples_split': 120},

0.8248650279471544)  

#最后我们再对最大特征数max_features做调参:

param_test4= {'max_features':range(3,11,2)}

gsearch4= GridSearchCV(estimator = RandomForestClassifier(n_estimators= 60,max_depth=13, min_samples_split=120,

                                 min_samples_leaf=20 ,oob_score=True, random_state=10),

   param_grid = param_test4,scoring='roc_auc',iid=False, cv=5)

gsearch4.fit(X,y)

gsearch4.grid_scores_,gsearch4.best_params_, gsearch4.best_score_

#输出如下：

([mean:0.81981, std: 0.02586, params: {'max_features': 3},

  mean: 0.81639, std: 0.02533, params:{'max_features': 5},

  mean: 0.82487, std: 0.02110, params:{'max_features': 7},

  mean: 0.81704, std: 0.02209, params:{'max_features': 9}],

{'max_features':7},

0.8248650279471544)  

#用我们搜索到的最佳参数，我们再看看最终的模型拟合：

rf2= RandomForestClassifier(n_estimators= 60, max_depth=13, min_samples_split=120,

                                 min_samples_leaf=20,max_features=7 ,oob_score=True, random_state=10)

rf2.fit(X,y)

printrf2.oob_score_

#此时的输出为：0.984

#可见此时模型的袋外分数基本没有提高，主要原因是0.984已经是一个很高的袋外分数了，如果想进一步需要提高模型的泛化能力，我们需要更多的数据。

Sklearn-RandomForest的更多相关文章

C4.5,CART,randomforest的实践
#################################Weka-J48(C4.5)################################# ################### ...
5分钟教你玩转 sklearn 机器学习（上）
假期结束,你的状态有没有回归?那么,放空脑袋后,先来学习学习,欢迎大家继续关注腾讯云技术社区. 作者:赵成龙这是一篇很难写的文章,因为我希望这篇文章能对大家有所帮助.我不会给大家介绍机器学习,数据挖 ...
【机器学习学习】SKlearn + XGBoost 预测 Titanic 乘客幸存
Titanic 数据集是从 kaggle下载的,下载地址:https://www.kaggle.com/c/titanic/data 数据一共又3个文件,分别是:train.csv,test.csv, ...
【机器学习】SKlearn + XGBoost 预测 Titanic 乘客幸存
Titanic 数据集是从 kaggle下载的,下载地址:https://www.kaggle.com/c/titanic/data 数据一共又3个文件,分别是:train.csv,test.csv, ...
sklearn机器学习-泰坦尼克号
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...
sklearn中各种分类器回归器都适用于什么样的数据呢？
作者:匿名用户链接:https://www.zhihu.com/question/52992079/answer/156294774来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请 ...
特征选取1-from sklearn.feature_selection import SelectKBest
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...
sklearn学习笔记
用Bagging优化模型的过程:1.对于要使用的弱模型(比如线性分类器.岭回归),通过交叉验证的方式找到弱模型本身的最好超参数:2.然后用这个带着最好超参数的弱模型去构建强模型:3.对强模型也是通过交 ...
RandomForest中的feature_importance
随机森林算法(RandomForest)的输出有一个变量是 feature_importances_ ,翻译过来是特征重要性,具体含义是什么,这里试着解释一下. 参考官网和其他资料可以发现,RF可以 ...
sklearn学习总结（超全面）
https://blog.csdn.net/fuqiuai/article/details/79495865 前言sklearn想必不用我多介绍了,一句话,她是机器学习领域中最知名的python模块之 ...

随机推荐

转一篇做BI项目的好文
首先,我们有一个大的假设前提,集团报表平台是服务于大型公司,比如有很多分公司,子公司,多部门等,并且有BI需求的访问人群超过1000以上的公司. 这样,我们的关键词是:集团平台运营集团:意味着, ...
为spring代理类设置属性值
现在有一个bean包含了私有属性,如下: @Component public class Bean { String name; public String getName() { return na ...
java对redis的基本操作（一）
一.server端安装 1.下载 https://github.com/MSOpenTech/redis 可看到当前可下载版本:redis2.6
Create a site by Google Site - All Free
Follow this link : https://www.google.com/sites/help/intl/en/overview.html
Delphi Dll 动态调用例子(1)
http://blog.sina.com.cn/s/blog_62c46c3701010q7h.html 一.编写dll library TestDllByD2007; uses SysUtils, ...
Java核心编程快速学习(转载)
http://www.cnblogs.com/wanliwang01/p/java_core.html Java核心编程部分的基础学习内容就不一一介绍了,本文的重点是JAVA中相对复杂的一些概念,主体 ...
BitAdminCore框架更新日志20180518
20180518更新内容 1.重构调整QQ登录代码,使用JObject,减少代码,增加access_token自动续期(未测试). 2.重构调整微信登录代码,使用JObject,减少代码,增加acce ...
STM32F4时钟配置库函数详解
在STM32中,所有的应用都是基于时钟,所以时钟的配置就尤为重要了,而不能仅仅只知道使用默认时钟. STM32F4的时钟树如上图所示,HSE为外部接入的一个8M的时钟,然后再给PLL提供输入时钟,经过 ...
3-WIN10系统及开发工具支持
本篇博客对应视频讲解回顾上一讲说了编程的方向和技术流派以及选择入门语言的建议.当我们决定我们的选择之后呢,我们就要学习和进行实践操作了.但在实践之前,我们仍然需要做好相应的准备,这也就是今天要讲的 ...
Disruptor使用简介
disruptor是lmax公司开发的一款java高性能并发框架,其本质是一种类似队列的实现“生产者—消费者 ”模式的组件. 下面是其示例代码: public class DisruptorServe ...

Sklearn-RandomForest

Sklearn-RandomForest的更多相关文章

随机推荐

热门专题