sklearn常见分类器(二分类模板)

# -*- coding: utf-8 -*-

import pandas as pd

import matplotlib

matplotlib.rcParams['font.sans-serif']=[u'simHei']

matplotlib.rcParams['axes.unicode_minus']=False

from sklearn.tree import DecisionTreeClassifier

from sklearn.model_selection import train_test_split

from sklearn.metrics import classification_report

from sklearn.pipeline import Pipeline

from sklearn.model_selection import GridSearchCV

from sklearn.ensemble import RandomForestClassifier

from sklearn.metrics import accuracy_score

from sklearn.datasets import load_breast_cancer

data_set = pd.read_csv('pima-indians-diabetes.csv')

data = data_set.values[:,:]

y = data[:,8]

X = data[:,:8]

X_train,X_test,y_train,y_test = train_test_split(X,y)

### 随机森林

print("==========================================")

RF = RandomForestClassifier(n_estimators=10,random_state=11)

RF.fit(X_train,y_train)

predictions = RF.predict(X_test)

print("RF")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Logistic Regression Classifier

print("==========================================")

from sklearn.linear_model import LogisticRegression

clf = LogisticRegression(penalty='l2')

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("LR")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Decision Tree Classifier

print("==========================================")

from sklearn import tree

clf = tree.DecisionTreeClassifier()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("DT")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### GBDT(Gradient Boosting Decision Tree) Classifier

print("==========================================")

from sklearn.ensemble import GradientBoostingClassifier

clf = GradientBoostingClassifier(n_estimators=200)

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("GBDT")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

###AdaBoost Classifier

print("==========================================")

from sklearn.ensemble import  AdaBoostClassifier

clf = AdaBoostClassifier()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("AdaBoost")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### GaussianNB

print("==========================================")

from sklearn.naive_bayes import GaussianNB

clf = GaussianNB()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("GaussianNB")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Linear Discriminant Analysis

print("==========================================")

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

clf = LinearDiscriminantAnalysis()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("Linear Discriminant Analysis")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Quadratic Discriminant Analysis

print("==========================================")

from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis

clf = QuadraticDiscriminantAnalysis()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("Quadratic Discriminant Analysis")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### SVM Classifier

print("==========================================")

from sklearn.svm import SVC

clf = SVC(kernel='rbf', probability=True)

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("SVM")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### Multinomial Naive Bayes Classifier

print("==========================================")

from sklearn.naive_bayes import MultinomialNB

clf = MultinomialNB(alpha=0.01)

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("Multinomial Naive Bayes")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### xgboost

import xgboost

print("==========================================")

from sklearn.naive_bayes import MultinomialNB

clf = xgboost.XGBClassifier()

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("xgboost")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

### voting_classify

from sklearn.ensemble import GradientBoostingClassifier, VotingClassifier, RandomForestClassifier

import xgboost

from sklearn.linear_model import LogisticRegression

from sklearn.naive_bayes import GaussianNB

clf1 = GradientBoostingClassifier(n_estimators=200)

clf2 = RandomForestClassifier(random_state=0, n_estimators=500)

# clf3 = LogisticRegression(random_state=1)

# clf4 = GaussianNB()

clf5 = xgboost.XGBClassifier()

clf = VotingClassifier(estimators=[

    # ('gbdt',clf1),

    ('rf',clf2),

    # ('lr',clf3),

    # ('nb',clf4),

    # ('xgboost',clf5),

    ],

    voting='soft')

clf.fit(X_train,y_train)

predictions = clf.predict(X_test)

print("voting_classify")

print(classification_report(y_test,predictions))

print("AC",accuracy_score(y_test,predictions))

sklearn常见分类器(二分类模板)的更多相关文章

sklearn常见分类器的效果比较
sklearn 是 python 下的机器学习库. scikit-learn的目的是作为一个“黑盒”来工作,即使用户不了解实现也能产生很好的结果. 其功能非常强大,当然也有很多不足的地方,就比如说神经 ...
基于sklearn的分类器实战
已迁移到我新博客,阅读体验更佳基于sklearn的分类器实战完整代码实现见github:click me 一.实验说明 1.1 任务描述 1.2 数据说明一共有十个数据集,数据集中的数据属性有全部 ...
sklearn 组合分类器
组合分类器: 组合分类器有4种方法: (1)通过处理训练数据集.如baging boosting (2)通过处理输入特征.如 Random forest (3)通过处理类标号.error_corre ...
sklearn各种分类器简单使用
sklearn中有很多经典分类器,使用非常简单:1.导入数据 2.导入模型 3.fit--->predict 下面的示例为在iris数据集上用各种分类器进行分类: #用各种方式在iris数据集上 ...
python_mmdt:从0到1--实现简单恶意代码分类器(二)
概述上篇文章python_mmdt:一种基于敏感哈希生成特征向量的python库(一)我们介绍了一种叫mmdt_hash(敏感哈希)生成方法,并对其中的概念做了基本介绍.本篇,我们重点谈谈mmdt_ ...
常见模块(二) logging模块
logging模块是专门做日志系统的.分为函数版和自定义函数. (一)logging模块初级版缺点,不能指定字符集,不能把屏幕输出和文件日志同时记录.只能选择其一. 文件记录日志 import lo ...
(6)UIView常见属性二
例如创建一个view视图,view是最纯洁的控制,必须得指定它的位置,而不像其他的控件像UISwitch默认都有一个位置在viewDidLoad方法中打印它的位置: 将控件放入一个视图中,只需移动白 ...
Oracle面试过程中常见的二十个问题
1.冷备份和热备份的不同点以及各自的优点解答:热备份针对归档模式的数据库,在数据库仍旧处于工作状态时进行备份.而冷备份指在数据库关闭后,进行备份,适用于所有模式的数据库.热备份的优点在于当备份时, ...
讲解Oracle面试过程中常见的二十个问题
1.冷备份和热备份的不同点以及各自的优点解答:热备份针对归档模式的数据库,在数据库仍旧处于工作状态时进行备份.而冷备份指在数据库关闭后,进行备份,适用于所有模式的数据库.热备份的优点在于当备 ...

随机推荐

solr8.2 环境搭建配置中文分词器 ik-analyzer-solr8 详细步骤
一.下载安装Apache Solr 8.2.0 下载地址:http://lucene.apache.org/solr/downloads.html 因为是部署部署在windows系统上,所以下载zip ...
ping加上时间信息
一.linux系统ping加时间戳信息 1.ping 加时间信息,然后还要实时保存到一个文件中,那么就与awk结合 ping 115.239.211.112 -c 10 | awk '{ print ...
【反向多源点同时BFS一个强连通图+类最短路题面】Fair-986C-Codeforce
借鉴博客:https://www.cnblogs.com/zhangjiuding/p/9112273.html 986-A. Fair /* 986-A-Fair,codeforce: 大致题意: ...
git rev-list 按照时间来列出两个 commit id 之间的相差数
git rev-list 按照时间来列出两个 commit id 之间的相差数 git rev-list: Lists commit objects in reverse chronological ...
Greenplum实战之查询优化
本文主要分为三部分: GP优化需要准备的一些关于优化之外的知识,包括清空缓存.性能监控.执行计划分析. 具体优化措施,从以下四个方面考虑: 表.字段 sql GP配置.服务器配置硬件及节点资源 GP ...
centos 7.3 开放端口并对外开放
查看已打开的端口 # netstat -anp 查看想开的端口是否已开 # firewall-cmd --query-port=666/tcp 若此提示 FirewallD is not runnin ...
Codeforces Round #584 A. Paint the Numbers
链接: https://codeforces.com/contest/1209/problem/A 题意: You are given a sequence of integers a1,a2,-,a ...
Spring Boot 之FilterRegistrationBean --支持web Filter 排序的使用(转)
Spring Boot 之FilterRegistrationBean --支持web Filter 排序的使用Spring 提供了FilterRegistrationBean类,此类提供setOr ...
12、Spring Boot 2.x 集成 MongoDB
1.12 Spring Boot 2.x 集成 MongoDB 完整源码: Spring-Boot-Demos
Java进阶知识23 Spring对JDBC的支持
1.最主要的代码 Spring 配置文件(beans.xml)  <bean id="dataSource" class="co ...

sklearn常见分类器(二分类模板)

sklearn常见分类器(二分类模板)的更多相关文章

随机推荐

热门专题