ML学习笔记之XGBoost实现对鸢尾花数据集分类预测

import xgboost as xgb

import numpy as np

import pandas as pd

from sklearn.model_selection import train_test_split

if __name__ == '__main__':

    iris_feature_E = "sepal lenght", "sepal width", "petal length", "petal width"

    iris_feature = "the length of sepal", "the width of sepal", "the length of petal", "the width of petal"

    iris_class = "Iris-setosa", "Iris-versicolor", "Iris-virginica"

    data = pd.read_csv("iris.data", header=None)

    iris_types = data[4].unique()

    for i, type in enumerate(iris_types):

        data.set_value(data[4] == type, 4, i)

    x, y = np.split(data.values, (4,), axis=1)

    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.7, random_state=1)

    data_train = xgb.DMatrix(x_train, label=y_train)

    data_test = xgb.DMatrix(x_test, label=y_test)

    watchlist = [(data_test, 'eval'), (data_train, 'train')]

    param = {'max_depth':3, 'eta':1, 'silent':1, 'objective':'multi:softmax', 'num_class':3}

    bst = xgb.train(param, data_train, num_boost_round=10, evals=watchlist)

    y_hat = bst.predict(data_test)

    result = y_test.reshape(1, -1) == y_hat

    print('the accuracy:\t', float(np.sum(result)) / len(y_hat))

ML学习笔记之XGBoost实现对鸢尾花数据集分类预测的更多相关文章

[ML学习笔记] XGBoost算法
[ML学习笔记] XGBoost算法回归树决策树可用于分类和回归,分类的结果是离散值(类别),回归的结果是连续值(数值),但本质都是特征(feature)到结果/标签(label)之间的映射. 这 ...
[ML学习笔记] 朴素贝叶斯算法（Naive Bayesian)
[ML学习笔记] 朴素贝叶斯算法(Naive Bayesian) 贝叶斯公式 \[P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B)}\] 我们把P(A)称为"先 ...
[ML学习笔记] 决策树与随机森林（Decision Tree&Random Forest）
[ML学习笔记] 决策树与随机森林(Decision Tree&Random Forest) 决策树决策树算法以树状结构表示数据分类的结果.每个决策点实现一个具有离散输出的测试函数,记为分支 ...
[ML学习笔记] 回归分析（Regression Analysis）
[ML学习笔记] 回归分析(Regression Analysis) 回归分析:在一系列已知自变量与因变量之间相关关系的基础上,建立变量之间的回归方程,把回归方程作为算法模型,实现对新自变量得出因变量 ...
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes
Python实现鸢尾花数据集分类问题——基于skearn的NaiveBayes 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = ...
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression
Python实现鸢尾花数据集分类问题——基于skearn的LogisticRegression 一. 逻辑回归逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题, ...
Python实现鸢尾花数据集分类问题——基于skearn的SVM
Python实现鸢尾花数据集分类问题——基于skearn的SVM 代码如下: # !/usr/bin/env python # encoding: utf-8 __author__ = 'Xiaoli ...
机器学习框架ML.NET学习笔记【2】入门之二元分类
一.准备样本接上一篇文章提到的问题:根据一个人的身高.体重来判断一个人的身材是否很好.但我手上没有样本数据,只能伪造一批数据了,伪造的数据比较标准,用来学习还是蛮合适的. 下面是我用来伪造数据的代码 ...
PowerDesigner 15学习笔记：十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...

随机推荐

Oracle的功能性sql
--创建表空间 CREATE TABLESPACE FSNEW DATAFILE 'E:\oracle\oracledata\oradata\FSNEW' SIZE 30G EXTENT MANAGE ...
phpstorm分别在Mac和Windows下启动命令行，并启用ssh
Mac:在terminal下运行 sudo -i 输入密码就可以用ssh IP:端口命令行登录了 DAssist是一个命令行开发辅助,可直接在系统命令行工具中使用,Linux和MacOS等自带 ...
ASP.NET----内置对象----Resuest
Request对象可以获取包含用户的计算机.页面及浏览器的请求等相关信息. Request对象的属性: ①Form----------返回有关表单变量的集合 ②QueryString--------- ...
Vim文本编辑器详细用法
1 Vi.Vim文本编辑器 1．Vi.Vim Vi是Visual interface的简称. Vim是Vi的增强版,即Vi Improved.在后面的实例中将介绍Vim的使用. 为什么学vi? 1)所 ...
Linux的网络参数设置
前面讲解了lLinux 的IP组成,下面就讲一下Linux的网络设置和数据传递. 其实这地方对运维的人员来说,不会要精通,但还是要了解.必要时刻还会用到的电脑之间数据的传递: 数据的传递要分为下面几 ...
Nios II IDE代码优化，quartus ii 11.0版本IDE
开发Altera Nios II软件可使用Nios II IDE或 Nios II Software BuildTools for Eclipse(即:Nios II SBT for Eclipse) ...
【转】编写高质量代码改善C#程序的157个建议——建议56：使用继承ISerializable接口更灵活地控制序列化过程
建议56:使用继承ISerializable接口更灵活地控制序列化过程接口ISerializable的意义在于,如果特性Serializable,以及与其像配套的OnDeserializedAttr ...
ajax post 提交无法进入controller 请求200
最近写js遇到个问题: 用ajax的post方式给后台提交数据,页面200,但是不进入controller 断点,我以为我post参数不对. 网上查的: 1.说路径不对,但是我通过get方式是可以进入 ...
wireshark-wincap安装问题
winpcap关键模块 32位系统: C:\Windows\system32\wpcap.dll C:\Windows\system32\Packet.dll C:\Windows\system32\ ...
jQuery的核心对象、原型对象、静态方法、动态方法
什么叫jQuery的核心对象? $ $===jQuery 什么叫jQuery的原型对象? $.fn $.fn===$.prototype 什么叫静态方法? 在构造函树上定义的方法,静态方法通过构造函数 ...

ML学习笔记之XGBoost实现对鸢尾花数据集分类预测

ML学习笔记之XGBoost实现对鸢尾花数据集分类预测的更多相关文章

随机推荐

热门专题