sklearn数据集的导入及划分

鸢尾花数据集的导入及查看：

①鸢尾花数据集的导入：

from sklearn.datasets import load_iris

②查看鸢尾花数据集：

iris=load_iris()
print("鸢尾花数据集：\n",iris)
print("查看数据集描述：\n", iris.DESCR)
print("查看特征值的名字：\n",iris.feature_names)
print("查看特征数据：\n",iris.data,iris.data.shape)
print("查看目标值名字：\n",iris.target_names)
print("查看目标数据：\n",iris.target)

划分数据集：

①导入train_test_split包：

from sklearn.model_selection import train_test_split

②划分数据集：数据集划分为训练集和测试集

x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)

注：iris.data为数据集的特征值，iris.target为数据集的目标值，test_size为测试值的划分比例（可省，默认为0.25），

　　x_train:训练集的特征值

　　x_test:测试集的特征值

　　y_train:训练集的目标值

　　y_test:测试集的特征值

完整代码：

from sklearn.datasets import load_iris     #导入数据集

from sklearn.model_selection import train_test_split

def datatest():

    # 获取数据集

    iris=load_iris()

    print("鸢尾花数据集：\n",iris)

    print("查看数据集描述：\n", iris.DESCR)

    print("查看特征值的名字：\n",iris.feature_names)

    print("查看特征数据：\n",iris.data,iris.data.shape)

    print("查看目标值名字：\n",iris.target_names)

    print("查看目标数据：\n",iris.target)

    # 划分数据集

    x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)

    print(x_train,x_train.shape)

    print(x_test,x_test.shape)

    print(y_train,y_train.shape)

    print(y_test,y_test.shape)

if __name__ == '__main__':

    datatest()

sklearn数据集的导入及划分的更多相关文章

sklearn数据集划分
sklearn数据集划分方法有如下方法: KFold,GroupKFold,StratifiedKFold,LeaveOneGroupOut,LeavePGroupsOut,LeaveOneOut,L ...
【学习笔记】sklearn数据集与估计器
数据集划分机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效训练数据和测试数据常用的比例一般为:70%: 30%, 80%: 2 ...
机器学习笔记(四)--sklearn数据集
sklearn数据集 (一)机器学习的一般数据集会划分为两个部分训练数据:用于训练,构建模型. 测试数据:在模型检验时使用,用于评估模型是否有效. 划分数据的API:sklearn.model_se ...
sklearn数据集
数据集划分: 机器学习一般的数据集会划分为两个部分训练数据: 用于训练,构建模型测试数据: 在模型检验时使用,用于评估模型是否有效 sklearn数据集划分API: 代码示例文末! scikit- ...
Sklearn数据集与机器学习
sklearn数据集与机器学习组成机器学习组成:模型.策略.优化 <统计机器学习>中指出:机器学习=模型+策略+算法.其实机器学习可以表示为:Learning= Representati ...
13_数据的划分和介绍之sklearn数据集
1.数据集是如何划分?训练数据和评估数据不能使用相同数据,不然自己测自己,会使得准确率虚高,在遇到陌生数据时,不够准确. 2.数据集的获取: 通过load或者fetch方法. 3.数据集进行分割: 训 ...
sklearn——数据集调用及应用
忙了许久,总算是又想起这边还没写完呢. 那今天就写写sklearn库的一部分简单内容吧,包括数据集调用,聚类,轮廓系数等等. 自带数据集API 数据集函数中文翻译任务类型数据规模 load_ ...
SKLearn数据集API（一）
注:本文是人工智能研究网的学习笔记数据集一览类型获取方式自带的小数据集 sklearn.datasets.load_ 在线下载的数据集 sklearn.datasets.fetch_ 计算机生 ...
SKLearn数据集API（二）
注:本文是人工智能研究网的学习笔记计算机生成的数据集用于分类任务和聚类任务,这些函数产生样本特征向量矩阵以及对应的类别标签集合. 数据集简介 make_blobs 多类单标签数据集,为每个类分配 ...

随机推荐

MOS管驱动电路，看这里就啥都懂了
一.MOS管驱动电路综述在使用MOS管设计开关电源或者马达驱动电路的时候,大部分人都会考虑MOS的导通电阻,最大电压等,最大电流等,也有很多人仅仅考虑这些因素.这样的电路也许是可以工作的,但并不是优秀 ...
C# Coding Conventions, Coding Standards & Best Practices
C# Coding Conventions, Coding Standards & Best Practices Cui, Chikun Overview Introduction This ...
圣诞节，把网站所有的js代码都压缩成圣诞树吧。
本文分两章节,分别讲解如何使用js2image这个库生成可以运行的圣诞树代码和 js2image的原理. github地址:https://github.com/xinyu198736/js2ima ...
【wepy入门教程】48小时开发看美女微信小程序，万花阁
说明:本文只做小程序的开发过程记录:小程序仅供学习参考,严禁用于商业及非法用途准备不管是做网站还是做小程序,只要是To C,就少不了做内容,因此第一步依然是数据准备,从网上找到两个网站: http ...
前端每日实战：116# 视频演示如何用 CSS 和原生 JS 开发一个监控网络连接状态的页面
效果预览按下右侧的"点击预览"按钮可以在当前页面预览,点击链接可以全屏预览. https://codepen.io/comehope/pen/oPjWvw 可交互视频此视频是可 ...
WPF控件大全（表格）-学习总结
Label标签 label控件:一般用户描述性文字显示. 在Label控件使用时,一般给予用户提示.用法上没有什么很特殊的,label控件的值记住:不是Text 而是 Content属性. TextB ...
【每日日报】第十八天 ----java最全排序方法
1 今天看了Java的第三章 2 冒泡法排序: package Line; import java.util.Arrays; public class MaoPao { public static v ...
ccf201912-1 报数 C++代码实现
代码实现: #include<iostream> using namespace std; /*题目限制为三位数*/ /*思路: 1.用一个长度为4的数组(初值为0)保存每个人分别跳过了几 ...
Jackson 和 fastJSON 导包异常
内容一.异常信息 HTTP Status 400 - type Status report message org.springframework.http.converter.HttpMessag ...
在Wireshark中使用过滤器——显示过滤器
在Wireshark运行过程中选择搜索(Ctrl-F),第一个默认的搜索选项就是显示过滤器. 显示过滤器用于捕获文件,用来告诉Wireshark只显示那些符合过滤条件的数据包. 显示过滤器比捕获过滤器 ...

sklearn数据集的导入及划分

鸢尾花数据集的导入及查看：

划分数据集：

完整代码：

sklearn数据集的导入及划分的更多相关文章

随机推荐

热门专题