numpy数据集练习

#1. 安装scipy，numpy，sklearn包

import numpy as np

#2. 从sklearn包自带的数据集中读出鸢尾花数据集data

from sklearn.datasets import load_iris

iris = load_iris()

#3.查看data类型，包含哪些数据

print(type(iris))

#4.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型

print(iris.keys())

print(iris['data'])

#5.取出所有花的花萼长度(cm)的数据

iris_len=np.array(list(len[0] for len in iris['data']))

print(iris_len)

#6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

for len_width in iris['data']:

    print(len_width[2],len_width[3])

#7.取出某朵花的四个特征及其类别。

print(iris['data'][0],iris['feature_names'][0])

#8.将所有花的特征和类别分成三组，每组50个

iris_a=[]

iris_b=[]

iris_c=[]

for i in range(0,150):

    if iris['target'][i]==0:

        data1=iris['data'][i].tolist()

        data1.append('a')

        iris_a.append(data1)

    elif iris['target'][i]==1:

        data1=iris['data'][i].tolist()

        data1.append('b')

        iris_b.append(data1)

    else:

        data1=iris['data'][i].tolist()

        data1.append('c')

        iris_c.append(data1)

#9.生成新的数组，每个元素包含四个特征+类别

datas=np.array([iris_a,iris_b,iris_c])

print(datas)

#10.计算鸢尾花花瓣长度的最大值，平均值，中值，均方差。

data_len=np.array(list(len[2] for len in iris['data']))

print(data_len)

print(np.max(data_len))

print(np.mean(data_len))

print(np.median(data_len))

print(np.std(data_len))

numpy数据集练习的更多相关文章

第六次作业———numpy数据集练习
1. 安装scipy,numpy,sklearn包 2. 从sklearn包自带的数据集中读出鸢尾花数据集data 3.查看data类型,包含哪些数据 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及 ...
numpy数据集练习 ----------sklearn类
# 1. 安装scipy,numpy,sklearn包 import numpy from sklearn.datasets import load_iris # 2. 从sklearn包自带的数据集 ...
Task5.PyTorch实现L1，L2正则化以及Dropout
1.了解知道Dropout原理深度学习网路中,参数多,可能出现过拟合及费时问题.为了解决这一问题,通过实验,在2012年,Hinton在其论文<Improving neural network ...
numpy.random中的shuffle和permutation以及mini-batch调整数据集(X, Y)
0. numpy.random中的shuffle和permutation numpy.random.shuffle(x) and numpy.random.permutation(x),这两个有什么不 ...
Python 读取UCI iris数据集分析、numpy基础学习
python基础.numpy使用.io读取数据集.数据处理转换与简单分析.读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值 ...
将mnist数据集保存成numpy格式
import numpy as np from urllib import request import gzip import pickle filename = [ ["training ...
[python] 安装numpy+scipy+matlotlib+scikit-learn及问题解决
这篇文章主要讲述Python如何安装Numpy.Scipy.Matlotlib.Scikit-learn等库的过程及遇到的问题解决方法.最近安装这个真是一把泪啊,各种不兼容问题和报错,希望文章对你有所 ...
IRIS数据集的分析-数据挖掘和python入门-零门槛
所有内容都在python源码和注释里,可运行! ########################### #说明: # 撰写本文的原因是,笔者在研究博文“http://python.jobbole.co ...
Fast RCNN 训练自己的数据集（3训练和检测）
转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ https://github.com/YihangLou/fas ...

随机推荐

webpack4 系列教程(十六)：开发模式和生产模式·实战
好文章 https://www.jianshu.com/p/f2d30d02b719
JS(JavaScript）的进一步了解2（更新中···）
js数据类型基本数据类型:string undefined null boolean number 引用数据类型 Object array function 二者的区别基本数据类 ...
Haystack
什么是Haystack Haystack是django的开源全文搜索框架(全文检索不同于特定字段的模糊查询,使用全文检索的效率更高 ),该框架支持Solr,Elasticsearch,Whoosh, ...
Java集合源码分析之LinkedList
1. LinkedList简介 public class LinkedList<E> extends AbstractSequentialList<E> implements ...
js随机数的取整
xls文件导入数据库
protected void btn_ok_Click(object sender, EventArgs e) { int num = 0; ...
【原】git常见用法
1.克隆当前用户:git clone 192.165.53.15:/home/git/repo/Tegra/bsp/tx1_filesystem.git/ 非当前用户:git clone xxxxx ...
Mac安装python3.x+pycharm+elasticsearch+常见报错处理（1）
---恢复内容开始--- mac安装python有两种方式:此处叙述官网安装下载. mac 自带python2.x版本,python2和3之间的差距还是有的.下面简单叙述我安装python3.7的过程 ...
服务定位器（Service Locator）
服务定位器(Service Locator) 跟DI容器类似,引入Service Locator目的也在于解耦.有许多成熟的设计模式也可用于解耦,但在Web应用上, Service Locator绝对 ...
URL组成部分详解
URL组成部分详解 URL是Uniform Resource Locator的简写,统一资源定位符. 一个URL是由以下几部分组成的: scheme://host:port/path/?query-s ...

numpy数据集练习

numpy数据集练习的更多相关文章

随机推荐

热门专题