使用sklearn估计器构建K-Means聚类模型

实例要求：以sklearn库自带的iris数据集为例，使用sklearn估计器构建K-Means聚类模型，并且完成预测类别功能以及聚类结果可视化。

实例代码：

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.datasets import load_iris

from sklearn.preprocessing import MinMaxScaler

from sklearn.cluster import KMeans

from sklearn.manifold import TSNE

'''  构建K-Means模型  '''

iris = load_iris()

iris_data = iris['data'] # 提取数据集中的数据

iris_target = iris['target'] # 提取数据集中的标签

iris_names = iris['feature_names'] # 提取特征名

scale = MinMaxScaler().fit(iris_data) # 训练规则

iris_dataScale = scale.transform(iris_data) # 应用规则

kmeans = KMeans(n_clusters=3,random_state=123).fit(iris_dataScale) # 构建并训练模型

print('构建的K-Means模型为：\n',kmeans)

result = kmeans.predict([[1.5,1.5,1.5,1.5]])

print('花瓣花萼长度宽度全为1.5的鸢尾花预测类别为：',result[0])

'''  聚类结果可视化  '''

tsne = TSNE(n_components=2,init='random',random_state=177).fit(iris_data)    # 使用TSNE进行数据降维，降成两维

df = pd.DataFrame(tsne.embedding_)                    # 将原始数据转换为DataFrame

df['labels'] = kmeans.labels_     # 将聚类结果存储进df数据表中

df1 = df[df['labels']==0]

df2 = df[df['labels']==1]

df3 = df[df['labels']==2]

# fig = plt.figure(figsize=(9,6))    # 绘制图形  设定空白画布，并制定大小

plt.plot(df1[0],df1[1],'bo',df2[0],df2[1],'r*',df3[0],df3[1],'gD')

plt.show()                          # 显示图片

实例结果：

　　构建的K-Means模型为：

　　花瓣预测结果：

　　聚类结果可视化：

使用sklearn估计器构建K-Means聚类模型的更多相关文章

100天搞定机器学习|day44 k均值聚类数学推导与python实现
[如何正确使用「K均值聚类」? 1.k均值聚类模型给定样本,每个样本都是m为特征向量,模型目标是将n个样本分到k个不停的类或簇中,每个样本到其所属类的中心的距离最小,每个样本只能属于一个类.用C表示 ...
探索sklearn | K均值聚类
1 K均值聚类 K均值聚类是一种非监督机器学习算法,只需要输入样本的特征 ,而无需标记. K均值聚类首先需要随机初始化K个聚类中心,然后遍历每一个样本,将样本归类到最近的一个聚类中,一个聚类中样本特征 ...
吴裕雄 python 机器学习——K均值聚类KMeans模型
import numpy as np import matplotlib.pyplot as plt from sklearn import cluster from sklearn.metrics ...
sklearn.neighbors.KNeighborsClassifier(k近邻分类器)
KNeighborsClassifier参数说明KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto', lea ...
ML: 聚类算法-K均值聚类
基于划分方法聚类算法R包: K-均值聚类(K-means) stats::kmeans().fpc::kmeansruns() K-中心点聚类(K-Medoids) ...
自然语言处理--LDA主题聚类模型
LDA模型算法简介: 算法的输入是一个文档的集合D={d1, d2, d3, ... , dn},同时还需要聚类的类别数量m:然后会算法会将每一篇文档 di 在所有Topic上的一个概率值p:这样 ...
机器学习之路：python k均值聚类 KMeans 手写数字
python3 学习使用api 使用了网上的数据集,我把他下载到了本地可以到我的git中下载数据集: https://github.com/linyi0604/MachineLearning 代码: ...
k近邻聚类简介
简介在所有机器学习算法中,k近邻(K-Nearest Neighbors,KNN)相对是比较简单的. 尽管它很简单,但事实证明它在某些任务中非常有效,甚至更好.它可以用于分类和回归问题! 然而,它更 ...

随机推荐

使用 python 操作 mongodb 常用的操作
pymongo 的安装命令 pip install pymongo. import pymongo 数据库及集合查询(创建) 连接数据库查询数据库中的数据库查询数据库中的集合创建数据库和集合只需 ...
VirtualBox虚拟机E_INVALIDARG (0x80070057)
转自:http://www.wzwzl.com/zblog/blog_wz/32.html 打开以前的VirtualBox虚拟机文件时,错误提示:返回代码:E_INVALIDARG (0x80070 ...
mongodb的配置文件详解()
官方地址 https://docs.mongodb.com/manual/reference/configuration-options/#configuration-file 以下页面描述了Mon ...
Python：每日一题008
题目: 判断101-200之间有多少个素数,并输出所有素数. 程序分析: 判断素数的方法:用一个数分别去除2到sqrt(这个数),如果能被整除,则表明此数不是素数,反之是素数. 个人思路及代码: li ...
重启rabbitmq服务
重启rabbitmq服务通过两个命令来实现: rabbitmqctl stop :停止rabbitmq rabbitmq-server restart : 重启rabbitmq 因为rabbitmqc ...
MongoDB学习记录(三) - MongoDB的"增查改删"操作之"查"
查找使用的方法: db.collection.find() 查找所有文档 db.collection.find({})或者db.collection.find({}) 指定键值对 db.collect ...
Codeforces Round #538 (Div. 2) CTrailing Loves (or L'oeufs?)
这题明白的意思就是求n!在b进制下的后缀零的个数. 即最大的n!%(b^k)==0的k的值.我们需要将如果要构成b这个数,肯定是由一个个质因子相乘得到的.我们只需要求出b的质因子,然后分析n!中可以组 ...
Codeforces 873 简要题解
文章目录 A题 B题 C题 D题 E题 F题传送门 A题传送门题意: 一个人要做nnn件事,时间花费分别为a1,a2,...,an,a1≤a2≤a3≤...≤ana_1,a_2,...,a_n, ...
android与php使用base64加密的字符串结果不一样解决方法
base64将字符串转换为字节得到同一个值一.错误 String signString = Base64.encodeToString(signContent.getBytes(),Base64.N ...
Codeforces Round #536 (Div. 2) F 矩阵快速幂 + bsgs(新坑) + exgcd(新坑) + 欧拉降幂
https://codeforces.com/contest/1106/problem/F 题意数列公式为\(f_i=(f^{b_1}_{i-1}*f^{b_2}_{i-2}*...*f^{b_k} ...

使用sklearn估计器构建K-Means聚类模型

使用sklearn估计器构建K-Means聚类模型的更多相关文章

随机推荐

热门专题