python k-means聚类实例

port  sys

reload(sys)

sys.setdefaultencoding('utf-8')

import matplotlib.pyplot as plt

import numpy as np

culster1 = np.random.uniform(0.5, 1.5, (2, 20))

culster2 = np.random.uniform(1.5, 2.5, (2, 20))

culster3 = np.random.uniform(1.5, 3.5, (2, 20))

culster4 = np.random.uniform(3.5, 4.5, (2, 20))

x1 = np.hstack((culster1,culster2))

x2 = np.hstack((culster2,culster3))

x = np.hstack((x1,x2)).T

plt.figure()

plt.axis([0, 5, 0, 5])

plt.xlabel('x')

plt.ylabel('y')

plt.grid(True)

plt.plot(x[:,0],x[:,1], 'k.', markersize = 12)

from sklearn.cluster import KMeans

from scipy.spatial.distance import cdist

kmeans = KMeans(n_clusters = 2)

kmeans.fit(x)

plt.plot(kmeans.cluster_centers_[:,0],kmeans.cluster_centers_[:,1],'ro')

K = range(1, 10)

meandistortions = []

for k in K:

    kmeans = KMeans(n_clusters=k)

    kmeans.fit(x)

    meandistortions.append(sum(np.min(cdist(x, kmeans.cluster_centers_,'euclidean'), axis=1)) / x.shape[0])#选择每行最小距离求和

plt.figure()

plt.grid(True)

plt1 = plt.subplot(2,1,1)

plt1.plot(x[:,0], x[:,1], 'k.')

plt2 = plt.subplot(2,1,2)

plt2.plot(K, meandistortions)

python k-means聚类实例的更多相关文章

机器学习之路：python k均值聚类 KMeans 手写数字
python3 学习使用api 使用了网上的数据集,我把他下载到了本地可以到我的git中下载数据集: https://github.com/linyi0604/MachineLearning 代码: ...
机器学习实战5：k-means聚类：二分k均值聚类+地理位置聚簇实例
k-均值聚类是非监督学习的一种,输入必须指定聚簇中心个数k.k均值是基于相似度的聚类,为没有标签的一簇实例分为一类. 一经典的k-均值聚类思路: 1 随机创建k个质心(k必须指定,二维的很容易确定 ...
Python实现kMeans(k均值聚类)
Python实现kMeans(k均值聚类) 运行环境 Pyhton3 numpy(科学计算包) matplotlib(画图所需,不画图可不必) 计算过程 st=>start: 开始 e=> ...
机器学习算法与Python实践之（五）k均值聚类（k-means）
机器学习算法与Python实践这个系列主要是参考<机器学习实战>这本书.因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学 ...
机器学习算法与Python实践之（六）二分k均值聚类
http://blog.csdn.net/zouxy09/article/details/17590137 机器学习算法与Python实践之(六)二分k均值聚类 zouxy09@qq.com http ...
100天搞定机器学习|day44 k均值聚类数学推导与python实现
[如何正确使用「K均值聚类」? 1.k均值聚类模型给定样本,每个样本都是m为特征向量,模型目标是将n个样本分到k个不停的类或簇中,每个样本到其所属类的中心的距离最小,每个样本只能属于一个类.用C表示 ...
k近邻聚类简介
简介在所有机器学习算法中,k近邻(K-Nearest Neighbors,KNN)相对是比较简单的. 尽管它很简单,但事实证明它在某些任务中非常有效,甚至更好.它可以用于分类和回归问题! 然而,它更 ...
k均值聚类算法原理和（TensorFlow）实现
顾名思义,k均值聚类是一种对数据进行聚类的技术,即将数据分割成指定数量的几个类,揭示数据的内在性质及规律. 我们知道,在机器学习中,有三种不同的学习模式:监督学习.无监督学习和强化学习: 监督学习,也 ...
【转】算法杂货铺——k均值聚类(K-means)
k均值聚类(K-means) 4.1.摘要在前面的文章中,介绍了三种常见的分类算法.分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应.但是很多时 ...
第十篇：K均值聚类(KMeans)
前言本文讲解如何使用R语言进行 KMeans 均值聚类分析,并以一个关于人口出生率死亡率的实例演示具体分析步骤. 聚类分析总体流程 1. 载入并了解数据集:2. 调用聚类函数进行聚类:3. 查看聚类 ...

随机推荐

SpringBoot的条件注解源码解析
SpringBoot的条件注解源码解析 @ConditionalOnBean.@ConditionalOnMissingBean 启动项目会在ConfigurationClassBeanDefini ...
通过Consul Raft库打造自己的分布式系统
通用的CP系统有etcd和consul, 通用的对立面就是专用系统. 所以在某些场合是有这种需求的. 然而etcd embed的可用性极差, Windows上面跑会出现各种问题, 而且不能定制协议, ...
C/C++面试题：C++与C有什么不同？
昨天,小编在一个讨论群里看到这样的对话有人想要入学校编程俱乐部,面试时,学长问了她C++的区别,她没有答上来,就没有通过. 说到C和C++的区别,不只是进入学校社团有考核,出了学校,找工作面 ...
冲刺随笔——Day_Six
这个作业属于哪个课程软件工程 (福州大学至诚学院 - 计算机工程系) 这个作业要求在哪里团队作业第五次--Alpha冲刺这个作业的目标团队进行Alpha冲刺作业正文正文其他参考文献无 ...
Spring Boot + MongoDB 使用示例
本文分别使用 MongoRepository 和 MongoTemplate 实现 MongoDB 的简单的增删改查本文使用 docker 安装 MongoDB: 使用示例 application. ...
记STM32F103C8T6+STLINK下载器在Keil中的设置
调试代码为: /************************************** * 文件名 :main.c * 描述 :获取CPU的96bit ID 和 flash的大小,并通过USAR ...
PyQt学习随笔：Model/View设计中支持View中展示数据的排序
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址在model/view架构中,有两种方法可以实现排序,选择哪种方法依赖于底层Model.如果mode ...
PyQt(Python+Qt)学习随笔：QAbstractScrollArea的用途
老猿Python博文目录老猿Python博客地址 QAbstractScrollArea部件提供了一个带有按需滚动条的滚动区域. QAbstractScrollArea是滚动区域的低级抽象.该区域提 ...
HDFS客户端操作（JAVA代码）
环境准备 windows需要配置hadoop的windows下的依赖安装包地址: 链接:https://pan.baidu.com/s/1QtbH-x-S0QytkmaoSosdEw 提取码:2kt ...
小齐读者拿到快手、百度、网易等 offer 的独门秘籍！
小齐说: 这篇文章来自读者冰红茶,他刚结束了秋招,拿了很多家 offer. 和他聊完之后,我觉得他的备考思路也完全适用于美国的面试,只是分值要调整一下,但是具体每一块的内容,地球村通用.所以分享给大家 ...

python k-means聚类实例

python k-means聚类实例的更多相关文章

随机推荐

热门专题