k-means伪代码

1、初始化k个簇中心。

2、更新所有样本点簇归属：样本点到哪个簇中心点最近就属于哪个簇。

3、重新计算每个簇的中心点（直到簇中心点不再变化或达到更新最大次数）

#k-means伪代码

import numpy as np

import copy

#计算欧氏距离

def get_distance(X,Y):

    return np.sum((X-Y)**2)**0.5

def calc_mean(X): #计算中心点，每一维取均值

    l=len(X[0])

    list_mean=[]

    for i in range(l):

        s=0

        for j in X:

            s+=j[i]

        m=s/len(X)

        list_mean.append(m)

    return list_mean

def k_means(x_train,k,max_iter):

    num_iter = 0

    #初始簇中心

    cluster_center = x_train[:k]

    pre_cluster_center = copy.deep_copy(cluster_center) #上一次的簇中心点

    #开始迭代

    while num_iter<max_iter:

        #临时变量

        clusters_data={} #字典{簇下标：坐标}

        for i in x_train:

            cluster_dists=[]

            for index,cluster in enumerate(cluster_center):

                distance=get_distance(i,cluster)

                cluster_dists.append((index,distance)) #每个样本到中心点的距离

            cluster_dists.sort(key=lambda x:x[1]) #升序

            min_index,min_dist=cluster_dists[0] #取距离最近

            if min_index not in clusters_data:

                clusters_data[min_index]=[]

            clusters_data[min_index].append(i) #数据添加到临时变量中

        #更新簇中心点

        for index in clusters_data:

            cluster_center[index]=calc_mean(clusters_data[index])

        if pre_cluster_center == cluster_center:

            break   #如果簇中心点不再变化，那么结束

        else:

            pre_cluster_center = copy.deep_copy(cluster_center) #拷贝一下

    return cluster_center #返回最终的簇中心点

k-means伪代码的更多相关文章

KNN 与 K - Means 算法比较
KNN K-Means 1.分类算法聚类算法 2.监督学习非监督学习 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据喂给它的数据集是无label的数据,是杂乱无章的,经过 ...
软件——机器学习与Python，聚类，K——means
K-means是一种聚类算法: 这里运用k-means进行31个城市的分类城市的数据保存在city.txt文件中,内容如下: BJ,2959.19,730.79,749.41,513.34,467. ...
快速查找无序数组中的第K大数？
1.题目分析: 查找无序数组中的第K大数,直观感觉便是先排好序再找到下标为K-1的元素,时间复杂度O(NlgN).在此,我们想探索是否存在时间复杂度 < O(NlgN),而且近似等于O(N)的高 ...
网络费用流-最小k路径覆盖
多校联赛第一场(hdu4862) Jump Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Ot ...
numpy.ones_like(a, dtype=None, order='K', subok=True)返回和原矩阵一样形状的1矩阵
Return an array of ones with the same shape and type as a given array. Parameters: a : array_like Th ...
[DL学习笔记]从人工神经网络到卷积神经网络_1_神经网络和BP算法
前言:这只是我的一个学习笔记,里边肯定有不少错误,还希望有大神能帮帮找找,由于是从小白的视角来看问题的,所以对于初学者或多或少会有点帮助吧. 1:人工全连接神经网络和BP算法 <1>:人工 ...
<机器学习>无监督学习算法总结
本文仅对常见的无监督学习算法进行了简单讲述,其他的如自动编码器,受限玻尔兹曼机用于无监督学习,神经网络用于无监督学习等未包括.同时虽然整体上分为了聚类和降维两大类,但实际上这两类并非完全正交,很多地方 ...
机器学习算法的基本知识（使用Python和R代码）
本篇文章是原文的译文,然后自己对其中做了一些修改和添加内容(随机森林和降维算法).文章简洁地介绍了机器学习的主要算法和一些伪代码,对于初学者有很大帮助,是一篇不错的总结文章,后期可以通过文中提到的算法 ...
当我们在谈论kmeans（2）
本稿为初稿,后续可能还会修改:如果转载,请务必保留源地址,非常感谢! 博客园:http://www.cnblogs.com/data-miner/ 其他:建设中- 当我们在谈论kmeans(2 ...
scikit-learn包的学习资料
http://scikit-learn.org/stable/modules/clustering.html#k-means http://my.oschina.net/u/175377/blog/8 ...

随机推荐

Java学习之==>IO文件操作体系
一.概述在整个 Java.io 中最重要的就是5个类和一个接口.5个类指的是 File.InputStream.OutputStream.Reader.Writer,一个接口指的是Serializa ...
RL - 001- 入门
https://www.freecodecamp.org/news/an-introduction-to-reinforcement-learning-4339519de419/ https://gi ...
java：Spring框架1（基本配置，简单基础代码模拟实现，spring注入（DI））
1.基本配置: 步骤一:新建项目并添加spring依赖的jar文件和commons-logging.xx.jar: 步骤二:编写实体类,DAO及其实现类,Service及其实现类; 步骤三:在src下 ...
ROS自动切换策略
自动切换策略,具体如下监视地址:1.1.1.1 轮询时间:30s:超时时间:1000ms up /ip firewall nat set [/ip firewall nat find comment ...
线性模型-线性回归、Logistic分类
线性模型是机器学习中最简单的,最基础的模型结果,常常被应用于分类.回归等学习任务中. 回归和分类区别: 回归:预测值是一个连续的实数: 分类:预测值是离散的类别数据. 1. 线性模型做回归任务 ...
Pandas中关于 loc \ iloc 用法的理解
转载至:https://blog.csdn.net/w_weiying/article/details/81411257 loc函数:通过行索引 "Index" 中的具体值来取行数 ...
USACO2.2 Preface Numbering【思维+打表】
这道题乍一看没有什么思路,细看还是没有什么思路嗯,细看还是可以看出些什么端倪. 不能复合嵌套什么的总结一下就只有这样3种规则: 1.IXCM最多三个同样连续加起来2.递减:加起来注意VLD不连 ...
Layer 弹出层抖动问题
layer.open({ type: 2, anim: 5,//加上anim,渐显 title: '品牌列表', shadeClose: fal ...
Java 注解：@PostConstruct和@PreConstruct
从Java EE5规范开始,Servlet增加了两个影响Servlet生命周期的注解(Annotation):@PostConstruct和@PreConstruct.这两个注解被用来修饰一个非静态的 ...
jquery ajax get 数组参数
对一些get请求,但方法参数要求是数组或集合的,如下 public virtual ActionResult Test(List<int> ids) { return Json(" ...

k-means伪代码

k-means伪代码的更多相关文章

随机推荐

热门专题