【K-means算法】matlab代码实例学习

MATLAB函数Kmeans

使用方法：
Idx=Kmeans(X,K)
[Idx,C]=Kmeans(X,K)
[Idx,C,sumD]=Kmeans(X,K)
[Idx,C,sumD,D]=Kmeans(X,K)
[…]=Kmeans(…,’Param1’,Val1,’Param2’,Val2,…)

各输入输出参数介绍：
X: N*P的数据矩阵，N为数据个数，P为单个数据维度
K: 表示将X划分为几类，为整数
Idx: N*1的向量，存储的是每个点的聚类标号
C: K*P的矩阵，存储的是K个聚类质心位置
sumD: 1*K的和向量，存储的是类间所有点与该类质心点距离之和
D: N*K的矩阵，存储的是每个点与所有质心的距离

https://blog.csdn.net/wys7541/article/details/82153844

2.
输入：聚类的个数K，数据集，样本距离计算依据
输出：K个聚类

https://blog.csdn.net/sinat_38648388/article/details/83896131

1.仅适合于数值属性的数据。
2.对正态分布（高斯分布）数据聚类效果最佳。

方法：
1. 从D中N个对象任意选择k个对象作为初始簇中心；
2. 根据欧氏距离，依次比较其余每个对象与各个簇中心的距离；选择距离最近的簇，依次把N个对象划分到k个簇中；
3. 完成第一次划分后，重新计算新的簇中心即均值，然后重新划分数据对象，直到新的簇中心不再发生变化。

https://blog.csdn.net/qiu1440528444/article/details/80611942

4.% 输入： data, 为一个矩阵 M×N，表示样本集，其中M表示共有M个样本，　N表示每一个样本的维度；5.% k_value, 表示聚类的类别数目；

% 输出：    output, 是一个列向量 M×１，表示每一个样本属于的类别编号；
https://www.cnblogs.com/yinheyi/p/6132362.html5.

https://www.cnblogs.com/tiandsp/p/3040883.html

6.

https://blog.csdn.net/qq_20936739/article/details/78342882

7.

1,kmeans的k是必须已知的，也就是我必须预先知道分成几类

2,虽然你给定的是K类，但是我最终是有可能跑出来的类数小于初始设定的k，虽然每一个聚类中心都经过初始化，但是最终有的聚类中心可能会不包含一个点，那么这个聚类中心相当于可以省去，即分成k-1类（讲道理这是一件好事，说明原来我认为需要分5类，现在程序跑出来发现4类是最好的，这就达到了处理数据的目的，但是这并不是说我k随便给，最终结果就是最优解，很可能3类是最优，但是4类也能分，但是5类就很难分了,具体比如下面的一个例子) 。

（后来的注释：但是空聚类也有处理方法，就是聚类中心替换为当前距离任意聚类中心最远的点)

3,数据可以是任意维度，修改的仅仅是求距离的方式。
https://blog.csdn.net/fengsigaoju/article/details/52167802

【K-means算法】matlab代码实例学习的更多相关文章

KNN 与 K - Means 算法比较
KNN K-Means 1.分类算法聚类算法 2.监督学习非监督学习 3.数据类型:喂给它的数据集是带label的数据,已经是完全正确的数据喂给它的数据集是无label的数据,是杂乱无章的,经过 ...
谱聚类算法—Matlab代码
% ========================================================================= % 算法名称: Spectral Clus ...
k-means算法MATLAB和opencv代码
上一篇博客写了k-means聚类算法和改进的k-means算法.这篇博客就贴出相应的MATLAB和C++代码. 下面是MATLAB代码,实现用k-means进行切割: %%%%%%%%%%%%%%%% ...
K－means算法
K-means算法很简单,它属于无监督学习算法中的聚类算法中的一种方法吧,利用欧式距离进行聚合啦. 解决的问题如图所示哈:有一堆没有标签的训练样本,并且它们可以潜在地分为K类,我们怎么把它们划分呢? ...
机器学习算法及代码实现–K邻近算法
机器学习算法及代码实现–K邻近算法 1.K邻近算法将标注好类别的训练样本映射到X(选取的特征数)维的坐标系之中,同样将测试样本映射到X维的坐标系之中,选取距离该测试样本欧氏距离(两点间距离公式)最近 ...
编程算法 - 最小的k个数红黑树代码(C++)
最小的k个数红黑树代码(C++) 本文地址: http://blog.csdn.net/caroline_wendy 题目: 输入n个整数, 找出当中的最小k个数. 使用红黑树(multiset) ...
多源最短路Floyd 算法————matlab实现
弗洛伊德(Floyd)算法是一种用于寻找给定的加权图中顶点间最短路径的算法.该算法名称以创始人之一.1978年图灵奖获得者.斯坦福大学计算机科学系教授罗伯特·弗洛伊德命名. 基本思想通过Floyd计 ...
单源最短路Dijkstra算法——matlab实现
迪杰斯特拉(Dijkstra)算法是典型最短路径算法,用于计算一个节点到其他节点的最短路径. 它的主要特点是以起始点为中心向外层层扩展(广度优先搜索思想),直到扩展到终点为止. 基本思想通过Dijk ...
MTCNN算法与代码理解—人脸检测和人脸对齐联合学习
目录写在前面算法Pipeline详解如何训练损失函数训练数据准备多任务学习与在线困难样本挖掘预测过程参考博客:blog.shinelee.me | 博客园 | CSDN 写在前面主 ...

随机推荐

IntelliJ IDEA 2017.3尚硅谷-----设置字体大小行间距
WSUS补丁服务器部署详细
利用WSUS部署更新程序来源于网络转载 WSUS概述为了让用户的windows系统与其他microsoft产品能够更安全,更稳定,因此microsoft会不定期在网站上推出最新的更新程序供用户下 ...
spring 的异步处理
1.先解析几个类的用法 1.1 java.lang.annotation.Annotation @Target(ElementType.FIELD) @Retention(RetentionPoli ...
拓扑排序（poj 1094)
前置知识:拓扑排序详细注释都在代码里 //该题题意明确,就是给定一组字母的大小关系判断他们是否能组成唯一的拓扑序列. //是典型的拓扑排序,但输出格式上确有三种形式: // 1.该字母序列有序,并依 ...
吴裕雄 python 机器学习——数据预处理过滤式特征选取VarianceThreshold模型
from sklearn.feature_selection import VarianceThreshold #数据预处理过滤式特征选取VarianceThreshold模型 def test_Va ...
FileOutputStream，BufferedOutputStream，FileWriter 效率比较
测试代码: /** * 写文件 * FileOutputStream, BufferedOutputStream, FileWriter * 三个流效率比较 */ @Test public void ...
Docker - 命令 - docker container
概述整理 docker 容器的命令 1. 分类(25个) 查看 ls diff logs inspect port stats top 生命周期 pause prune create kill re ...
洛谷 P3901 数列找不同（莫队）
题目链接:https://www.luogu.com.cn/problem/P3901 这道题简单莫队模板题,然后$add$和$del$分别处理$vis[]$从$0-->1$和从$1--> ...
CRPR/CPPR
S CRPR clock reconvergence pessimism removal C CPPR clock path pessimism removal 剔除公共clock path上的悲 ...
[vue学习] 卡片展示分行功能简单实现
如图所示,实现简单的卡片展示分行功能. 分行功能较多地用于展示商品.相册等,本人在学习的过程中也是常常需要用到这个功能:虽然说现在有很多插件都能实现这个功能,但是自己写出来,能够理解原理,相信能够进步 ...

【K-means算法】matlab代码实例学习

【K-means算法】matlab代码实例学习的更多相关文章

随机推荐

热门专题