【原创】Kmeans算法优缺点分析 - 相关文章

【【原创】Kmeans算法优缺点分析】的更多相关文章

【原创】Kmeans算法优缺点分析

优点: 原理简单(靠近中心点),实现容易(1.2 天),聚类效果中上(依赖K的选择) 缺点: 1. 无法确定K的个数 (根据什么指标确定K) 2. 对离群点敏感 (容易导致中心点偏移) 3. 算法复杂度不易控制 O(NKm), 迭代次数可能较多 (m可能会比较大) 4. 局部最优解而不是全局优 (这个和初始点选谁有关) 5. 结果不稳定 (受输入顺序影响) 6. 无法增量计算 (同5) etc 各种改进版也是针对不同缺点的回避. 但每个问题又不是特别有普适性,所以我认为根据具体情况做出合适的改进…

【计算机视觉】背景建模--Vibe 算法优缺点分析

一.Vibe 算法的优点 Vibe背景建模为运动目标检测研究邻域开拓了新思路,是一种新颖.快速及有效的运动目标检测算法.其优点有以下两点: 1.思想简单,易于实现.Vibe通常随机选取邻域20个样本为每个像素点建立一个基于样本的背景模型,具有初始化速度快.内存消耗少和占用资源少等优点,随后,利用一个二次抽样因子φ,使有限的样本基数能近似表示无限的时间窗口,即在较少样本前提下,保证算法的准确性,最后,并采用一种领域传播机制保证算法的空间一致性. 2.运算效率高.有两方面的原因:一是Vibe背景模型…

【原创】数据挖掘案例——ReliefF和K-means算法的医学应用

数据挖掘方法的提出,让人们有能力最终认识数据的真正价值,即蕴藏在数据中的信息和知识.数据挖掘 (DataMiriing),指的是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的.事先未知的潜在有用信息,数据挖掘是目前国际上,数据库和信息决策领域的最前沿研究方向之一.因此分享一下很久以前做的一个小研究成果.也算是一个简单的数据挖掘处理的例子. 1.数据挖掘与聚类分析概述数据挖掘一般由以下几个步骤: (l)分析问题:源数据数据库必须经过评估确认其是否符合数据挖掘标准.以决定预期结果,…

基于ReliefF和K-means算法的医学应用实例

基于ReliefF和K-means算法的医学应用实例数据挖掘方法的提出,让人们有能力最终认识数据的真正价值,即蕴藏在数据中的信息和知识.数据挖掘 (DataMiriing),指的是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的.事先未知的潜在有用信息,数据挖掘是目前国际上,数据库和信息决策领域的最前沿研究方向之一.因此分享一下很久以前做的一个小研究成果.也算是一个简单的数据挖掘处理的例子. 1.数据挖掘与聚类分析概述数据挖掘一般由以下几个步骤: (l)分析问题:源数据数据库必…

k-means算法之见解（一）

k-menas算法之见解主要内容: 一.引言二.k-means聚类算法一.引言: 先说个K-means算法很高大上的用处,来开始新的算法学习.美国竞选总统,选票由公民投出,总统由大家决定.在2004年出现候选人得票数非常接近,所以1%的选民手中的选票非常关键,决定着总统的归属.那么如何找出这类选民,以及如何在有限的预算下采取措施来吸引他们呢? 答案就是聚类,这就要说到本次要讲到的K-means算法了.通过收集用户的信息,可以同时收集用户满意和不满意的信息:然后将这些信息输入到聚类算法中,就…

数据挖掘案例:基于 ReliefF和K-means算法的应用

数据挖掘案例:基于 ReliefF和K-means算法的应用数据挖掘方法的提出,让人们有能力最终认识数据的真正价值,即蕴藏在数据中的信息和知识.数据挖掘(DataMiriing),指的是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的.事先未知的潜在有用信息,数据挖掘是目前国际上,数据库和信息决策领域的最前沿研究方向之一.因此分享一下很久以前做的一个小研究成果.也算是一个简单的数据挖掘处理的例子. 1.数据挖掘与聚类分析概述数据挖掘一般由以下几个步骤: (l)分析问题:源数据数…

K-means算法的优缺点

K-means算法的优缺点优点:原理简单,实现容易缺点: 收敛较慢算法时间复杂度比较高 \(O(nkt)\) 不能发现非凸形状的簇需要事先确定超参数K 对噪声和离群点敏感结果不一定是全局最优,只能保证局部最优…

原创：Kmeans算法实战+改进（java实现）

kmeans算法的流程: EM思想很伟大,在处理含有隐式变量的机器学习算法中很有用.聚类算法包括kmeans,高斯混合聚类,快速迭代聚类等等,都离不开EM思想.在了解kmeans算法之前,有必要详细了解一下EM思想. Kmeans算法属于无监督学习中的一种,相比于监督学习,能节省很多成本,省去了大量的标签标注.每个数据点都有自己的隐式的分类.聚类要做的是,从中选取出数个聚类中心,对数据集进行初始聚类.此后,通过更新聚类中心(把簇中心缓存起来),重新聚类,然后再更新簇中心,如果此簇中心与旧的簇…

K-Means 聚类算法原理分析与代码实现

前言在前面的文章中,涉及到的机器学习算法均为监督学习算法. 所谓监督学习,就是有训练过程的学习.再确切点,就是有 "分类标签集" 的学习. 现在开始,将进入到非监督学习领域.从经典的聚类问题展开讨论.所谓聚类,就是事先并不知道具体分类方案的分类 (允许知道分类个数). 本文将介绍一个最为经典的聚类算法 - K-Means 聚类算法以及它的两种实现. 现实中的聚类分析问题 - 总统大选假设 M 国又开始全民选举总统了,目前 Mr.OBM 的投票率为48%(投票数占所有选民人数的百分比…

斯坦福机器学习实现与分析之八（kmeans算法）

Kmeans算法简介作为无监督学习领域的一种简单的算法,Kmeans在实际应用中却是相当广泛的.其过程是通过不断交替迭代求得最优的类中心以及每个样本所属类别,具体步骤如下: 确定类别个数k 随机初始化k个类的中心,分别为(\mu_1, \mu_2, -, \mu_k ) 确定每个样本类别,原则为样本与类中心距离最小,即 \begin{aligned} c^{(i)}=\underset{j}{arg min}Dist(x^{(i)}, \mu_j) \end{aligned} 更新每个类的中心…