二分Kmeans的java实现】的更多相关文章

刚刚研究了Kmeans.Kmeans是一种十分简单的聚类算法.可是他十分依赖于用户最初给定的k值.它无法发现随意形状和大小的簇.最适合于发现球状簇.他的时间复杂度为O(tkn).kmeans算法有两个核心点:计算距离的公式&推断迭代停止的条件.一般距採用欧式距离等能够随意.推断迭代停止的条件能够有: 1) 每一个簇的中心点不再变化则停止迭代 2)全部簇的点与这个簇的中心点的误差平方和(SSE)的全部簇的总和不再变化 3)设定人为的迭代次数.观察实验效果. 当初始簇心选择不好的时候聚类的效果会非常…
二分K-means聚类(bisecting K-means) 算法优缺点: 由于这个是K-means的改进算法,所以优缺点与之相同. 算法思想: 1.要了解这个首先应该了解K-means算法,可以看这里这个算法的思想是:首先将所有点作为一个簇,然后将该簇一分为二.之后选择能最大程度降低聚类代价函数(也就是误差平方和)的簇划分为两个簇(或者选择最大的簇等,选择方法多种).以此进行下去,直到簇的数目等于用户给定的数目k为止.2.以上隐含着一个原则是:因为聚类的误差平方和能够衡量聚类性能,该值越小表示…
<mahout in action>第六章. datafile/cluster/simple_k-means.txt数据集例如以下: 1 1 2 1 1 2 2 2 3 3 8 8 8 9 9 8 9 9 1. k-means聚类算法原理 1.从D中随机取k个元素.作为k个簇的各自的中心. 2.分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇. 3.依据聚类结果.又一次计算k个簇各自的中心,计算方法是取簇中全部元素各自维度的算术平均数. 4.将D中所有元素依照新的中心…
kMeans算法原理见我的上一篇文章.这里介绍K-Means的Java实现方法,参考了Python的实现方法. 一.数据点的实现 package com.meachine.learning.kmeans; import java.util.ArrayList; /** * 数据点,有n维数据 * */ public class Point { private static int num; private int id; private int dimensioNum; // 维度 privat…
二分查找问题(Java版)   1.一般实现 package search;   /**  * @author lei 2011-8-17  */ public class BinarySearch {     /**      * 二分查找      *      * 注意:二分查找只是针对有序排列的各种数组或集合      *      * @param target      * @param array      * @return      */     static boolean…
K-means的步骤 输入: 含n 个样本的数据集,簇的数据K 输出: K 个簇 算法步骤: 1.初始化K个簇类中心C1,C2,---Ck (通常随机选择) 2.repeat 步骤3,4 3,将数据集中的每个样本分配到与之最近的中心Ci所在的簇Cj : 4. 更新聚类中心Ci,即计算各个簇的样本均值: 5.直到样本分配不在改变 上代码: import java.lang.annotation.ElementType; import java.lang.annotation.Retention;…
导读 曾几何时学好数据结构与算法是我们从事计算机相关工作的基本前提,然而现在很多程序员从事的工作都是在用高级程序设计语言(如Java)开发业务代码,久而久之,对于数据结构和算法就变得有些陌生了,由于长年累月的码砖的缘故,导致我们都快没有这方面的意识了,虽然这种论断对于一些平时特别注重学习和思考的人来说不太适用,但的确是有这样的一个现象. 而在要出去面试找工作的时候,才发现这些基础都快忘光光了,所以可能就“杯具”了!实际上,对于数据结构和算法相关的知识点的学习,是程序员必须修炼的一门内功,而要掌握…
1.K-means算法简述以及代码原型 数据挖掘中一个重要算法是K-means.我这里就不做具体介绍.假设感兴趣的话能够移步陈皓的博客: http://www.csdn.net/article/2012-07-03/2807073-k-means 讲得非常好 总的来讲,k-means聚类须要下面几个步骤: ①.初始化数据 ②.计算初始的中心点,能够随机选择 ③.计算每一个点到每一个聚类中心的距离.而且划分到距离最短的聚类中心簇中 ④.计算每一个聚类簇的平均值,这个均值作为新的聚类中心,反复步骤3…
[java] /** * 递归分治算法学习之二维二分查找 * @author Sking 问题描述: 存在一个二维数组T[m][n],每一行元素从左到右递增, 每一列元素从上到下递增,现在需要查找元素X(必在二维 数组中)在数组中的位置,要求时间复杂度不超过m+n. */ package 递归分治; public class BinarySearchInArray { /** * 二维二分搜索的实现 * @param array 待查找的二维数组 * @param value  待查找的元素 *…
这里的程序稍微有点变形.k_means方法返回K-means聚类的若干中心点.代码: import java.util.ArrayList; import java.util.Collections; public class Prophet_kmeans { private static final int MAXK = 100; private static int n = 0; private static int K = 0; private static ArrayList<Doubl…