用sklearn封装的kmeans库

由于需要海量的进行聚类，所以将 k-means 算法自我封装成一个方便利用的库，可以直接调用得到最优的 k值 和 中心点：

#!/usr/bin/python3.4

# -*- coding: utf-8 -*-

# k-means算法

import numpy as np

from sklearn.cluster import KMeans

from sklearn import metrics

def calckmean(array, karr):

    # array是一个二维数组

    # X = [[1, 2, 3, 4], [5, 6, 7, 8], [3, 4, 5, 6]]

    # k是待选取K值的数组

    # karr = [2, 3, 4, 5, 8,...]

    # 将原始数据由数组变成矩阵

    x = np.array(array)

    # 用来储存轮廓系数的数组

    score = []

    # 用来储存中心坐标点的数组

    point = []

    # 用来储存各个簇的坐标

    coordinates = []

    for k in karr:

        kmeans_model = KMeans(n_clusters=k).fit(x)

        # title = 'K = %s, 轮廓系数 = %.03f' % (k, metrics.silhouette_score(X, kmeans_model.labels))

        # print(title)

        # 获取中心点的坐标

        counter_point = kmeans_model.cluster_centers_

        # print("k=" + str(k) + "时的中心点为" + "\n" + str(counter_point))

        # 记录分数

        # print(metrics.silhouette_score(x, kmeans_model.labels_,metric='euclidean'))

        score.append("%.03f" % (metrics.silhouette_score(x, kmeans_model.labels_)))

        # 记录中心坐标

        point.append(counter_point)

        # 将坐标属于哪个簇的标签储存到数组

        # k = 3 : [0 0 0 0 1 1 1 1 1 2 2 2 2 2]

        # k = 4 : [1 1 1 1 0 0 0 0 0 3 2 2 3 2]

        coordinates.append(kmeans_model.labels_)

    # 返回轮廓系数最大的k值\中心坐标\分簇坐标

    maxscore = max(score, default=0)

    for i in range(0, len(score)):

        if maxscore == score[i]:

            # 储存分簇坐标的数组

            coordinate = []

            for j in range(0, len(point[i])):

                temp = []

                for item in zip(coordinates[i], array):

                    if item[0] == j:

                        temp.append(item[1])

                coordinate.append(temp)

                # 得到的样式为k=3，每个簇点的坐标群

                # coordinate = [[[7, 1], [8, 2], [9, 1], [7, 1], [9, 3]],

                #               [[5, 8], [6, 6], [5, 7], [5, 6], [6, 7]],

                #               [[1, 1], [2, 3], [3, 2], [1, 2]]]

            return karr[i], point[i], coordinate

调用的时候直接可以：

from kmeans import *

测试数据：

#!/usr/bin/python3.4

# -*- coding: utf-8 -*-

from kmeans import *

x1 = np.array([1, 2, 3, 1, 5, 6, 5])

x2 = np.array([1, 3, 2, 2, 8, 6, 7])

# a = [[1, 2, 3, 1, 5, 6, 5], [1, 3, 2, 2, 8, 6, 7], [3, 5, 9, 4, 7, 6, 1], [1, 5, 3, 4, 8, 6, 7], [5, 1, 2, 3, 6, 9, 4],[8, 4, 6, 2, 1, 6, 3]]

a = [[1, 1], [2, 3], [3, 2], [1, 2], [5, 8], [6, 6], [5, 7], [5, 6], [6, 7], [7, 1], [8, 2], [9, 1], [7, 1], [9, 3]]

karr = [2, 3, 4, 5, 8]

# print(np.array(a))

# print(list(zip(x1, x2)))

k, point = calckmean(a, karr)

print("最好的可以分成" + str(k) + "个簇，中心点为" + "\n" + str(point))

用sklearn封装的kmeans库的更多相关文章

使用sklearn估计器构建K-Means聚类模型
实例要求:以sklearn库自带的iris数据集为例,使用sklearn估计器构建K-Means聚类模型,并且完成预测类别功能以及聚类结果可视化. 实例代码: import pandas as pd ...
封装ios静态库碰到的一些问题（一）
封装IOS动态库,碰到的第一个问题,就是资源文件的问题,如果将你的程序封装成为静态库,那么静态库中不会包含资源文件和xib文件,这个时候就需要自己封装bundle文件了,而笔者开发环境默认是xcode ...
函数return/获取元素样式/封装自己的库
一:函数return <!DOCTYPE HTML> <html> <head> <meta http-equiv="Content-Type&qu ...
JsQuick--个人封装的Js库
JsQuick 该库为本人封装的Js库,尚未进行浏览器兼容 /** * 快速框架版本:1.0.0 * 日期:2015.02.26 * 作者:简楚恩 */ /** * 快速获取控件类 */ var $ ...
C# 将 WebService 封装成动态库
C# 将 WebService 封装成动态库服务与服务之间的远程调用,经常会通过Web Service来实现,Web Service是支持跨语言调用的,可以是java调用c++或c#调用java等, ...
sklearn中的KMeans算法
1.聚类算法又叫做“无监督分类”,其目的是将数据划分成有意义或有用的组(或簇).这种划分可以基于我们的业务需求或建模需求来完成,也可以单纯地帮助我们探索数据的自然结构和分布. 2.KMeans算法将一 ...
封装一个postMessage库，进行iframe跨域交互
这是近期个人在开发chrome插件时的其中一个小总结.还有很多没有总结出来.因为目前插件还在迭代中,(herry菌插件,用于B站C站),属于个人业余的一个小项目.还有很多功能没有实现,以及还需要再看能 ...
C++封装静态链接库和使用
零碎记事距离上次发博客已经有一年半了,转眼间我也是从做图像研究到了做游戏开发,说起来看看前面的博文,本来就有前兆的东西呢(笑)......因为主要还是在使用虚幻引擎,所以C++的东西会碰到多一些. ...
faster_rcnn c++版本的 caffe 封装，动态库（2）
摘要: 转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/ github上的代码链接,求给星星:) https:// ...

随机推荐

Asp.net并发请求导致的数据重复插入问题
前段时间工作中,有客户反应了系统中某类待办重复出现两次的情况.我核实了数据之后,分析认为是并发请求下导致的数据不一致性问题,并做了重现.其实这并不是一个需要频繁调用的功能,但是客户连续点击了两次,导致 ...
jinja2
本文转自:https://www.cnblogs.com/dachenzi/p/8242713.html 模板要了解jinja2,那么需要先理解模板的概念.模板在Python的web开发中广泛使用, ...
Alpha冲刺——代码规范、冲刺任务与计划
代码规范作业描述课程软件工程1916|W(福州大学) 团队名称修!咻咻! 作业要求项目Alpha冲刺(团队) 团队目标切实可行的计算机协会维修预约平台开发工具 Eclipse 团队信息 ...
【转】腾讯云-解决Winscp permission denied的问题
刚刚注册完腾讯云,因为要用来跑作业代码,所以操作系统选择的Ubuntu 16.04 32位用Winscp登陆之后出现了错误代码为3的permission denied的错误,不能创建路径,也不能上传 ...
C#代码总结02---使用泛型来获取Asp前台页面全部控件，并进行属性修改
该方法:主要用于对前台页面的不同类型(TextBox.DropDownList.等)或全部控件进行批量操作,用于批量修改其属性(如,Text.Enable). private void GetCont ...
根据dateFormatter创建NSDate类型数据
根据dateFormatter 2000-01-01 创建NSDate类型数据 NSDateFormatter *dateFormatter = [NSDate shareDateFormatter] ...
在 Vim 中优雅地查找和替换(转)
总有人问我 Vim 中能不能查找,当然能!而且是超级强的查找! 这篇文章来详细介绍 Vim 中查找相关的设置和使用方法. 包括查找与替换.查找光标所在词.高亮前景/背景色.切换高亮状态.大小写敏感查找 ...
再回首数据结构—数组（Golang实现）
数组为线性数据结构,通常编程语言都有自带了数组数据类型结构,数组存放的是有个相同数据类型的数据集: 为什么称数组为线性数据结构:因为数组在内存中是连续存储的数据结构,数组中每个元素最多只有左右两个方向 ...
3.jmeter接口测试---脚本录制
安装好jmeter后,就要进入主题了,进行接口测试,接口测试的脚本获取方式 ①手动填写 ②badboy录制后,导入jmeter使用 ③jmeter录制不会安装的可以进入这里:https://www. ...
ionic4 开发企业微信应用0
作为一个后台开发人员,几年前参与过Ionic1开发过一微信公众号的经历,所以这次开发企业微信应用,就使用了ionic,正好ionic4 rc版本发布,虽然不是正式版,作为本项目的项目经理,还是决定使用 ...

用sklearn封装的kmeans库

用sklearn封装的kmeans库的更多相关文章

随机推荐

热门专题