肘部法则–Elbow Method 我们知道k-means是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度(distortions),那么,对于一个簇,它的畸变程度越低,代表簇内成员越紧密,畸变程度越高,代表簇内结构越松散. 畸变程度会随着类别的增加而降低,但对于有一定区分度的数据,在达到某个临界点时畸变程度会得到极大改善,之后缓慢下降,这个临界点就可以考虑为聚类性能较好的点. import pandas as pd from sklearn.cl
源码: from math import fabs #导入数学模块 from time import perf_counter #导入时间模块 from numba import jit @jit def Bar(i): #动态文本条 N = pow(10,level) a = int((i/N)*50) b = 50 - a Y , N = '*' * a , '.' * b print("\r计算中:{:3.0f}% [{}->{}] {:.2f}s" .format(2*a