摘要:
数据离散化和归一化 在进行数据分析时,通常需要对数据进行归一化和离散化的操作 from pylab import * from numpy import * import codecs import matplotlib.pyplot as plt import operator #新加了一个库,用 阅读全文
摘要:
Calinski-Harabaz(CH) CH指标通过计算类中各点与类中心的距离平方和来度量类内的紧密度,通过计算各类中心点与数据集中心点距离平方和来度量数据集的分离度,CH指标由分离度与紧密度的比值得到。从而,CH越大代表着类自身越紧密,类与类之间越分散,即更优的聚类结果。 在scikit-lea 阅读全文