说明:KNN-KSR方法是一种不直接建立自变量与因变量间数学关系去预测因变量的方法。该方法基于以下两个假设:(1)在所选择的样本描述指标信息足够完备时,性质越相似的样本在同类指标间的空间分布越接近,否则其空间距离也越大;(2)如果两类指标间存在较大关联度,则样本分别在两类指标内的空间分布也具有较大相似性。...
说明:1.计算待分类数据和不同类中每一个数据的距离(欧氏或马氏)。 2.选出最小的前K数据个距离,这里用到选择排序法。 3.对比这前K个距离,找出K个数据中包含最多的是那个类的数据,即为待分类数据所在的类。 不通俗但严谨的规则是:
说明:数据采用PCA降维后进行kmeans聚类确定样本类别,对聚类后数据作图,包括数据点以及质心位置, 随后进行样本集划分,利用knn算法进行有监督的学习分类,经测试,能够取得较好的分类效果。