说明:由于传统的文本特征提取是基于建停用词表(库)进行文本的特征选择,该方式在文本 篇幅和数量巨大的情况下,其建立的停用词表将非常庞大,文本特征词的提取效率非常 低下,本算法采用基于词性的文本特征提取,由于中文词性数量有限,因此文本特征提 取效率很高,便于后期的文本聚类或分类。本算法分词依赖中...
说明:聚类分析的目的是将一组给定的数据分成子集,这样这些子集代表数据本身的某些相似之处。人类的眼睛立刻认识到两个几何形状、 两个半-月亮,并能够将数据划分为两个群集,在那里在同一点群集属于同一半月形。然而,一般来说,和特别是来自现实世界的问题的数据,是不可能只是看看数据,所以我们需要依靠算法来做到这一点。
说明:基于偏置场矫正的模糊C均值聚类算法的实现,经调试,可以运行
说明:文章Clustering by fast search and find of density peaks里的聚类算法代码
说明:采用matlab语言编写的,用于聚类相关方面的dbscan算法源程序,希望对大家有帮助