说明:2010第七届研究生数学建模A题优秀论文-- 肿瘤基因图谱信息提取和分类方法研究
说明:LDA线性判别分析是一种经典的提取特征的算法,它的基本思想是通过样本的类内离散度和类间离散度,寻找由最佳投影矢量构成的投影矩阵。将原始的样本数据投影到特征子空间中,实现数据分类。由于在人脸识别时常常会遇到小样本问题,因此在本次代码中,先用PCA主成分分析的方法降低样本维数,再用线性判别分析提取特征。...
说明:由于传统的文本特征提取是基于建停用词表(库)进行文本的特征选择,该方式在文本 篇幅和数量巨大的情况下,其建立的停用词表将非常庞大,文本特征词的提取效率非常 低下,本算法采用基于词性的文本特征提取,由于中文词性数量有限,因此文本特征提 取效率很高,便于后期的文本聚类或分类。本算法分词依赖中...
说明:应用背景MATLAB(矩阵实验室)是一个多模式的数值计算环境和第四代编程语言。由Mathworks公司专有的编程语言,MATLAB允许矩阵运算,函数和数据绘图,算法实现,用户界面的创建,并与其他语言编写的程序接口,包括C,C++,Java,Python语言和。虽然MATLAB主要用于数值计算,一个可...