说明:应用背景 虽然传统的基因选择方法已经能够取得很好的效果,选出的基因子集有利于后续样本分类,但是这些方法主要考虑数据方差和分布的相关性,从而选出的基因可解释性较差且冗余度较高。为了获得最小冗余可解释的基因子集,本文在充分考虑基因类别灵敏度 (Gene to class sensitivity,...
说明:KNN-KSR方法是一种不直接建立自变量与因变量间数学关系去预测因变量的方法。该方法基于以下两个假设:(1)在所选择的样本描述指标信息足够完备时,性质越相似的样本在同类指标间的空间分布越接近,否则其空间距离也越大;(2)如果两类指标间存在较大关联度,则样本分别在两类指标内的空间分布也具有较大相似性。...
说明:pectralClustering实现了三个谱聚类算法(Unnormalized, Shi & Malik, Jordan & Weiss). Spectral Clustering(谱聚类)是一种基于图论的聚类方法,它能够识别任意形状的样本空间且收敛于全局最有解,其基本思想是利用样本数据...
说明:PLS是用线性回归模型和最小二乘法把X(描述性变量)和Y(观察变量)投射到一个新的空间,从而能在X空间中的找到一个多维向量最大化表示出Y空间上的变化,找到X和Y最根本的联系。 正交偏最小二乘法(OPLS)是基于PLS的,把连续的变量正交(orthogonal) 投射到 latent structur...
说明:支持向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 在机器学习中,支持向量机(SVM,还支持矢量网...