说明:%基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人是谁。本段代码是对音频进行训练,也就是提取特征参数
说明:连续相位调制信号(CPM)产生,课程设计时编写的matlab程序代码,包含特征值与特征向量的提取、训练样本以及最后的识别,实现了对10个数字音的识别,利用最小二乘算法实现对三维平面的拟合,粒子图像分割及匹配均为自行编制的子例程。
说明:梅尔频率倒谱系数,MFCC作为一个重要的特征,用于语音识别,说话人识别方面,在进行模式匹配或基于统计模型的建模时,好的特征时非常重要的,而MFCC特征是现在应用非常广泛的一类倒谱特征。
说明:2015MCM B题资料精华帖