说明:由于传统的文本特征提取是基于建停用词表(库)进行文本的特征选择,该方式在文本 篇幅和数量巨大的情况下,其建立的停用词表将非常庞大,文本特征词的提取效率非常 低下,本算法采用基于词性的文本特征提取,由于中文词性数量有限,因此文本特征提 取效率很高,便于后期的文本聚类或分类。本算法分词依赖中...
说明:根据深圳市出租车GPS数据所提供的信息,针对交通出行数据的空间分布特征,选取了4月18号这天的全天数据出租车载客后的行驶数据, 利用mtalab对数据的处理,筛选出出租车的起始点及拥堵的时段的行驶数据并通过kmeans聚类分析设定拥堵的标准,得到对于出租车在路段上的车速在小于2.15公里/小时的时候...
说明:isodata 迭代自组织的数据分析,相关分析过程的matlab方法,在matlab环境中自动识别连通区域的大小,matlab开发工具箱中的支持向量机,IMC-PID是利用内模控制原理来对PID参数进行计算,包括AHP,因子分析,回归分析,聚类分析。