华南理工大学学报(自然科学版) ›› 2013, Vol. 41 ›› Issue (7): 137-144.doi: 10.3969/j.issn.1000-565X.2013.07.023
• 计算机科学与技术 • 上一篇
文贵华1 蔡先发1,2,3† 韦佳1
Wen Gui- hua1 Cai Xian- fa1,2,3† Wei Jia1
摘要: 精确的癌症分类对于癌症的成功诊断和治疗是必不可少的.半监督维数约减算法在干净的数据集上表现得很好,然而当面临噪声时,当前的大部分算法所构造的邻域结构是拓扑不稳定的.为了克服这一问题,文中提出了一种基于随机子空间的半监督维数约减算法( RSSSDR) ,将随机子空间与半监督维数约减算法结合起来.在数据集的不同随机子空间上,该算法首先设计多个不同的子图,然后将这些子图联合起来构成一个混合图并在其上进行维数约减.该算法通过最小化局部重构误差来确定邻域图的边权值,在保持癌症数据集局部结构的同时能够保持其全局结构.在公共癌症数据集上的实验结果表明,RSSSDR 算法具有较高的分类准确率和较好的参数鲁棒性.