华南理工大学学报(自然科学版) ›› 2008, Vol. 36 ›› Issue (5): 123-127.
邓九英1 杜启亮1 毛宗源1 姚琛2
Deng Jiu-ying1 Du Qi-liang1 Mao Zong-yuan1 Yao Chen2
摘要: 针对高维大样本环境下支持向量机训练算法面临的耗时增大与维数灾问题,将序列最小优化算法(SMO)与粗糙集(RS)的数据处理功能相结合,提出一种新的基于粗糙集与支持向量机的分类算法RS-SMO.该算法依据属性的重要性对数据集作属性约简,用粗糙边界集法生成类边界集作为SMO的训练子集,使训练集比原始训练集的维数与规模都有一定程度的减少,可构造出具有较好时空性能的算法.实验结果表明,RS-SMO算法能实现结构风险最小化,且性能优于SMO算法.