华南理工大学学报(自然科学版) ›› 2005, Vol. 33 ›› Issue (1): 6-9.

• • 上一篇    下一篇

一种支持向量聚类的快速算法

吕常魁 姜澄宇 王宁生   

  1. 南京航空航天大学 CIMS研究中心,江苏 南京 210016
  • 收稿日期:2004-03-22 出版日期:2005-01-25 发布日期:2005-01-25
  • 通信作者: 吕常魁(1971-),男,博士生,主要从事计算机 基于文献[4,11],Ben—Hur等提出的支持向量集成制造、计算机视觉及工业应用方面的研究 E-mail:maillck@yahoo.com.cn
  • 作者简介:吕常魁(1971-),男,博士生,主要从事计算机 基于文献[4,11],Ben—Hur等提出的支持向量集成制造、计算机视觉及工业应用方面的研究

A Fast Algorithm for Support Vector Clustering

Lü Chang-kui  Jiang Cheng-yu  Wang Ning-sheng   

  • Received:2004-03-22 Online:2005-01-25 Published:2005-01-25
  • Contact: 吕常魁(1971-),男,博士生,主要从事计算机 基于文献[4,11],Ben—Hur等提出的支持向量集成制造、计算机视觉及工业应用方面的研究 E-mail:maillck@yahoo.com.cn
  • About author:吕常魁(1971-),男,博士生,主要从事计算机 基于文献[4,11],Ben—Hur等提出的支持向量集成制造、计算机视觉及工业应用方面的研究

摘要: 为了降低支持向量聚类(Support Vector Clustering,SVC)的运算复杂性,基于Yang等提出的邻近图法,用Mercer核来表达Hilbert空间中的Euclidean距离,以此作为边的权重度量来生成最小生成树(Minimum Spanning Tree,MST),并只对MST的主干进行SVC连接运算.文中还定义了不相容性度量,并将其作为SVC连接运算中边的选择依据.试验证明,改进后算法的运行速度及聚类效果均优于邻近图法,特别是对大数据集的处理具有明显的优势,且具有一定的抗噪能力.

关键词: 支持向量机, 支持向量聚类, 邻近图, 最小生成树

Abstract:

In order to reduce the computational complexity of SVC(Support Vector Clustering)on the basis of the proximity graph model developed by Yang et al.,the Euclidean distance in the Hilbert space is calculated by using a Mercer kernel,which is used as the weight criterion to generate a MST(Minimum Spanning Tree).The connec-tivity estimations are then lowered by only checking the linkages between the edges that construct the main stem of the MST.Moreover,the non-compatibility degree is defined to support the edge selection during linkage estima-tions.Experimental results confirm that.compared with the proximity graph model,the proposed approach is of fas-ter speed,optimized clustering quality and strong ability of noise suppression,which makes SVC advantageous in dealing with large data sets.

Key words: support vector machine, support vector clustering, proximity graph, minimum spanning tree