华南理工大学学报(自然科学版) ›› 2013, Vol. 41 ›› Issue (12): 101-106.doi: 10.3969/j.issn.1000-565X.2013.12.017
李力 曹以诚† 毛晓帆
Li Li Cao Yi- cheng Mao Xiao- fan
摘要: 图聚类是一种重要的聚类算法,可有效应用于蛋白质作用网络和芯片数据聚类等领域.文中针对现有基因芯片数据图聚类方法的不足,提出了一种基于模块性指标和子图平滑度的全局图聚类方法.为防止算法陷入局部最优解,引入子图平滑度的定义,打散每次聚类结果中产生的平滑度较低的子图,再对得到的单节点进行下一次聚类,经多次迭代后得到全局最优的聚类结果.采用一组基因组表达数据,将该方法和其他4 种常用聚类方法(经典图聚类、k 均值、SOM 及Fuzzy 算法)进行比较,结果表明:该方法在聚类过程中的平均类间重叠度和FOM'值总体上优于其他4 种算法,在将数据集分类到最佳聚类数39 时,其FOM'值分别比上述4 种方法低28.41% 、19.21% 、9.84% 和24.67% ;其分类准确度高于Fuzzy 法和SOM 算法,算法执行效率则与SOM 算法相近,比Fuzzy 法高5.94% .
中图分类号: