华南理工大学学报(自然科学版) ›› 2023, Vol. 51 ›› Issue (9): 110-119.doi: 10.12141/j.issn.1000-565X.220751

• 计算机科学与技术 • 上一篇    下一篇

基于统一标签矩阵的快速多视图聚类

刘怡俊1 王嘉达2 钟仕杰3 杨晓君3 叶武剑1   

  1. 1.广东工业大学 集成电路学院, 广东 广州 510006
    2.广东工业大学 先进制造学院, 广东 揭阳 515200
    3.广东工业大学 信息工程学院, 广东 广州 510006
  • 收稿日期:2022-11-15 出版日期:2023-09-25 发布日期:2023-02-20
  • 通信作者: 杨晓君(1983-),男,博士,副教授,主要从事机器学习、聚类算法研究。 E-mail:yangxj18@gdut.edu.cn
  • 作者简介:刘怡俊(1977-),男,教授,博士生导师,主要从事类脑计算机、深度学习研究。E-mail:yjliu@gdut.edu.cn
  • 基金资助:
    国家重点研发计划项目(2018YFB1802100);广东省重点领域研发计划项目(2018B030338001);广州市基础研究计划基础与应用基础研究项目(202201010595);广东省教育厅创新人才项目和广东工业大学青年百人项目(220413548)

Fast Multi-View Clustering Based on Uniform Label Matrix

LIU Yijun1 WANG Jiada2 ZHONG Shijie3 YANG Xiaojun3 YE Wujian1   

  1. 1.School of Integrated Circuits,Guangdong University of Technology,Guangzhou 510006,Guangdong,China
    2.School of Advanced Manufacturing,Guangdong University of Technology,Jieyang 515200,Guangdong,China
    3.School of Information Engineering,Guangdong University of Technology,Guangzhou 510006,Guangdong,China
  • Received:2022-11-15 Online:2023-09-25 Published:2023-02-20
  • Contact: 杨晓君(1983-),男,博士,副教授,主要从事机器学习、聚类算法研究。 E-mail:yangxj18@gdut.edu.cn
  • About author:刘怡俊(1977-),男,教授,博士生导师,主要从事类脑计算机、深度学习研究。E-mail:yjliu@gdut.edu.cn
  • Supported by:
    the National Key R&D Program of China(2018YFB1802100);the Key-Area R&D Program of Guangdong Province(2018B030338001)

摘要:

在多视图聚类领域,众多方法直接从原始数据中学习相似矩阵,但是这忽视了原始数据中的噪声所产生的影响;此外,还有一些方法必须对图拉普拉斯矩阵进行特征分解,这导致可解释性的降低且需要k-means等后处理。为解决以上问题,文中提出一种基于统一标签矩阵的快速多视图聚类。首先,从松弛的归一化切割和比率切割的统一观点出发对目标函数增加非负约束;然后,通过指示矩阵对相似矩阵进行结构化图重构,确保获得的图具有强簇内连接和弱簇间连接;此外,通过设置统一的标签矩阵降低迭代次数,从而进一步提升该方法的运行速度;最后,基于交替方向乘子法的策略对问题进行优化求解。算法通过随机选择锚点地址的方法对多视图数据集进行对齐,对齐视图能够大幅提升聚类的精度。在迭代过程中通过使用奇异值分解来替代特征分解,有效地解决了传统谱聚类算法计算复杂度高的问题;通过按行索引指示矩阵的最大元素的列标直接获得标签。在4个真实数据集上的实验结果证明了该算法的有效性,表明其聚类性能优于现有的9种基准算法。

在多视图聚类领域,众多方法直接从原始数据中学习相似矩阵,但是这忽视了原始数据中的噪声所产生的影响;此外,还有一些方法必须对图拉普拉斯矩阵进行特征分解,这导致可解释性的降低且需要k-means等后处理。为解决以上问题,文中提出一种基于统一标签矩阵的快速多视图聚类。首先,从松弛的归一化切割和比率切割的统一观点出发对目标函数增加非负约束;然后,通过指示矩阵对相似矩阵进行结构化图重构,确保获得的图具有强簇内连接和弱簇间连接;此外,通过设置统一的标签矩阵降低迭代次数,从而进一步提升该方法的运行速度;最后,基于交替方向乘子法的策略对问题进行优化求解。算法通过随机选择锚点地址的方法对多视图数据集进行对齐,对齐视图能够大幅提升聚类的精度。在迭代过程中通过使用奇异值分解来替代特征分解,有效地解决了传统谱聚类算法计算复杂度高的问题;通过按行索引指示矩阵的最大元素的列标直接获得标签。在4个真实数据集上的实验结果证明了该算法的有效性,表明其聚类性能优于现有的9种基准算法。

关键词: 多视图聚类, 标签矩阵, 图重构, 可解释性

Abstract:

In the field of multi-view clustering, many methods learn the similarity matrix directly from the original data, but this ignores the effect of noise in the original data. In addition, some methods must perform a feature decomposition on the graph Laplacian matrix, which leads to reduced interpretability and requires post-processing such as k-means. To address these issues, this paper proposed a fast multi-view clustering based on a unified label matrix. Firstly, a non-negative constraint was added to the objective function from the unified viewpoint of the normalized cut of the relaxation and the ratio cut. Then, a structured graph reconstruction was performed on the similarity matrix by the indicator matrix to ensure that the obtained graph has strong intra-cluster connections and weak inter-cluster connections. In addition, the number of iterations was reduced by setting a unified label matrix, thus further improving the speed of the method. Finally, the problem was solved optimally based on an alternating direction multiplication strategy. The algorithm aligns the multi-view dataset by randomly selecting the anchor addresses, and aligning the views can significantly improve the accuracy of clustering. The problem of the high computational complexity of traditional spectral clustering algorithms was effectively solved by using singular value decomposition instead of feature decomposition in the iterative process. Labels were obtained directly by indicating the column labels of the largest element of the matrix by row index. Experimental results on four real datasets demonstrate the effectiveness of the algorithm, and show that its clustering performance outperformed the nine existing benchmark algorithms.

Key words: multi-view clustering, label matrix, graph reconstruction, interpretability

中图分类号: