华南理工大学学报(自然科学版) ›› 2012, Vol. 40 ›› Issue (9): 69-74.

• 计算机科学与技术 • 上一篇    下一篇

使用自适应线性回归的多标签分类算法

汤进1,2 黄莉莉1,2 赵海峰1,2 罗斌1,2   

  1. 1.安徽大学 计算机科学与技术学院,安徽 合肥 230601;2.安徽省工业图像处理与分析重点实验室,安徽 合肥 230039
  • 收稿日期:2012-01-04 修回日期:2012-05-31 出版日期:2012-09-25 发布日期:2012-08-01
  • 通信作者: 汤进(1976-) ,男,博士,副教授,主要从事图像处理与模式识别研究. E-mail:ahhftang@ gmail.com
  • 作者简介:汤进(1976-) ,男,博士,副教授,主要从事图像处理与模式识别研究.
  • 基金资助:

    国家自然科学基金资助项目( 61073116, 61003131) ; 安徽省高校自然科学研究重点项目( KJ2010A006)

Multi-Label Classification Algorithm Using Adaptive Linear Regression

Tang Jin1,2  Huang Li-li1,2  Zhao Hai-feng1,2  Luo Bin1,2   

  1. 1. School of Computer Science and Technology,Anhui University,Hefei 230601,Anhui,China; 2. Key Laboratory for Industrial Image Processing and Analysis of Anhui Province,Hefei 230039,Anhui,China
  • Received:2012-01-04 Revised:2012-05-31 Online:2012-09-25 Published:2012-08-01
  • Contact: 汤进(1976-) ,男,博士,副教授,主要从事图像处理与模式识别研究. E-mail:ahhftang@ gmail.com
  • About author:汤进(1976-) ,男,博士,副教授,主要从事图像处理与模式识别研究.
  • Supported by:

    国家自然科学基金资助项目( 61073116, 61003131) ; 安徽省高校自然科学研究重点项目( KJ2010A006)

摘要: 针对多标签数据类别间的相关性与共现性,提出了一种使用自适应线性回归的多标签分类算法,将经典线性回归理论推广到多标签形式,结合多种评判标准对回归结果设置阈值,进而自适应地预测出最终标签.该方法同时考虑了符合数据期望的固定阈值与反映分类器综合效果的自适应阈值,因而降低了数据分布与噪声对分类的影响.实验结果表明,该方法可以有效地解决多标签分类问题.

关键词: 多标签, 分类算法, 线性回归, 自适应阈值学习

Abstract:

Aiming at the co-occurrence and relevance among the multi-label data,a novel multi-label classification algorithm using adaptive linear regression is proposed. In the algorithm,first,the classical linear regression theory is extended to the multi-label linear regression. Then,the threshold for the regression results is set by combining various evaluation criteria,thus adaptively predicting the final labels. The proposed algorithm considers not only the fixed threshold corresponding to the averages but also the adaptive thresholds reflecting the comprehensive effects of the classifier,thus reducing the influence of the distribution and noise of original data on the classification. Experimental results demonstrate that the proposed algorithm is effective in the multi-label classification.

Key words: multi-label, classification algorithm, linear regression, adaptive threshold learning

中图分类号: