华南理工大学学报(自然科学版) ›› 2018, Vol. 46 ›› Issue (1): 122-130.doi: 10.3969/j.issn.1000-565X.2018.01.016
陈琼,徐洋洋,陈林清
CHEN Qiong XU Yangyang CHEN Linqing
摘要: 现实中数据分布不平衡的情况越来越多,给以数据分布基本均衡为前提的传统分类算法带来了一定的挑战。利用相关的辅助数据进行迁移学习可以解决目标数据的分布不平衡问题。本文以TrAdaboost算法为基础,提出了一个针对不平衡数据的二分类迁移学习算法UnbalancedTrAdaboost(UBTA)。UBTA算法利用不同类别的Precision-Recall曲线下的面积auprc(the Area Under the Precision-Recall Curve)计算弱分类器权重,对不同类别的样本采取不同的权重更新策略。由于AUC指标对数据分布变化不敏感,结合G-mean和BER能更准确地评估不平衡分类算法的性能。综合三种指标的实验结果表明,UBTA具有较好的分类性能,既能提升对少数类的关注,又能保持多数类的分类准确度。
中图分类号: