华南理工大学学报(自然科学版) ›› 2022, Vol. 50 ›› Issue (4): 26-34,45.doi: 10.12141/j.issn.1000-565X.210267
所属专题: 2022年计算机科学与技术
陈琼1 谢家亮2
CHEN Qiong1 XIE Jialiang2#br#
摘要: 针对传统重采样方法大多使用固定采样策略,无法根据模型的优化需求改变采样策略的问题,本文提出一种基于自适应采样的不平衡分类方法(Adaptive Sampling Imbalanced Classification,ASIC)。该方法根据分类模型在验证集上的表现动态调整训练集上不同类别样本的采样概率,使不同类别的采样概率由当前分类模型的需求动态决定。同时,该方法对少数类别给予额外的关注,在其余条件相同的情况下为少数类赋予更大的采样概率,以弥补少数类本身样本数量不足对分类模型造成的不良影响,从而提高分类模型对少数类的识别能力。实验结果表明,使用ASIC方法训练的分类模型在平均类准确率以及geometric mean上均比对比方法更好,且数据分布越不平衡,ASIC方法的优越性越明显。
中图分类号: