华南理工大学学报(自然科学版) ›› 2020, Vol. 48 ›› Issue (6): 143-150.doi: 10.12141/j.issn.1000-565X.200009
• 计算机科学与技术 • 上一篇
梁京章1 黄星舒1 吴丽娟2† 熊小萍1
LIANG Jingzhang1 HUANG Xingshu1 WU Lijuan2 XIONG Xiaoping1
摘要: 为了提高电力负荷曲线聚类精度,文中提出了一种基于核主成分分析 (KPCA)和改进 K-means 算法的电力负荷曲线聚类方法。该方法首先在划分聚类算法 K-means 基础上融入密度聚类思想,提出了融合密度思想的 K-means 算法 (DK-means 算法),并在电力负荷曲线实验集上对比分析其聚类效果; 接着在实验集上比较各种降维算法的降维聚类精度和降维速度; 最后分析 KPCA + DK-means 组合算法的降维聚类能力。结果表明,戴维森堡丁指数 (DBI) 更适合作为电力负荷曲线聚类评价指标; 以 DBI 为评价指标,与 K-means、BIRCH、DBSCAN 和 EnsClust 4 种聚类算法相比,DK-means 的聚类精度更高; 与 LLE、MDS、ISOMAP 3 种非线性降维算法相比,KPCA 的降维速度更快;KPCA + DK-means 组合算法有良好的降维聚类能力,较 DK-means 在聚类精度和聚类效率上均有提升。KPCA + DK-means 组合算法可以实现电力负荷曲线的高效降维、精确聚类,对用电行为模式的准确提取起关键技术支持作用。
中图分类号: