华南理工大学学报(自然科学版) ›› 2014, Vol. 42 ›› Issue (1): 135-141.doi: 10.3969/j.issn.1000-565X.2014.01.023
陈兴蜀 张帅 童浩 崔晓靖
Chen Xing- shu Zhang Shuai Tong Hao Cui Xiao- jing
摘要: 关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和 MapReduce 的 FP- Growth 算法( BPFP) ,分析了算法的时间和空间复杂度.该算法使用 Hadoop 框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce 来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原 FP- Growth 算法相比,BPFP 算法具有更高的执行效率、更好的加速比.