华南理工大学学报(自然科学版) ›› 2011, Vol. 39 ›› Issue (4): 1-6.doi: 10.3969/j.issn.1000-565X.2011.04.001
• 计算机科学与技术 • 下一篇
李晓明 单栋栋
Li Xiao-ming Shan Dong-dong
摘要: 针对网页质量参差不齐、重要程度差别巨大的问题,提出了按照网页重要程度确定其剪枝幅度的静态索引剪枝方法,并在GOV2 数据集上进行了验证. 实验结果表明:这种方法体现了静态索引剪枝能极大降低存储需求、提高查询效率的优点; 当剪枝后的索引大小是原始大小的13%时,P@ 10、P@ 20 值能达到甚至超过使用完整索引时的结果;在相同的剪枝幅度下,P@ 10、P@ 20 和MAP 都明显好于以往的剪枝方法.