华南理工大学学报(自然科学版) ›› 2011, Vol. 39 ›› Issue (5): 102-107.doi: 10.3969/j.issn.1000-565X.2011.05.018
林古立 彭宏 马千里 韦佳 覃姜维
Lin Gu-li Peng Hong Ma Qian-li Wei Jia Qin Jiang-wei
摘要: 网页搜索结果的多样化已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素.文中将多样化问题形式化为信息面覆盖率的最大化问题,提出了一种基于关键词的网页搜索结果多样化方法KDM.该方法首先从与用户查询相关的结果文档中提取出可以描述结果文档所蕴含的信息面的关键词,然后根据关键词的同现性以及关键词对文档的描述能力,计算出结果文档的信息面新颖度,最后结合新颖度和相关度对文档进行重新排序,从而给用户提供多样化的搜索结果.实验结果表明,文中方法的多样化性能优于现有的其它多样化方法.