华南理工大学学报(自然科学版) ›› 2011, Vol. 39 ›› Issue (4): 26-31,37.doi: 10.3969/j.issn.1000-565X.2011.04.005
何靖 袁文清 闫宏飞
He Jing Yuan Wen-qing Yan Hong-fei
摘要: 用户的点击行为会受到用户的浏览行为、周围文档的特征等因素的影响,故在分析用户点击日志时不能直接将用户点击解释为文档相关性.为了更加准确地获得文档的相关性特征,文中提出了基于用户浏览时间的点击模型.假设文档原文的相关性会影响用户浏览该文档原文的时间,即文档越相关用户浏览文档的耗时越长,这样便可利用用户浏览文档的时间来推测文档的相关程度; 经过分析,确定使用指数分布来描述浏览时间; 最后通过实验验证了该模型的有效性.结果表明,所提出的模型能够比较好地估计文档的相关性,更加准确地预测用户的点击情况,其性能优于现有的点击模型.