华南理工大学学报(自然科学版) ›› 2012, Vol. 40 ›› Issue (4): 57-63.

• 计算机科学与技术 • 上一篇    下一篇

基于非凸上界的ranking 模型构造算法

程凡1,2 王煦法1 李龙澍2   

  1. 1.中国科学技术大学 计算机科学与技术学院,安徽 合肥 230027; 2.安徽大学 计算机科学与技术学院,安徽 合肥 230039
  • 收稿日期:2011-06-27 修回日期:2011-11-28 出版日期:2012-04-25 发布日期:2012-03-01
  • 通信作者: 程凡(1979-) ,男,博士生,讲师,主要从事信息检索、机器学习研究. E-mail:chengfan@mail.ustc.edu.cn
  • 作者简介:程凡(1979-) ,男,博士生,讲师,主要从事信息检索、机器学习研究.
  • 基金资助:

    国家自然科学基金资助项目( 60875027 ) ; 安徽省自然科学基金资助项目( 090412054,1104060M141,1208085QF120) ; 安徽省科技攻关计划重大科技专项项目( 08010201002) ; 安徽省高校优秀青年人才资助项目( 2012SQRL016) ;安徽大学计算智能与信号处理教育部重点实验室开放基金资助项目; 安徽大学青年科学基金资助项目( KJQN1119)

Construction Algorithm of ranking Model Based on Non-Convex Upper Bound

Cheng Fan1,2  Wang Xu-fa1  Li Long-shu2   

  1. 1.School of Computer Science and Technology,University of Science and Technology of China,Hefei 230027,Anhui,China; 2.School of Computer Science and Technology,Anhui University,Hefei 230039,Anhui,China
  • Received:2011-06-27 Revised:2011-11-28 Online:2012-04-25 Published:2012-03-01
  • Contact: 程凡(1979-) ,男,博士生,讲师,主要从事信息检索、机器学习研究. E-mail:chengfan@mail.ustc.edu.cn
  • About author:程凡(1979-) ,男,博士生,讲师,主要从事信息检索、机器学习研究.
  • Supported by:

    国家自然科学基金资助项目( 60875027 ) ; 安徽省自然科学基金资助项目( 090412054,1104060M141,1208085QF120) ; 安徽省科技攻关计划重大科技专项项目( 08010201002) ; 安徽省高校优秀青年人才资助项目( 2012SQRL016) ;安徽大学计算智能与信号处理教育部重点实验室开放基金资助项目; 安徽大学青年科学基金资助项目( KJQN1119)

摘要: 现有的ranking 算法均通过最小化原目标函数的凸上界构造ranking 模型,得到的模型不够精确. 为此,文中提出一种基于非凸上界的ranking 算法. 该算法首先给出一个基于多类支持向量机( SVM) 的框架,然后定义面向NDCG 的目标函数,在此基础上设计一个比现有的凸上界更为紧凑的非凸上界逼近原目标函数; 针对上界函数的非凸非光滑,提出使用凹- 凸过程进行凸逼近,并采用割平面算法进行求解; 最后,通过在基准数据集上的实验对该算法进行验证,并与现有算法进行对比. 结果表明,相比现有的基于凸上界的ranking 算法,文中算法得到的模型不但更为精确,而且更加稳定.

关键词: ranking 算法, 非凸上界, NDCG, 凹-凸过程, 割平面算法, 多类支持向量机

Abstract:

As the existing ranking algorithms all construct models by minimizing the convex upper bound of the original objective functions,the constructed models are imprecise. In order to solve this problem,a ranking algorithm based on non-convex upper bound is proposed. In this algorithm,first,a framework based on multi-class support vector machine ( SVM) is constructed and an objective function directly optimizing the NDCG ( Normalized Discounted Cumulative Gain) is defined. Then,a tighter non-convex upper bound is designed to approximate the original objective function. Moreover,a concave-convex procedure is carried out and the cutting plane algorithm is used to remedy the non-convex and non-smooth characteristics of the objective function. The proposed algorithm is finally verified on the benchmark datasets. The results show that,as compared with the existing ranking algorithms based on convex upper bound,the proposed algorithm is more effective in constructing models with high accuracy and strong stability.

Key words: ranking algorithm, non-convex upper bound, normalized discounted cumulative gain, concave-convex procedure, cutting plane algorithm, multi-class support vector machine

中图分类号: