华南理工大学学报(自然科学版) ›› 2007, Vol. 35 ›› Issue (9): 95-100.

• 计算机科学与技术 • 上一篇    下一篇

基于并发Options 的双边多议题协商模型优化

彭志平 彭宏   

  1. 华南理工大学 计算机科学与工程学院,广东 广州 510640
  • 收稿日期:2006-12-19 出版日期:2007-09-25 发布日期:2007-09-25
  • 通信作者: 彭志平(1969-) ,男,在职博士生,茂名学院副教授,主要从事机器学习、智能商务、多Agent 技术方面的研究。 E-mail:mmxypzhp@yahoo.com.cn
  • 作者简介:彭志平(1969-) ,男,在职博士生,茂名学院副教授,主要从事机器学习、智能商务、多Agent 技术方面的研究。
  • 基金资助:

    广东省自然科学基金资助项目(06029281 ,05011905)

Optimization of Bilateral and Multi-Issue Negotiation Model Based on Concurrent Options

Peng Zhi-ping  Peng Hong   

  1. School of Computer Science and Engineering , South China Univ. of Tech. , Guangzhou 510640 , Guangdong , China
  • Received:2006-12-19 Online:2007-09-25 Published:2007-09-25
  • Contact: 彭志平(1969-) ,男,在职博士生,茂名学院副教授,主要从事机器学习、智能商务、多Agent 技术方面的研究。 E-mail:mmxypzhp@yahoo.com.cn
  • About author:彭志平(1969-) ,男,在职博士生,茂名学院副教授,主要从事机器学习、智能商务、多Agent 技术方面的研究。
  • Supported by:

    广东省自然科学基金资助项目(06029281 ,05011905)

摘要: 针对双边多议题协商中的僵局问题,提出利用并发Options 优化协商模型的方法.这种方法可在不降低双边协商效用的前提下,并行动态优化与僵局议题相关的多个议题的保留佳.电子商务的实验结果表明:基于并发Options 的协商模型优化方法是有效的;无论是学习速度,还是最佳策略的优化程度和泛化能力,该方法均明显优于基于标准Options和Q- 学习的优化方法.

关键词: 协商模型, 协商僵局, 优化, 并发Options, 强化学习

Abstract:

In order to break the deadlocks in the bilateral and multi-issue negotiation , a method to optimize the negotiation model is proposed based on concurrent Options. In this method , the reserved values of several issues related to the deadlock issue can be dynamically optimized in parallel without reducing the bilateral utility. As illustrated by an example of E-commerce , the proposed optimization method is effective. It significantly outperforms the methods based on standard Options and Q-leaming in terms of the leaming efficiency as well as the optimization degree and generalization capacity of the leamed policies for solving negotiation deadlocks.

Key words: negotiation model, negotiation deadlock, optimization, concurrent options, reinforcement leaming