基于并发Options 的双边多议题协商模型优化

华南理工大学学报（自然科学版） ›› 2007, Vol. 35 ›› Issue (9): 95-100.

基于并发Options 的双边多议题协商模型优化

彭志平彭宏

华南理工大学计算机科学与工程学院，广东广州 510640

收稿日期:2006-12-19 出版日期:2007-09-25 发布日期:2007-09-25
通信作者: 彭志平(1969-) ，男，在职博士生，茂名学院副教授，主要从事机器学习、智能商务、多Agent 技术方面的研究。 E-mail:mmxypzhp@yahoo.com.cn
作者简介:彭志平(1969-) ，男，在职博士生，茂名学院副教授，主要从事机器学习、智能商务、多Agent 技术方面的研究。
基金资助:
广东省自然科学基金资助项目(06029281 ，05011905)

Optimization of Bilateral and Multi-Issue Negotiation Model Based on Concurrent Options

Peng Zhi-ping Peng Hong

School of Computer Science and Engineering , South China Univ. of Tech. , Guangzhou 510640 , Guangdong , China

Received:2006-12-19 Online:2007-09-25 Published:2007-09-25
Contact: 彭志平(1969-) ，男，在职博士生，茂名学院副教授，主要从事机器学习、智能商务、多Agent 技术方面的研究。 E-mail:mmxypzhp@yahoo.com.cn
About author:彭志平(1969-) ，男，在职博士生，茂名学院副教授，主要从事机器学习、智能商务、多Agent 技术方面的研究。
Supported by:
广东省自然科学基金资助项目(06029281 ，05011905)

摘要/Abstract

摘要： 针对双边多议题协商中的僵局问题，提出利用并发Options 优化协商模型的方法.这种方法可在不降低双边协商效用的前提下，并行动态优化与僵局议题相关的多个议题的保留佳.电子商务的实验结果表明:基于并发Options 的协商模型优化方法是有效的;无论是学习速度，还是最佳策略的优化程度和泛化能力，该方法均明显优于基于标准Options和Q- 学习的优化方法.

关键词: 协商模型, 协商僵局, 优化, 并发Options, 强化学习

Abstract:

In order to break the deadlocks in the bilateral and multi-issue negotiation , a method to optimize the negotiation model is proposed based on concurrent Options. In this method , the reserved values of several issues related to the deadlock issue can be dynamically optimized in parallel without reducing the bilateral utility. As illustrated by an example of E-commerce , the proposed optimization method is effective. It significantly outperforms the methods based on standard Options and Q-leaming in terms of the leaming efficiency as well as the optimization degree and generalization capacity of the leamed policies for solving negotiation deadlocks.

Key words: negotiation model, negotiation deadlock, optimization, concurrent options, reinforcement leaming

彭志平彭宏. 基于并发Options 的双边多议题协商模型优化[J]. 华南理工大学学报（自然科学版）, 2007, 35(9): 95-100.

Peng Zhi-ping Peng Hong. Optimization of Bilateral and Multi-Issue Negotiation Model Based on Concurrent Options[J]. Journal of South China University of Technology (Natural Science Edition), 2007, 35(9): 95-100.

[1]	卢志民, 李博航, 唐雯, 等. 燃煤电厂SCR脱硝系统喷氨优化模拟[J]. 华南理工大学学报(自然科学版), 2023, 51(8): 62-70.
[2]	王学武, 方俊宇, 高进, 等. 基于改善解集分布性的多目标优化[J]. 华南理工大学学报(自然科学版), 2023, 51(8): 137-148.
[3]	王福建, 程慧玲, 马东方, 等. 基于深度逆向强化学习的城市车辆路径链重构[J]. 华南理工大学学报(自然科学版), 2023, 51(7): 120-128.
[4]	黄炎, 符锌砂, 曾彦杰, 等. 基于激光雷达里程计的高速公路三维建模方法[J]. 华南理工大学学报(自然科学版), 2023, 51(7): 129-138.
[5]	魏海斌, 魏东升, 蒋博宇, 等. 基于IPSO-SVR的盾构下穿既有道路沉降预测分析[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 62-71.
[6]	赵强, 刘传卫, 张娜, 等. 基于粒子群优化的主动稳定杆系统自抗扰控制[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 52-61.
[7]	邱宇东, 王湛, 谢志燊. 基于混合算法的半刚性连接钢框架结构优化[J]. 华南理工大学学报(自然科学版), 2023, 51(6): 72-77.
[8]	韩乐, 江怡华. 鲁棒截断L1-L2全变分稀疏恢复模型[J]. 华南理工大学学报(自然科学版), 2023, 51(5): 45-53,140.
[9]	李树勋, 胡迎港, 李成, 等. 基于代理模型的轴流式调节阀阀体型线优化[J]. 华南理工大学学报(自然科学版), 2023, 51(3): 41-52.
[10]	李新凯, 虎晓诚, 马萍, 等. 基于改进DDPG的无人驾驶避障跟踪控制[J]. 华南理工大学学报(自然科学版), 2023, 51(11): 44-55.
[11]	陈锋, 毛豪滨, 蔡吉玲, 等. 面向低延时实时视频的多维跨层带宽预测[J]. 华南理工大学学报(自然科学版), 2023, 51(11): 18-27.
[12]	姜雨, 王雅莎, 薛清文, 等. 基于碳排放的航空器时空滑行优化研究[J]. 华南理工大学学报(自然科学版), 2023, 51(10): 152-159.
[13]	许伦辉, 余佳芯, 裴明阳, 等. 基于几何路网结构和强化学习的车辆重定位策略[J]. 华南理工大学学报(自然科学版), 2023, 51(10): 99-109.
[14]	裴明阳, 朱宏昱. 电动汽车动态无线充电路段优化建模方法[J]. 华南理工大学学报(自然科学版), 2023, 51(10): 135-151.
[15]	徐志航, 么新鹏, 徐志刚, 等. 道路交通检测器及其优化布设方法研究综述[J]. 华南理工大学学报(自然科学版), 2023, 51(10): 68-88.