华南理工大学学报(自然科学版) ›› 2011, Vol. 39 ›› Issue (3): 114-119.doi: 10.3969/j.issn.1000-565X.2011.03.022
夏新海 许伦辉
Xia Xin-hai Xu Lun-hui
摘要: 为信号控制的城市道路交叉口定义一个Agent结构模型,利用双人对策Nash平衡理论构建了城市交叉口Agent间的多遇交互模型,每一交叉口Agent与相邻交叉口Agent进行多次交互学习,根据选择策略获得的效用值来更新它的混合策略.利用记忆因子δ、学习概率α、交叉口交通流变化概率βi等参数分析了交叉口Agent间的循环学习协调过程.设计了交叉口Agent多遇交互历史学习协调算法,在此算法里交叉口Agent可以通过对其他相邻交叉口Agent以往历史交互行为特别是最近的历史行为的记忆学习达到协调.以数个交叉口相连接的干道为例分析了δ、α、βi等参数对算法性能的影响.通过干道上交叉口交通信号协调的实例分析,证明了该协调学习方法的有效性.