计算机工程与科学 ›› 2015, Vol. 37 ›› Issue (09): 1682-1687.
郑延斌1,2,段领玉1,李波1,梁凯1
ZHENG Yanbin1,2,DUAN Lingyu1,LI Bo1,LIANG Kai1
摘要:
针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并在形成协作团队时,充分考虑参与协作的Agent的信誉值。仿真结果表明,该方法能有效地降低任务完成时间,避免Agent在动态协作中随意退出,提高协作效率及协作稳定性。