基于演化博弈惩罚机制的多智能体协作稳定性研究

计算机工程与科学 ›› 2015, Vol. 37 ›› Issue (09): 1682-1687.

基于演化博弈惩罚机制的多智能体协作稳定性研究

郑延斌1,2，段领玉1，李波1，梁凯1

（1.河南师范大学计算机与信息工程学院，河南新乡 453007;
2.智慧商务与物联网技术河南省工程实验室，河南新乡 453007）

收稿日期:2014-09-12 修回日期:2015-03-02 出版日期:2015-09-25 发布日期:2015-09-25
基金资助:
河南省重点科技攻关项目(122102210086,132102210537,132102210538)

Research on multiagent cooperation stability based #br# on the punishment mechanism of evolutionary games

ZHENG Yanbin1,2,DUAN Lingyu1,LI Bo1,LIANG Kai1

(1.College of Computer and Information Technology,Henan Normal University,Xinxiang 453007;
2.Engineering Laboratory of Intellectual Business and Internet of Things Technologies,Xinxiang 453007,China)

Received:2014-09-12 Revised:2015-03-02 Online:2015-09-25 Published:2015-09-25

摘要/Abstract

摘要：

针对复杂、动态环境中多Agent协作的稳定性问题，提出了一种基于博弈论及惩罚机制的协作方法，通过效用函数来选择最优策略，实现均衡协作；为了提高协作的稳定性与成功率，引入惩罚机制，通过不断调整惩罚系数来维护多Agent协作的稳定性，并在形成协作团队时，充分考虑参与协作的Agent的信誉值。仿真结果表明，该方法能有效地降低任务完成时间，避免Agent在动态协作中随意退出，提高协作效率及协作稳定性。

关键词: 演化博弈, 协作, 惩罚机制, 信誉值, Multi-agent

Abstract:

The coordination stability problem in complex environments is one of the key problems in the research of multiagent cooperation. We present a multiagent cooperation stability method on the basis of game theory methods and punishment mechanism. To maintain the stability of multiagent cooperation and achieve a balanced cooperation, a punishment is introduced and continuous adjustment of the penalty factors is performed. Agent credit values are fully considered when the cooperation team is formed. Simulation results show that the proposal can not only reduce task completion time effectively, but also avoid agent exits in the dynamic cooperation, thus improving the cooperation efficiency and stability.

Key words: evolutionary games, cooperation, punishment mechanism, credit value, multi-agent

郑延斌, 段领玉, 李波, 梁凯. 基于演化博弈惩罚机制的多智能体协作稳定性研究[J]. 计算机工程与科学, 2015, 37(09): 1682-1687.

ZHENG Yanbin, DUAN Lingyu, LI Bo, LIANG Kai. Research on multiagent cooperation stability based #br# on the punishment mechanism of evolutionary games [J]. Computer Engineering & Science, 2015, 37(09): 1682-1687.

编辑推荐

Metrics

阅读次数

全文

238

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	238

来源	本网站	其他网站

次数	204	34
比例	86%	14%

摘要

159

最新录用	在线预览	正式出版

0	0	159

	来源	本网站

	次数	159
	比例	100%

[1]	卢明妤, 李陶深, 吕品. 无线携能通信下mmWave协作通信小单元的能效最优策略[J]. 计算机工程与科学, 2024, 46(04): 626-634.
[2]	尹玲, 谢志军. 基于时空协作的多移动充电器充电路径规划的研究[J]. 计算机工程与科学, 2021, 43(12): 2183-2189.
[3]	卢冬冬, 吴洁, 刘鹏, 盛永祥. 开源软件社区知识协作网络核心开发者识别[J]. 计算机工程与科学, 2021, 43(03): 551-559.
[4]	郭竞知, 刘玮, 徐龙龙, 陈灯 . Agent能力承诺协作的自适应图规划协议生成算法[J]. 计算机工程与科学, 2020, 42(07): 1208-1214.
[5]	李召义，刘占军，薛亚茹，刘红霞. 基于势博弈的认知全双工中继选择策略研究[J]. 计算机工程与科学, 2019, 41(02): 286-292.
[6]	张建明1,2，廖婷婷1,2，吴宏林1,2，刘宇凯1,2. 基于改进分数阶SVD的块协作表示的小样本人脸识别算法[J]. 计算机工程与科学, 2018, 40(07): 1237-1243.
[7]	唐夲1,2，李乐2，肖静薇1，吴维农1，冯文江2. 基于演化博弈的多用户网络选择算法[J]. 计算机工程与科学, 2018, 40(02): 255-260.
[8]	刘召1,2，宋立滨2，于涛2，郭凯2，王增喜2，耿美晓2. 基于IMU的主动伴舞机器人人机协作控制算法[J]. 计算机工程与科学, 2018, 40(01): 128-132.
[9]	贾向东1,2，颉满刚1，周猛1. 非同分布衰落环境下最大链路选择方案及性能研究[J]. 计算机工程与科学, 2017, 39(11): 2006-2015.
[10]	陈源，林海涛. 多层次P2P流量分类方法研究[J]. 计算机工程与科学, 2016, 38(12): 2471-2477.
[11]	罗健，廖俊国，李雄. P2PSpaceTwist:一种主动式用户协作的位置隐私保护方法[J]. 计算机工程与科学, 2016, 38(08): 1661-1668.
[12]	刘西成，席建中. 无线传感器网络中协作误差传播感知的机会可靠传输机制[J]. J4, 2016, 38(06): 1141-1148.
[13]	胡斌，王有天. 面向协作的组织结构设计的集成模拟研究[J]. J4, 2014, 36(06): 1184-1191.
[14]	侯睿，张振绘，冯忠双，陈静. 复杂条件下多层建筑人员协作疏散仿真[J]. J4, 2012, 34(2): 192-196.
[15]	朱晓梅,包亚萍. 认知无线电中非高斯噪声下主用户信号的协作检测方法[J]. J4, 2011, 33(10): 164-168.