计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (10): 1757-1764.
蔡玉,官铮,王增文,王学,杨志军
CAI Yu,GUAN Zheng,WANG Zeng-wen,WANG Xue,YANG Zhi-jun
摘要: 车联网产生大量网络连接和差异化数据,针对单个智能体难以在动态场景下收集信道状态信息并进行区分业务的资源分配和链路调度,提出了基于多智能体深度强化学习的车联网区分业务资源分配算法。该算法以实现紧急业务链路干扰最小化约束下,V2V链路数据包成功交付率和V2I链路总容量最大化为目标,利用深度强化学习算法进行多个蜂窝用户和设备到设备用户共存的单天线车载网络中,频谱分配和功率选择的策略优化。每个智能体都利用DQN进行训练,智能体间共同与通信环境交互,通过全局奖励函数实现智能体间的协作。仿真结果表明,高负载场景下,相较于传统随机分配算法,该算法的V2I链路总吞吐量增加了3.76 Mbps,V2V链路的数据包交付率提高了17.1%,紧急业务链路所受干扰相对于普通链路减少1.42 dB,实现紧急业务链路的优先级保障,有效提高了V2I链路和V2V链路的总传输容量。