计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (05): 836-844.
聂雷1,2,刘博1,2,李鹏1,2,何亨1,2
NIE Lei1,2,LIU Bo1,2,LI Peng1,2,HE Heng1,2
摘要: 异构车载网络环境下如何选择接入网络对于车载终端用户的服务体验而言至关重要,目前基于Q学习的网络选择方法利用智能体与环境的交互来迭代学习网络选择策略,从而实现较优的网络资源分配。然而该类方法通常存在状态空间过大引起迭代效率低下和收敛速度较慢的问题,同时由于Q值表更新产生的过高估计现象容易导致网络资源利用不均衡。针对上述问题,基于多智能体Q学习提出一种适用于融合5G通信异构车载网络的选择方法MQSM。该方法采用多智能体协作学习的思想,利用双Q值表交替更新的方式来获得动作选择的总回报值,最终实现异构车载网络环境下长期有效的最优网络切换决策集合。实验结果表明,与同类型方法相比较,MQSM在系统总切换次数、平均总折扣值和网络容量利用率方面表现出更好的性能。