[1] |
章政, 夏小云, 陈泽丰, 向毅. 融合强化学习的分阶段策略求解旅行背包问题[J]. 计算机工程与科学, 2025, 47(01): 140-149. |
[2] |
余世瑞, 姜春茂. 基于模糊强化学习的云计算虚拟机调度策略[J]. 计算机工程与科学, 2025, 47(01): 56-65. |
[3] |
段成龙, 袁杰, 常乾坤, 张宁宁. 基于D2GA的逆强化学习算法[J]. 计算机工程与科学, 2024, 46(11): 2053-2062. |
[4] |
顾颖程, 魏柳, 姜宁, 程环宇, 刘凯, 宋玉, 刘梅招, 汤雷, 陈彧, 张胜. 边缘场景下面向分布式交互应用的服务器分配[J]. 计算机工程与科学, 2024, 46(10): 1748-1756. |
[5] |
庄述鑫, 陈永红, 郝一行, 吴巍炜, 徐学永, 王万元. 对抗环境中基于种群多样性的鲁棒策略生成方法[J]. 计算机工程与科学, 2024, 46(06): 1081-1091. |
[6] |
曾凡锋, 王春真, 李琛. 基于深浅层特征融合的无监督视频摘要算法研究[J]. 计算机工程与科学, 2023, 45(09): 1602-1610. |
[7] |
王扬, 陈智斌. 一种求解CVRP的动态图转换模型[J]. 计算机工程与科学, 2023, 45(05): 859-868. |
[8] |
彭坤彦, 尹翔, 刘笑竹, 李恒宇. 基于粒子群优化和深度强化学习的策略搜索方法[J]. 计算机工程与科学, 2023, 45(04): 718-725. |
[9] |
管延霞, 刘逊韵, 刘运韬, 谢旻, 徐新海. 面向多智能体博弈的并行蒙特卡洛树搜索算法研究[J]. 计算机工程与科学, 2022, 44(12): 2128-2133. |
[10] |
寇巧媛, 袁杰. 具有时变通信延迟的多智能体系统改进蜂拥控制[J]. 计算机工程与科学, 2022, 44(10): 1852-1860. |
[11] |
董鹏, 石怀斌, 史博元, 张其霄 . 基于多智能体的海外反恐运输投送模型研究[J]. 计算机工程与科学, 2022, 44(07): 1223-1231. |
[12] |
聂雷, 刘博, 李鹏, 何亨, . 基于多智能体Q学习的异构车载网络选择方法[J]. 计算机工程与科学, 2021, 43(05): 836-844. |
[13] |
王帅辉, 袁杰. 复合Petri网的主从式多智能体通信建模方法[J]. 计算机工程与科学, 2021, 43(02): 304-311. |
[14] |
童钊, 叶锋, 刘碧篮, 邓小妹, 梅晶, 刘宏. 移动边缘计算中多约束下的任务卸载和资源分配算法[J]. 计算机工程与科学, 2020, 42(10高性能专刊): 1869-1879. |
[15] |
蔡钺, 游进国, 丁家满. 基于近端策略优化与对抗学习的对话生成[J]. 计算机工程与科学, 2020, 42(09): 1680-1689. |