[1] |
庄述鑫, 陈永红, 郝一行, 吴巍炜, 徐学永, 王万元. 对抗环境中基于种群多样性的鲁棒策略生成方法[J]. 计算机工程与科学, 2024, 46(06): 1081-1091. |
[2] |
曾凡锋, 王春真, 李琛. 基于深浅层特征融合的无监督视频摘要算法研究[J]. 计算机工程与科学, 2023, 45(09): 1602-1610. |
[3] |
王扬, 陈智斌. 一种求解CVRP的动态图转换模型[J]. 计算机工程与科学, 2023, 45(05): 859-868. |
[4] |
彭坤彦, 尹翔, 刘笑竹, 李恒宇. 基于粒子群优化和深度强化学习的策略搜索方法[J]. 计算机工程与科学, 2023, 45(04): 718-725. |
[5] |
童钊, 叶锋, 刘碧篮, 邓小妹, 梅晶, 刘宏. 移动边缘计算中多约束下的任务卸载和资源分配算法[J]. 计算机工程与科学, 2020, 42(10高性能专刊): 1869-1879. |
[6] |
蔡钺, 游进国, 丁家满. 基于近端策略优化与对抗学习的对话生成[J]. 计算机工程与科学, 2020, 42(09): 1680-1689. |
[7] |
官蕊, 丁家满, 贾连印, 游进国, 姜瑛, . 基于强化学习的多样性文档排序算法[J]. 计算机工程与科学, 2020, 42(09): 1697-1703. |
[8] |
韩虎, 孙天岳, 赵启涛. 引入自编码机制对抗网络的文本生成模型[J]. 计算机工程与科学, 2020, 42(09): 1704-1710. |
[9] |
周碧莹1,王爱平1,费长江2,虞万荣2,赵宝康2. 基于强化学习的卫星网络资源调度机制[J]. 计算机工程与科学, 2019, 41(12): 2134-2142. |
[10] |
万谦1,2,刘玮1,2,徐龙龙1,2,郭竞知1,2. 基于Q-learning的不确定环境BDI Agent最优策略规划研究[J]. 计算机工程与科学, 2019, 41(01): 166-172. |
[11] |
宋佳佳,王作为. 基于有效实例的改进U树算法[J]. 计算机工程与科学, 2019, 41(01): 185-190. |
[12] |
闫雪飞,李新明,刘东,刘德生,李强. 基于强化学习的体系对抗仿真战役层次指控算法[J]. 计算机工程与科学, 2018, 40(08): 1511-1520. |
[13] |
王建军,刘玉林. 基于强化学习的自适应中间件在线更新机制研究[J]. J4, 2014, 36(08): 1462-1468. |
[14] |
沈〓乐,毛新军,董孟高. 基于强化学习的自适应多Agent系统的构造[J]. J4, 2011, 33(12): 72-77. |
[15] |
李琼,郭御风,蒋艳凰. 基于强化学习的智能I/O调度算法[J]. J4, 2010, 32(7): 58-61. |