[1] |
庄述鑫, 陈永红, 郝一行, 吴巍炜, 徐学永, 王万元. 对抗环境中基于种群多样性的鲁棒策略生成方法[J]. 计算机工程与科学, 2024, 46(06): 1081-1091. |
[2] |
曾凡锋, 王春真, 李琛. 基于深浅层特征融合的无监督视频摘要算法研究[J]. 计算机工程与科学, 2023, 45(09): 1602-1610. |
[3] |
王扬, 陈智斌. 一种求解CVRP的动态图转换模型[J]. 计算机工程与科学, 2023, 45(05): 859-868. |
[4] |
彭坤彦, 尹翔, 刘笑竹, 李恒宇. 基于粒子群优化和深度强化学习的策略搜索方法[J]. 计算机工程与科学, 2023, 45(04): 718-725. |
[5] |
曾上游, 贾小硕, 李文惠. 基于双线程LSTM在线更新的视频追踪算法[J]. 计算机工程与科学, 2021, 43(03): 480-485. |
[6] |
童钊, 叶锋, 刘碧篮, 邓小妹, 梅晶, 刘宏. 移动边缘计算中多约束下的任务卸载和资源分配算法[J]. 计算机工程与科学, 2020, 42(10高性能专刊): 1869-1879. |
[7] |
蔡钺, 游进国, 丁家满. 基于近端策略优化与对抗学习的对话生成[J]. 计算机工程与科学, 2020, 42(09): 1680-1689. |
[8] |
官蕊, 丁家满, 贾连印, 游进国, 姜瑛, . 基于强化学习的多样性文档排序算法[J]. 计算机工程与科学, 2020, 42(09): 1697-1703. |
[9] |
韩虎, 孙天岳, 赵启涛. 引入自编码机制对抗网络的文本生成模型[J]. 计算机工程与科学, 2020, 42(09): 1704-1710. |
[10] |
周碧莹1,王爱平1,费长江2,虞万荣2,赵宝康2. 基于强化学习的卫星网络资源调度机制[J]. 计算机工程与科学, 2019, 41(12): 2134-2142. |
[11] |
万谦1,2,刘玮1,2,徐龙龙1,2,郭竞知1,2. 基于Q-learning的不确定环境BDI Agent最优策略规划研究[J]. 计算机工程与科学, 2019, 41(01): 166-172. |
[12] |
宋佳佳,王作为. 基于有效实例的改进U树算法[J]. 计算机工程与科学, 2019, 41(01): 185-190. |
[13] |
闫雪飞,李新明,刘东,刘德生,李强. 基于强化学习的体系对抗仿真战役层次指控算法[J]. 计算机工程与科学, 2018, 40(08): 1511-1520. |
[14] |
刘晓建,任 怡,戴华东. 基于计数副本的传统操作系统代码空闲状态监测技术[J]. J4, 2012, 34(5): 78-83. |
[15] |
黄晗文1,2,郑宇3. 强化学习中基于定性模型的知识传递方法[J]. J4, 2011, 33(6): 118-124. |