计算机工程与科学

龚昊, 刘莹, 冯建周, 赵仁良, 冷佳旭,

2021, 43(07): 1141-1149. doi:

摘要 ( 420 )

PDF (1066KB) ( 393 ) 　　

雷达信号处理算法的高性能实现是雷达系统中的关键技术。传统雷达信号处理算法的高性能加速主要依赖DSP和FPGA等专用设备，而它们具有开发周期长、调试难度大、成本高等缺点。GPU作为通用设备，特别适合处理雷达信号这种大规模数据。目前，GPU加速雷达信号处理的成果大多集中在SAR成像等应用领域，针对脉冲多普勒雷达相关研究还比较少。为了满足雷达回波数据对吞吐量和处理实时性的高要求，提出了基于网格跨步并行的细粒度并行化、基于多CUDA流的粗粒度并行化和基于并行扫描的数据预处理等优化技术。
从性能测试和误差分析等多角度评估了算法的实时性和准确性，在所使用的硬件平台上相比于传统CPU实现达到了300倍以上的加速比，并优于其它已有的CUDA加速的脉冲多普勒雷达信号处理算法。

大规模城市可计算模型快速构建方法研究

王淳, 于长华, 唐昊, 李海峰

2021, 43(07): 1150-1159. doi:

摘要 ( 160 )

PDF (2034KB) ( 235 ) 　　

为了给数值模拟计算提供大规模城市的可计算模型，需要具备面向大空间尺度、海量数据、频繁更新的城市的快速可计算建模能力。但是，由于数据采集过程中存在的误差，以及模型处理所做的必要的简化操作，导致直接生成的数字城市模型中存在大量非闭合、相接、相交、悬空等CAD模型缺陷，使得城市模型不可用于数值模拟。而采用商用软件直接修复这些缺陷的代价过高。为此，提出面向大规模城市可计算模型的快速构建方法。通过分析LoD1城市模型中所涉及的CAD模型缺陷，提出了需满足的可计算条件和对应的处理方法。
提出的方法能够直接生成不存在CAD模型缺陷的城市可计算模型。为了提高可计算处理的效率，还提出了面向大规模城市的图形快速检索算法。实验表明，构建710 km2、30余万栋建筑、217万面片的可计算模型仅需约25 min，满足了在大规模城市上进行数值模拟的需求。

分布式训练异构任务调度算法研究

杨坚伟, 孟敏, 黄家乐, 武继刚

2021, 43(07): 1160-1167. doi:

摘要 ( 228 )

PDF (657KB) ( 285 ) 　　

分布式机器学习中的工作结点在训练过程中经常需要处理异构任务，但任务发布者可能无法根据有效的先验知识确定边缘服务器集群中哪些是处于训练状态的工作结点。针对边缘服务器集群无法同时满足训练性能与服务质量最大化的问题，对异构任务调度算法进行了研究。首先在集群资源约束下分析了分布式训练收敛性能的影响因素；其次建立了最大化训练性能的优化目标；最后转化为多维多选择背包问题进行求解。仿真结果表明，所提异构任务调度算法能够在保证服务质量的同时，最大化分布式训练性能。

一种双端口发射队列及其性能优化

隋兵才, 孙彩霞, 王永文, 郭辉

2021, 43(07): 1168-1172. doi:

摘要 ( 224 )

PDF (697KB) ( 347 ) 　　

发射队列是超标量处理器的乱序控制部件，也是处理器中的关键部件，对整个处理器的性能起着决定性的作用。
提出了一种能够有效提高乱序超标量处理器性能的双端口发射队列结构。该队列能够根据指令之间的相关性，估算指令的发射时机，将指令分配到不同的队列中。对比了2种不同的发射策略对性能的影响，输入端标记执行流水线的策略能够获得较高的IPC性能，最大能
提高10.68%。同时对比了采用相同发射策略时，发射队列项数对性能的影响，相比于24项发射队列，32项发射队列能够平均提升2%的IPC性能，最大可以提升8.59%。

面向容器环境的Flink的任务调度优化研究

黄山, 房六一, 徐浩桐, 段晓东,

2021, 43(07): 1173-1184. doi:

摘要 ( 220 )

PDF (1551KB) ( 282 ) 　　

随着互联网技术的飞速发展，人类正在走向大数据时代与云计算时代。Flink作为最新一代的大数据计算引擎，具有低延迟、高吞吐等优势，受到学术界与工业界的青睐。Flink在云环境下部署时，其默认任务调度由于无法获取容器部署分布信息，会导致负载分配不均衡。针对这一问题，提出一种面向容器环境的Flink任务调度算法FSACE，获取每个结点性能信息与容器在结点上的分布信息，优先选择
空闲资源较多的结点的容器，同时可以避免容器被频繁选中造成负载不均。使用云主机与合成数据集对算法进行评测，评测结果表明，在容器环境下部署时，所提出的算法能更均衡地分配任务，可以提高资源使用率和计算速度。

新型电路版图布局布线算法设计

袁也, 王刚, 刘晓光, 李雨森

2021, 43(07): 1185-1191. doi:

摘要 ( 561 )

PDF (613KB) ( 495 ) 　　

调研了电路自动布局布线技术的国内外研究现状，在此基础上设计了一种面向中等规模电路布局布线算法，主要用于大型版图设计软件的模块测试环节，为用户提供各模块初步的布线布局结果，方便用户高效查找并修正错误点，填补了我国在相关领域的空白。建立了超图模型并转换为图模型，改进了Stoer-Wagner算法并利用该算法和Fiduccia-Mattheyses算法对图进行了基于最小割理论的划分，从而构建出一棵划分树。在这棵树的基础上设计了一种二元相对移动算法来确定各个电路元件的位置，大大降低了布局拥挤度，提高了美观度，对于数百元件的电路均能在0.5 s内得出布局结果。基于A*算法在多个方面做了改进，提高了布线速度，对于线路数1 000以下的元件能在0.1 s~60 s内得出结果，实现了100%布通率以及均匀的布局布线效果。

MEDA芯片菊花链的自动容错设计

张玲

2021, 43(07): 1192-1199. doi:

摘要 ( 205 )

PDF (1655KB) ( 236 ) 　　

微点阵生物芯片MEDA biochip将微电子和微流体结合，是最近出现的一种新型数字微流控芯片，它基于微点阵思想，每个微点阵单元都包含驱动电路和检测电路，从而实现对生化实验的实时监测。为减少外部引脚，MEDA芯片的所有微单元由菊花链串联，以实现对芯片的准确控制。作为MEDA芯片的关键数据通路，菊花链上即使只有一个单元发生故障，也会导致整条链失效，因此必须对菊花链进行有效的容错设计。为MEDA芯片设计了具有自测试和容错功能的菊花链结构，该结构由测试响应触发菊花链故障单元的自动容错。当菊花链的某个单元出现故障时，其测试响应产生异常，从而触发故障单元的自动修复，若修复失败，则异常的测试响应会再次触发该单元的旁路，从而实现自动容错。实验结果表明，该结构可以在测试和诊断故障的同时进行有效的容错，并在容错失败时将其永久旁路。

基于采样尺度自适应的多尺度量子谐振子优化算法并行化

焦育威, 王鹏, 辛罡,

2021, 43(07): 1200-1209. doi:

摘要 ( 204 )

PDF (743KB) ( 337 ) 　　

多尺度量子谐振子优化算法MQHOA是基于量子波函数理论提出的元启发式算法，传统MQHOA寻优过程中不同个体的采样尺度不具有差异性，这种机制限制了解的多样性。针对适应度不同的采样个体，提出采样尺度自适应策略，将采样情况差的个体采样尺度合理扩大，增加迭代过程中不同采样个体所使用采样尺度的多样性，并基于采样尺度的差异性提出并行化框架。选取7组测试函数将改进后的算法（MQHOA-PS）与MQHOA在华为鲲鹏920和AMD EPYC 7452处理器上进行测试实验，实验结果表明，改进后的算法寻优具有较高的精度和成功率，并且所需时间更短。

一种基于狼群优化的改进DV_Hop定位算法

宋玲, 黄达胜

2021, 43(07): 1210-1218. doi:

摘要 ( 170 )

PDF (708KB) ( 239 ) 　　

DV_Hop算法是经典的无需测距的无线传感器网络节点定位算法之一，但由于节点分布不均匀，由平均跳距计算出的未知节点与锚节点的距离跟实际距离差距较大，导致其定位精度不高。针对这一问题，借助于狼群算法需要的计算参数较少以及具有良好的寻优精度的特点，提出一种基于优化狼群算法（IWCA）的DV_Hop算法（IWCADV_Hop）。首先将DV_Hop算法的估计距离进行优化，对于距离锚节点跳数为1的未知节点，用RSSI方法直接求出它与锚节点的距离，从而减小估计距离的误差；其次，由于狼群算法容易陷入局部最优，提出优化狼群算法（IWCA），采用模拟退火的思想在探狼k次迭代未改变位置时，允许以一定概率向效果差的方向游走，游走方式采用混沌映射的方式；最后，将IWCA算法应用到节点定位的计算阶段，从而减小DV_Hop算法计算节点位置时产生的误差。理论分析与仿真实验表明，与同类算法相比，本文提出的IWCADV_Hop算法能提高无线传感器网络节点定位的准确性。

支持连接关键词搜索的属性加密方案研究

陈思琦, 黄汝维

2021, 43(07): 1219-1225. doi:

摘要 ( 203 )

PDF (505KB) ( 333 ) 　　

基于属性的加密机制能够实现细粒度的访问控制，支持多用户数据共享。针对大部分基于属性的可搜索加密方案存在效率低下、密钥易泄露以及仅支持单关键词搜索的问题，提出了一个支持连接关键词搜索的属性加密方案。该方案采用线性秘密共享矩阵实现访问控制，将秘密共享和恢复操作在一个与参与方属性关联的矩阵中进行，通过矩阵运算减少了计算量。在陷门生成阶段，避免直接将用户密钥提交给云服务器，保证了用户密钥的安全性。基于多项式方程实现了连接关键词搜索，缩小了搜索范围，提升了用户的搜索体验，严格的安全性分析证明方案能够达到抵抗关键字攻击安全。

混合频谱分配的三层异构网络覆盖概率分析

胡海霞, 贾向东, 叶佩文, 纪澎善, 敬乐天

2021, 43(07): 1226-1235. doi:

摘要 ( 129 )

PDF (981KB) ( 230 ) 　　

针对城市环境热点区域业务密集化部署带来的流量激增问题，将微微基站和毫微微基站密集部署在宏基站之上以达到分流的效果，构建了一个三层簇异构网络模型。为有效抑制层内和层间传输的严重干扰，提出了一种基于簇分类的改进共享频谱分配方案。采用泊松簇过程和泊松洞过程对基站部署进行建模，详细描述了接收端精确的干扰统计特性，基于有效性准则给出了系统覆盖概率。同时还考虑了有序FBS级联方案和无序FBS级联方案2种情况。仿真结果验证了理论分析的正确性，揭示了网络参数对网络性能的影响。与无序FBS级联方案相比，有序FBS级联方案的性能增益很大程度上取决于PBS和FBS的覆盖半径。

一种高效的SM2数字签名批量验证算法

阮鸥, 陈吉晨, 毛浩

2021, 43(07): 1236-1242. doi:

摘要 ( 487 )

PDF (534KB) ( 400 ) 　　

数字签名在身份认证、抗抵赖性等方面具有重要作用。例如电子货币系统，商家或消费者需要使用数字签名对电子货币进行签署或验证，以确保电子货币信息的安全性与正确性。当同时对大量的电子现金进行数字签名验证时，会大幅度降低整个系统的运行效率，因此使用批量验证算法显得尤为重要。对于DSA、RSA和ECDSA等数字签名已经有了很多成熟的批量验证算法，但是对于SM2数字签名算法目前还没有对应的批量验证算法。首次提出一种高效的SM2批量验证算法，将最为耗时的点乘运算由n次降为1次(n为签名数量)，大大缩短了验证时间。
证明了
SM2批量验证算法的正确性和安全性，并进行了实验验证。从实验结果可以看出，相对于单个验证算法，批量验证算法的效率显著提升，当签名数量达到约100万(220)时，单个验证
算法大约需要1 h，而批量验证算法仅需2 s。

基于Schur分解和混沌置乱的彩色图像鲁棒水印算法

李伟岸, 熊祥光, 夏道勋

2021, 43(07): 1243-1249. doi:

摘要 ( 144 )

PDF (1068KB) ( 277 ) 　　

针对传统的彩色图像水印算法往往仅是将一个随机信号或二值图像嵌入到彩色载体图像中这一问题，结合混沌系统和Schur分解的优点，提出一种将彩色水印图像嵌入到彩色载体图像中的鲁棒水印算法。首先，对彩色水印图像进行Arnold置乱和混沌加密，提高了待嵌入彩色水印图像的安全性能；其次，将彩色载体图像分离成3个通道，每一通道被划分为4×4的不重叠分块并对选择的分块进行Schur分解；最后，将预处理后的水印信号嵌入到Schur分解后的最大值元素中。实验结果表明，提出的算法具有较好的不可感知性，对滤波攻击、噪声攻击、JPEG压缩攻击和多种组合攻击都具有较好的鲁棒性。与基于Schur分解的相似水印算法相比，对于大多数攻击本文提出的算法具有更优越的抗攻击性能。

基于深度Q学习的室内无线网络资源分配算法

吕亚平, 贾向东, 路艺, 敬乐天

2021, 43(07): 1250-1255. doi:

摘要 ( 222 )

PDF (728KB) ( 209 ) 　　

针对室内无线网络中的能量消耗过大问题，提出了一种基于深度Q学习的家庭基站发射功率分配算法。首先构造深度学习网络(DLN)，优化室内无线网络的能量效率；然后将能量消耗指数作为奖罚值，利用批量梯度下降法不断地训练DLN的权值。最后仿真结果表明，所提出的算法可以动态调整发射功率，在收敛速度和能量消耗优化方面明显优于Q学习算法和注水算法，可以有效地降低室内无线网络的能耗。

基于各向异性和边缘强度修正因子的边缘检测算法

李凯, 张永生, 童晓冲, 李峰

2021, 43(07): 1256-1263. doi:

摘要 ( 207 )

PDF (1025KB) ( 289 ) 　　

融合了各向同性和各向异性高斯滤波器的边缘检测算法IAGK存在边缘拉伸效应，引起复杂边缘处产生伪边缘，各向同性高斯导数滤波器的引入，也导致算法对噪声的鲁棒性下降。同时，IAGK算法的各向异性因子非最优取值，理论上不具有最优信噪比和最优定位性能。
基于自动各向异性高斯核选择最优各向异性因子，并加入边缘强度修正因子修正IAGK算法的边缘强度公式，抑制伪边缘的产生和噪声的影响。利用经典边缘检测数据集对提出的边缘检测算法进行测试，实验结果显示，与Canny、AAGK和IAGK算法相比，提出的算法具有更好的噪声鲁棒性和更强的弱边缘检测能力，同时可进一步抑制伪边缘效应。在含噪声情况下，所提算法的边缘品质因子(FOM)分别比Canny、AAGK和IAGK算法高3％,4％和7％。

多尺度深度监督的高度近视萎缩病变分割方法

曾增峰, 环宇翔, 邹卓, 郑立荣

2021, 43(07): 1264-1272. doi:

摘要 ( 196 )

PDF (1446KB) ( 267 ) 　　

为提升眼底图像的高度近视萎缩病变分割精度，针对不同个体的眼底图像质量良莠不齐及因萎缩病变与相邻组织之间边界较为模糊等引起分割困难的问题，提出具有多尺度深度监督思想的高度近视萎缩病变分割方法。首先开发优化算法使得眼底图像组织结构清晰、风格统一，降低复杂特征的区分难度。由于利用V-Net只能够得到较低的分割精度，因此，通过融合高层与低层的特征形成多尺度特征学习的MS-V-Net，能够提取不同尺度图像中语义信息。更为重要的是，最终对MS-V-Net每个多尺度模块的深度监督形成紧密监督的MSS-V-Net，与原始 V-Net 分割方法相比，提高了网络对重要语义信息的判别性及泛化性能力。实验结果表明，本文方法的Dice盒图呈现出异常值变少，中位数变大，盒子长度变短，上下间隔变小，盒外的2条线变短的趋势，说明有效提升了高度近视萎缩病变图像的分割精度。

SAG-Net：用于联合视盘和视杯分割的新型跳过注意力指导网络

蒋芸, 高静, 王发林

2021, 43(07): 1273-1282. doi:

摘要 ( 209 )

PDF (1070KB) ( 249 ) 　　

学习特征图语义信息和位置信息对于在视网膜图像分割中产生理想的结果至关重要。最近，卷积神经网络在提取特征图有效信息方面已经表现出了强大的能力，然而，卷积和池化操作会过滤掉一些有用的信息。提出了一种新型跳过注意力指导网络SAG-Net来保存特征图语义和位置信息并指导扩展工作。在SAG-Net中，首先引入了跳过注意力门SAtt模块，将其用作敏感的扩展路径来传递先前特征图的语义信息和位置信息，不仅有助于消除噪声，还进一步减小了背景的负面影响。其次，通过合并图像金字塔保留上下文特征来进一步优化SAG-Net。在Drishti-GS1数据集上，联合视盘和视杯分割任务表明了SAG-Net的有效性。综合结果表明，SAG-Net优于原始的U-Net方法以及其他用于视盘和视杯分割的最新的方法。

基于全局和局部特征的无参考夜间图像质量评价

赵月, 王来花, 齐苏敏, 王伟胜, 刘晨

2021, 43(07): 1283-1290. doi:

摘要 ( 190 )

PDF (1380KB) ( 239 ) 　　

针对夜间图像光线暗、特征不易提取的问题，提出一种基于全局和局部特征的无参考夜间图像质量评价方法。首先，利用等高线原理将图像分为亮区域和暗区域2部分，将亮区域占整幅图的比例作为特征1；其次，提取夜间图像的全局亮度信息并将其作为特征2；再次，结合微分算子法求得图像的边缘图作为特征3；然后，将夜间图像从RGB转换到HSI，提取色度、饱和度和亮度分量并将其分别作为特征4、特征5和特征6；最后，结合上述特征通过BP神经网络建立评价模型来评价夜间图像的质量。在公开数据库上的测试结果表明，所提方法与主观分数具有更好的一致性，并且优于现有的图像质量评价方法。

基于SSD和时序模型的微博好友推荐算法

马汉达, 景迪

2021, 43(07): 1291-1298. doi:

摘要 ( 167 )

PDF (612KB) ( 277 ) 　　

社交网络用户的指数型增长，导致用户在网络中难以找到适合自己的好友。提出一种基于多目标检测算法SSD和时序模型的微博好友推荐算法BSBT-FR,首先利用SSD对搜集到的用户图像进行信息提取，再利用时序模型在时间维度上对提取到的信息做进一步处理，然后利用JS散度公式计算用户间的相似度，最后与基于用户个人信息得出的相似度进行加权式融合，得出综合的用户相似度，使用Top-K思想进行用户推荐。在新浪微博用户数据集上的实验表明，参考因素的权重取值会影响推荐结果，BSBT-FR算法与只考虑用户属性或用户图像的算法相比，精准度更高。

基于时间点过程的时间序列预测模型

郭全盛, 李栋, 张蕾, 魏楚元

2021, 43(07): 1299-1307. doi:

摘要 ( 307 )

PDF (920KB) ( 283 ) 　　

对城市中发生的事件进行有效预测，可以为政府避免、控制或减轻相关的社会风险提供决策支撑。首先，提出基于积分求导法的条件强度函数式，提高序列预测精度；其次，构建基于递归神经网络和累积危险函数的时间点过程模型，通过递归神经网络捕获历史事件的非线性依赖关系，利用全连接网络获得累积危险函数；最后，选择具有代表性的合成数据集和真实数据集对几种模型的性能进行对比分析。实验结果表明，所提模型可以更好地进行城市事件的时间序列预测，在平均绝对误差、平均负对数似然值等方面均优于传统的时间点过程模型，说明了模型的优越性。

融合词语统计特征和语义信息的文本分类方法研究

张丽, 马静

2021, 43(07): 1308-1315. doi:

摘要 ( 292 )

PDF (723KB) ( 271 ) 　　

为了更好地表示文本语义信息，提高文本分类准确率，改进了特征权重计算方法，并融合特征向量与语义向量进行文本表示。首先基于文本复杂网络实现文本特征提取，接着利用网络节点统计特征改进TF-IDF得到特征向量，再基于LSTM抽取语义向量，最后将特征向量与语义向量相融合，使新的文本表示向量信息区分度更高。以网络新闻数据为实验对象的实验结果表明，改进特征权重计算方法，在特征向量中引入了语义和结构信息，并融合特征向量和语义向量，能进一步丰富文本信息，改善文本分类效果。

基于二元与三元模型相结合的句法规则层次化分析算法

张海玲, 邵玉斌, 贾继康, 龙华, 杜庆治

2021, 43(07): 1316-1323. doi:

摘要 ( 142 )

PDF (712KB) ( 191 ) 　　

句法分析是自然语言处理领域中应用前景非常广阔的一个研究方向。针对目前句法分析多数是从字、词的角度出发且存在诸多不足，提出了二、三元词模型相结合的句法规则层次化分析算法，并结合分词、词性标注以及句子组织信息之间的结合度来解决词元间优先合成的问题，同时利用句子成分之间的语法结构关系对词性、词序的影响，实现句法规则的层次化分析实验。实验结果表明，二元与三元词模型相结合的句法规则层次化分析算法相比于独立二、三元词模型，准确率和召回率分别提高了82.04%和8083%，与现有基于二分结构句法分析的RNN-INT算法和词汇化模型算法相比，准确率和召回率均有明显提升。

基于耦合度和PDG混合特征的源代码作者归属预测

陈杰, 冯秀芳, 陈永乐

2021, 43(07): 1324-1330. doi:

摘要 ( 186 )

PDF (901KB) ( 234 ) 　　

为了在语料库中找出源代码的真实作者，提出了一种代码耦合度与程序依赖图特征结合的神经网络模型CPNN来识别源代码作者。首先，使用从源代码中提取的参数、扇入和扇出等特征计算代码的耦合度。其次，从转换的程序依赖图中提取控制和数据依赖项，应用预处理技术将PDG特征转换为具有频率细节的小实例，并且利用逆文档频率技术放大源代码中每个PDG特性的重要性。最后，利用CPNN模型预测程序员的编码风格特征，并对编码风格的真正作者进行属性划分。在1 000名程序员的源代码数据集上进行作者归属预测，得到了95%的准确率。

当期目录

作者中心

审稿中心

在线期刊