计算机工程与科学

2023年第11期目录

2023, 45(11): 0-0. doi:

摘要 ( 184 )

PDF (248KB) ( 332 ) 　　

大规模三维频率域电磁积分方程法数值模拟

肖调杰, 周峰, 郑翾宇, 刘剑, 陈琳, 刘杰, 易明宽, 陈旭光, 龚春叶, 杨博, 甘新标, 李胜国, 左克,

2023, 45(11): 1901-1910. doi:

摘要 ( 301 )

PDF (1818KB) ( 569 ) 　　

地电磁学频率域电磁法在地球深部结构探测、油气勘查、环境与工程勘探等领域有着广泛的应用，其数值模拟的精度、速度直接影响资料解释结果。然而，当前频率域电磁三维数值模拟存在着求解精度差、计算时间长、计算规模受限等问题。采用积分方程法和直接解法提高求解精度，采用多层级多粒度混合并行、分布式存储等技术，大幅减少计算时间，扩大计算规模。实现了一种频点间并行、阻抗矩阵并行填充、方程组并行直接求解的快速、高精度、高可扩展性的频率域电磁三维数值模拟。首先，详细介绍了积分方程法理论和并行实现方案。然后，选取典型案例，通过与前人计算结果进行对比验证了程序的正确性。最后，针对1个16频点、16 × 12495个未知量、861个观测点的大规模算例进行了可扩展性测试，相比于1个节点32个进程，当计算规模达到256个节点8 192个进程时，加速比为69.69，并行效率为27.22%。此大规模并行算法适用于大地电磁和可控源音频大地电磁积分方程法。

面向大区域碳卫星数据的分布式Kriging插值算法优化

周小华, 王学志, 周园春, 孟珍,

2023, 45(11): 1911-1921. doi:

摘要 ( 175 )

PDF (1914KB) ( 474 ) 　　

针对基于原生Kriging算法在大区域尺度上对碳卫星数据进行插值时存在的计算耗时长、并行加速难等问题，对Kriging插值算法进行调整，优化其中的关键计算环节，并根据数据特征与时序依赖关系对插值过程进行拆分重组，细化插值粒度，将其构建为可在分布式环境下并行执行的DAG结构工作流，最后基于一套双层架构的DAG任务调度引擎实现整个插值工作流在分布式环境下的并行加速。实验结果表明，在不同区域尺度上，以上方法框架均具有较高的插值效率，与Spark相比，在大区域尺度上具有明显的速度优势。

基于非易失混合内存的高速气象数据管理系统设计

陈超, 顾青峰

2023, 45(11): 1922-1928. doi:

摘要 ( 158 )

PDF (853KB) ( 452 ) 　　

气象数据是典型的大数据，具有规模大、增速快和类型复杂等特点，而且气象模式数据由高性能计算机不断计算产生，同时也面临天气预报等气象业务的多种复杂查询，因此气象模式数据管理面临严峻的空间和性能挑战。非易失内存（NVM）是近年来应用的新型存储介质，具有性能高、存储密度高和非易失等优势,但同时也具有很多特殊的硬件特性，需要进行软件协同设计才能充分发挥其性能优势。因此，以非易失内存的硬件特征为出发点，设计了一种高速气象数据管理系统，相对于目前的内存数据管理系统，性能增幅为114.2%，且同时具有更大的存储容量和更低的单位容量成本。

超长指令字DSP标量访存单元的设计与优化

郑康, 李晨, 陈海燕, 刘胜, 方粮

2023, 45(11): 1929-1940. doi:

摘要 ( 218 )

PDF (1096KB) ( 492 ) 　　

近年来，随着集成电路技术的发展处理器与存储器之间的速度差异越来越大，存储器愈发成为制约计算系统性能的瓶颈。对于嵌入式、低功耗领域的DSP而言，其架构和应用场景与通用CPU不同，CPU的访存设计难以满足DSP的访存需求。针对超长指令字DSP在访存实时性、顺序与固定延迟、高效数据一致性方面的需求，设计了一种适用于DSP的标量访存单元，可配置的设计能够满足DSP的访存实时性；基于ID的顺序机制保证超长指令字架构对Load指令返回数据的顺序与固定延迟要求，存储开销为87.5 B；硬件查找“首1”加速了数据一致性所需的写回操作。当Cache中25%，50%和75%的行需要写回时，优化后的一致性写回开销为逐行扫描方法的26.4%，51.3%和76.2%，只与有效脏行数量成正比，与Cache容量无关。

基于近期文字极性分配的学习子句评估算法

冯心妍, 吴贯锋, 张丁荣, 王恪铭,

2023, 45(11): 1941-1948. doi:

摘要 ( 152 )

PDF (762KB) ( 435 ) 　　

为了维护学习子句数据库的大小，并以合理的成本执行单元传播，在SAT求解器求解过程中需要对学习子句进行评估，从而删除对求解过程无用的子句。因此，需要对学习子句数据库进行动态管理，包含对学习子句的分析和删除等，并提出新的评估子句有用性的方法，从而保留对求解最有促进作用的学习子句，以提高求解效能。从捕获学习子句近期的极性分配出发，结合现代求解器的回溯环节中常用到的基于字面极性的启发式方法——进度节省，来推断给定学习子句与剩余搜索步骤的相关性。以最先进的2种基于冲突驱动子句学习算法CDCL的求解器Glucose和MapleLCMDistChronoBT求解器为基准，针对其在子句评估环节的算法进行改进测试。实验结果表明，这种基于近期文字极性分配的子句评估策略能够普遍提高CDCL串行和并行求解器的求解效率，有效改善了原有求解器在一些问题上求解耗时过长的问题，并在先进求解器的水平上多求解了2个合取范式CNF文件，单个文件的平均求解时间缩短了13~34 s。

卫星网络传输优化新机制研究进展

梁向斌, 赵宝康, 彭伟

2023, 45(11): 1949-1959. doi:

摘要 ( 262 )

PDF (836KB) ( 736 ) 　　

卫星网络因其覆盖范围广、通信带宽高、抗毁能力强、天然广播等特性受到学术界和工业界的广泛关注。但是，由于其链路存在传播时延长、误码率高、带宽不对称等特点,传统TCP协议在卫星网络中性能不佳。近年来,随着以“星链”为代表的中低轨巨型星座迅猛发展和规模化部署应用,卫星网络表现出了高动态性的特点,这对卫星星座网络的高性能传输提出了严峻挑战，继而出现了一系列卫星网络传输协议优化的新技术。对近年来出现的卫星网络传输协议优化的新技术研究进展进行了总结，特别是对多路径传输、QUIC、智能传输优化等为代表的新技术进行了深入对比剖析。

基于数据处理器的QUIC加密/解密卸载

王继昌, 吕高锋, 刘忠沛, 杨翔瑞

2023, 45(11): 1960-1969. doi:

摘要 ( 355 )

PDF (1187KB) ( 531 ) 　　

QUIC作为与TCP并行的新兴传输协议，其优化方法沿用TCP研究路线，其中的主流是硬件卸载技术，将计算密集型功能模块卸载到网络设备，使用硬件卸载的方式代替主机CPU进行计算。然而由于硬件卸载通用性较差，性能虽高但无法保证用户可编程性。为了克服这个限制，提出了软件卸载模型——NanoBPF，基于DPU中RISC众核的协议卸载模型，通过修改BootLoader的启动代码，引导启动eBPF代码作为运行时环境，对协议栈中CPU占用率较高的加密/解密功能模块进行软件卸载。其中，加密/解密功能模块使用高级语言(C)编写，并被编译成自定义的BPF字节码动态载入DPU。通过本地和基于Docker的网络拓扑对该原型系统的吞吐量和公平性进行验证，结果表明，报文加密/解密的软件卸载能提高协议栈近13%的报文吞吐率，且在一定条件下能够保证与TCP的链路公平性。

融合高分辨率网络的雾天目标检测算法

张骞, 陈紫强, 孙宗威, 赖镜安

2023, 45(11): 1970-1981. doi:

摘要 ( 212 )

PDF (1924KB) ( 493 ) 　　

针对雾天场景中因图像模糊不清、目标难以分辨等原因导致错检、漏检的问题,提出了一种融合高分辨率网络的目标检测算法HR-Cascade RCNN。采用高分辨率网络HRNet作为Cascade RCNN的特征提取网络，通过不同分辨率的子网络并行连接，提取多尺度的特征信息，减少下采样过程中的信息损失，增强目标的语义信息表示；使用CIoU损失函数替换原有的Smooth L1损失函数，引入惩罚项度量真实框与检测框之间宽高比的相关性，优化网络的收敛效果，有助于提高检测框的定位精度；最后，采用SoftNMS改进候选框选择机制，降低车辆遮挡等情况下的漏检率，提高网络检测能力。在真实雾天数据集RTTS和合成雾天数据集Foggy Cityscapes上的实验结果表明，HR-Cascade RCNN与原Cascade RCNN相比，mAP分别提高了5.9%和3%。

一种基于MLP的高效高精度三维视线估计方法

吴志豪, 张德军, 吴亦奇, 陈壹林

2023, 45(11): 1982-1990. doi:

摘要 ( 263 )

PDF (1137KB) ( 456 ) 　　

随着卷积神经网络(CNN)在计算机视觉领域的广泛应用,以及大量三维视线数据集的公开,基于表观和深度学习相结合的三维视线估计研究受到越来越多的关注。由于CNN结构复杂,这类方法在实时性要求较高的应用场景中还有待进一步改进。近来兴起的研究表明,网络结构更为简单的多层感知机(MLP)模型能够取得与当前最佳CNN、Transformer模型相当的性能。受此启发,提出了一种基于MLP的高效高精度三维视线估计方法,利用MLP模型对双眼、人脸图像提取特征，之后融合推导出三维视线。实验结果表明,对MPIIFaceGaze数据集和EyeDiap数据集中包含的31位不同相貌的受试者,使用提出的方法UM-Net进行视线估计,视线估计精度比肩基于CNN的,并且在视线估计速度上具有明显优势,在实时性要求较高的领域也有较好的应用前景。

基于多尺度特征融合网络的HEVC帧内编码单元快速划分研究

刘雨墨, 刘剑飞, 郝禄国, 曾文彬

2023, 45(11): 1991-1998. doi:

摘要 ( 143 )

PDF (725KB) ( 432 ) 　　

高效视频编码HEVC显著提高了编码效率，但同时增加了编码复杂度，在基于四叉树结构的编码单元（CU）划分过程中尤为明显，因此研究CU快速划分具有重要意义。多尺度特征融合的网络可以实现HEVC编码单元快速划分。为此，结合U-Net和CU划分特性设计了UcuNet网络，同时为加强不同尺度像素的特征提取，采用了非对称卷积AC和CBAM注意力机制。为更好地训练深度学习模型，收集了不同分辨率的原始视频和对应的编码信息构建出大规模的数据集。最后将模型嵌入到HEVC编码架构中，提前预测CU划分的结果，跳过了原始CU划分方法中递归的率失真优化（RDO）计算过程，从而有效降低CU划分带来的编码复杂度。实验结果表明，对比HEVC官方测试模型（HM16.20），UcuNet在BD-BR仅损失2.63%的情况下，使平均编码时间缩短了68.13%。

一种基于自适应结构感知池化图匹配的图相似度计算模型

贾康, 李晓楠, 李冠宇

2023, 45(11): 1999-2007. doi:

摘要 ( 163 )

PDF (590KB) ( 504 ) 　　

图相似度计算在许多有关图的任务中起着重要作用，例如图相似性搜索、图分类和图聚簇等。由于计算2个图之间的精确距离/相似度通常是NP-hard的，因此基于神经网络提出了自适应结构感知池化图匹配网络模型（ASAPMN），用端到端的方式来计算任意2个图结构之间的相似性。利用一种新颖的自我注意网络和一种改进的图神经网络来确定给定图中每个节点的重要性，通过学习对每一层的节点进行稀疏软集群分配，从而有效地池化子图，形成池化图。在池化后的图对上利用结点-图匹配网络有效地学习一个图的每个节点与另一整个图之间的跨层交互提取图间相似度。在4个公共数据集上的综合实验结果表明，ASAPMN在图-图分类和回归任务中优于最先进的基线模型。

改进DBNet的电商图像文字检测算法研究

李卓璇, 周亚同

2023, 45(11): 2008-2017. doi:

摘要 ( 389 )

PDF (1394KB) ( 493 ) 　　

电商图像背景较为复杂、文字区域形状多变，现有的文字检测模型无法精确检测文字位置这一问题。提出一种改进的文字检测模型——迭代自选择特征融合DBNet（iSFF-DBNet）。首先在主干网络提取特征后，在构建特征金字塔网络FPN的过程中引入注意力机制;然后提出了迭代自选择特征融合模块iSFF来提升模型的特征提取能力;最后引入双边上采样模块提升可微分二值化模块的自适应性能。实验结果表明，在ICPR MTWI 2018网络图像数据集文本检测任务中，对比标准的DBNet模型，所提改进模型的召回率和F-score分别提升了6.0%和2.4%。与其他文字检测模型相比，该模型在精确率和召回率上取得了平衡，能够更准确地检测文字。

融合标签信息的分层图注意力网络文本分类模型

杨春霞, 马文文, 徐奔, 韩煜,

2023, 45(11): 2018-2026. doi:

摘要 ( 229 )

PDF (1062KB) ( 538 ) 　　

目前基于分层图注意力网络的单标签文本分类任务存在2方面不足：一是不能较好地对文本特征进行提取；二是很少有研究通过文本与标签之间的联系进一步凸显文本特征。针对这2个问题，提出一种融合标签信息的分层图注意力网络文本分类模型。该模型依据句子关键词与主题关联性构建邻接矩阵，然后使用词级图注意力网络获取句子的向量表示。该模型是以随机初始化的目标向量为基础，同时利用最大池化提取句子特定的目标向量，使得获取的句子向量具有更加明显的类别特征。在词级图注意力层之后使用句子级图注意力网络获取具有词权重信息的新文本表示，并通过池化层得到文本的特征信息。另一方面利用GloVe预训练词向量对所有文本标注的标签信息进行初始化向量表示，然后将其与文本的特征信息进行交互、融合,以减少原有特征损失，得到区别于不同文本的特征表示。在R52、R8、20NG、Ohsumed及MR 5个公开数据集上的实验结果表明，该模型的分类准确率明显优于其它主流基线模型的。

基于扰动优势关系的直觉模糊三支决策方法

周施吉, 唐孝, 赵容乐, 梁艳玲,

2023, 45(11): 2027-2035. doi:

摘要 ( 147 )

PDF (691KB) ( 347 ) 　　

针对现有直觉模糊优势关系要求过于严格，以及评价信息损失较大和利用不全的问题，利用直觉模糊集之间的扰动度提出了符合直觉模糊特点的直觉模糊扰动优势关系。进而得到比等价类要求更低的扰动优势类，从而更大程度利用评价信息，紧接着讨论了优势类的相关性质。随后针对现有直觉模糊三支决策方法中的条件概率用实数表示导致不确定信息丢失问题，基于扰动优势关系提出了用直觉模糊数表示的条件概率的计算方法，并且给出了三支决策以及多属性决策规则。通过算例验证了该方法的有效性，并对优势程度和风险规避系数进行了灵敏度分析。

基于变尺度黑洞和种群迁徙的粒子群优化算法

许文俊, 王锡淮

2023, 45(11): 2036-2046. doi:

摘要 ( 133 )

PDF (1156KB) ( 369 ) 　　

针对粒子群优化(PSO)算法收敛速度慢、易早熟收敛等问题，提出基于变尺度黑洞和种群迁徙的PSO——IRBHPSO。引入变尺度黑洞来平衡算法全局探索和局部寻优的权重；在位置更新策略中引入基于混合策略的位移系数，增强算法在迭代前期的收敛速度和在迭代后期的局部寻优能力；将基于种群迁徙的蝴蝶优化算法(BOA)作为局部算子融入PSO中，改善PSO收敛速度慢、易陷入局部最优的问题。使用IRBHPSO、PSO和其他相关算法对12个基准测试函数进行仿真实验，并进行Wilcoxon秩和检验。实验结果表明，IRBHPSO具有更好的收敛精度、收敛速度和稳定性。

基于异构信息网络的推荐研究综述

汪春播, 温继文

2023, 45(11): 2047-2059. doi:

摘要 ( 372 )

PDF (1321KB) ( 724 ) 　　

推荐在满足用户信息需求和解决信息过载问题中发挥着重要作用，异构信息网络因其蕴含丰富的语义信息为推荐的优化提供了新的途径。在查阅国内外异构信息网络的推荐研究基础上，采用SATI、Ucinet、NetDraw和SPSS等软件进行文献计量分析和可视化分析，得出当前研究热点和进展。依据文献关键词的聚类结果，发现已有研究主要是基于聚类、随机游走、元路径、矩阵分解和网络嵌入的算法，并实现了在学术科研、兴趣点、Web服务、社交好友、专利交易和新闻等推荐场景的应用。基于异构信息网络的推荐研究还有较大发展空间，未来可以在动态推荐、深度网络表示学习和拓展应用等方面开展研究。

一种基于共现关键词的TextRank文摘自动生成算法

阎红灿, 李铂初, 谷建涛,

2023, 45(11): 2060-2069. doi:

摘要 ( 211 )

PDF (1069KB) ( 464 ) 　　

传统TextRank算法在生成摘要时只考虑句子间的相似度，忽略了文章本身间的相似度，且生成的摘要往往包含重复的信息表达。为此，提出一种基于共现关键词的TextRank算法，用word2vec模型将文章表示为句向量，考虑到文章的类别，将该类文章的共现关键词作为参数参与句子权值的迭代计算，然后，通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正。实验结果表明，所提算法能够提高生成摘要的全面性和准确性。同时，所提算法使用MMR对抽取得到的摘要进行去除冗余处理，改善了摘要的重复表达情况。

基于FCEEMD复合筛选的故障特征提取方法

周成江, 贾云华, 张雨宽, 禄俊

2023, 45(11): 2070-2077. doi:

摘要 ( 194 )

PDF (1443KB) ( 400 ) 　　

针对快速集成经验模态分解（FEEMD）和固有模态函数（IMF）选择方法的缺陷，提出一种基于快速互补总体经验模态分解（FCEEMD）复合筛选的故障特征提取方法。首先，引入符号相反的成对的白噪声来中和FEEMD中的残余噪声，抑制IMF之间的模态混叠并得到一系列新的IMF；然后，基于能量及相关系数构建复合筛选模型并根据筛选得到的有效IMF构建重构信号；最后，通过希尔伯特（Hilbert）包络解调提取重构信号中包含的周期性脉冲特征来诊断轴承故障。凯斯西储大学(CWRU)轴承数据集上的实验结果表明，该方法能高效、准确地提取出轴承故障特征，在旋转机械故障诊断中有借鉴意义和应用前景。

差分变异和领地搜索的平衡优化算法及其机器人路径规划

张贝, 闵华松, 张新明

2023, 45(11): 2078-2090. doi:

摘要 ( 206 )

PDF (947KB) ( 450 ) 　　

平衡优化EO算法是最近提出的一种优秀元启发式算法，但在解决复杂优化问题时存在搜索能力不足、可操作性差和搜索效率低等问题。因此，提出了一种改进的EO，即差分变异和领地搜索的EO——DTEO。首先，提出一种融合领地搜索的差分扰动策略用于最优粒子的浓度更新。然后，提出了一种精英与最差粒子差分变异策略来强化最差个体。最后，提出一种信息共享的差分变异策略和简化EO中的新解产生方式，并将二者动态融合用于其它粒子浓度的更新，以提高算法的可操作性和搜索能力，并缩短运行时间。CEC2014复杂函数测试集上的优化实验结果表明，与EO及其他优秀算法相比，DTEO搜索能力更强、效率更高和可操作性更强。DTEO应用机器人路径规划的实验结果也表明，DTEO具有更强的竞争性。

当期目录

作者中心

审稿中心

在线期刊