计算机工程与科学

2022年第3期目录

2022, 44(03): 0-0. doi:

摘要 ( 158 )

PDF (264KB) ( 230 ) 　　

谱方法求解水声传播问题的优化与并行

马现, 王勇献, 朱小谦, 屠厚旺, 李朋, 颜恺壮

2022, 44(03): 381-389. doi:

摘要 ( 255 )

PDF (1271KB) ( 608 ) 　　

水声传播数值计算的效率是各类水声学应用关心的核心因素之一，谱方法作为求解微分方程的一种数值方法，具有精度高、收敛速度快等优点，因此，近年来利用简正波-谱方法求解水声传播方程引起了许多学者的关注；然而，谱方法计算量更大，计算时间更长，在求解大范围海域声传播问题时，难以满足实时性的需求。因此，需要借助现代高性能计算机系统，利用并行计算和性能优化的技术，提高计算速度。首先分析程序的计算流程和热点函数，研究编译器选项优化和调用高性能数学库MKL、访存优化和精简计算等程序性能调优方法，面向众核高性能计算平台开展多线程并行加速处理。最后在天河二号众核平台上进行测试与评估，结果表明，计算深海波导算例最终改进后的程序相较于原始的程序运行时间从584 s减少到24 s，加速23.98倍，大大缩短了计算时间，验证了所用方法的有效性，对大海域水声场计算有重要意义。进一步的分析表明，这些优化与并行方法对同类型同平台的其它科学和工程数值计算问题也具有参考与借鉴意义。

AI服务器PCIe拓扑应用研究

林楷智, 宗艳艳, 孙珑玲,

2022, 44(03): 390-395. doi:

摘要 ( 616 )

PDF (1120KB) ( 894 ) 　　

CPU+GPU的架构设计广泛应用于AI服务器，以实现大数据、云计算和人工智能等领域的数据收集和处理，常用的CPU+GPU PCIe拓扑结构有Balance Mode、Common Mode和Cascade Mode 3种。结合实际需求，复杂多样的应用场景需要对各种拓扑结构的适用性进行研究。首先简要介绍3种拓扑结构；然后设计实验，通过点对点带宽与延迟、双精度浮点运算性能和深度学习推理性能测试深入分析3种拓扑的适用性，为AI服务器在实际应用中的PCIe拓扑选择提供指导。

基于机器学习的PCB布线电阻计算方法

刘国强, 赵振宇, 赵晨煜, 韩奥, 杨天豪

2022, 44(03): 396-402. doi:

摘要 ( 259 )

PDF (821KB) ( 351 ) 　　

在FPD领域中FPC端口和IC端口之间的布线被称为PCB布线。受到可布线区域形状、线宽和线间距等多种因素的影响，PCB布线可能是规则形状的布线，也可能是不规则形状的布线，导致精确计算布线电阻十分困难。现有的电阻计算方法能够基于布线拐点坐标计算任意形状的PCB布线电阻，但是这些方法时间开销和空间开销都很大，严重影响设计的收敛性，并且也无法有效利用已有的布线数据。首次研究了基于机器学习的PCB布线电阻计算方法：首先，将任意形状的PCB布线划分为多个连续的四边形布线；其次，利用建立的四边形布线电阻计算方法，对单个四边形布线进行电阻预测；最后，将所有四边形布线的电阻值进行累加获得该PCB布线的电阻值。通过“划分-预测-计算”的方式可以对任意形状的PCB布线电阻进行快速、准确的计算。与传统方法相比，该方法的平均绝对误差仅约1 Ω，内存开销和时间开销分别降低了60.9%和97.9%。

基于OpenVX并行处理器的微程序控制

张珂, 李涛, 邢立冬

2022, 44(03): 403-410. doi:

摘要 ( 144 )

PDF (1217KB) ( 283 ) 　　

针对OpenVX并行处理器中微控制器内部存储量大和转移步骤复杂的问题，利用相联存储器产生微程序初始地址的方法提高了控制存储器的利用率。并依据分组并行判断思想对各个操作执行条件分组，提高了转移地址产生的速度。通过将OpenVX中5类图像处理函数映射到此处理器进行验证，实验结果表明，采用上述结构和方法，控制存储器利用率提高了38.7%，平均转移步数减少了50%。最后优化了微程序，使系统整体的执行效率更高。

前馈环形振荡器的结构与相位噪声研究

桑浩, 袁珩洲, 梁斌, 陈建军, 郭阳

2022, 44(03): 411-416. doi:

摘要 ( 336 )

PDF (1442KB) ( 567 ) 　　

基于高速串行通信系统中锁相环和时钟数据恢复电路的需求,研究了前馈环形振荡器的结构与工作原理;在传统结构的基础上,将前馈路径耦合至主路径反相器的源极,可以提高输出信号的边沿速率;最后基于Hajimiri模型的脉冲灵敏度函数进行分析,提出的结构有效降低了热噪声和闪烁噪声的引入。在28 nm CMOS工艺下设计了单源极前馈型和双源极前馈型的环形振荡器,仿真结果表明,振荡频率在2.5 GHz时,2种新结构相位噪声分别为-99 dBc/Hz@1 MHz和-105 dBc/Hz@1 MHz,FoM值分别为163 dBc/Hz和164 dBc/Hz。

嵌入式系统安全防护方案比较与应用案例分析

陈祥国, 尚凡, 宋君强

2022, 44(03): 417-426. doi:

摘要 ( 232 )

PDF (1128KB) ( 634 ) 　　

伴随着物联网技术的发展，嵌入式系统安全防护问题已经成为当前亟需考虑并尝试解决的系统性难题。在比较多种嵌入式系统安全防护手段的基础上，深入剖析了基于硬件虚拟化技术的ARM TrustZone安全防护方案的系统组成、工作原理及设计实现要点。详细描述了TrustZone-A和TrustZone-M 2种技术的区别，并给出了2种技术的适用场景。给出了基于TrustZone技术的可信启动流程实现原理，讨论了基于TrustZone-A监控模式代码的异常程序检测实现的可行性。最后，结合典型应用场景，设计了基于TrustZone-M技术的安全防护方案及安全通信协议实现实例。

雾计算中支持计算外包的微型属性加密方案

王峥, 孙枭

2022, 44(03): 427-435. doi:

摘要 ( 143 )

PDF (1128KB) ( 413 )

PDF（mobile） (886KB) ( 9 ) 　　

密文策略属性加密为基于云存储的物联网系统提供了一对多的访问控制，然而现有方案中存在开销大、粒度粗等问题。基于此，结合雾计算技术提出了一种支持计算外包的微型属性加密方案。该方案缩短了密钥与密文的长度，减少了客户端的存储开销；将部分计算转载到雾节点，提高了加解密效率；具有更加丰富的策略表达能力，并且可以快速验证外包解密的正确性。安全分析结果表明，该方案具有选择密文攻击下的不可区分性。性能评估结果表明，该方案能够为雾计算中终端设备受限时的数据存储提供高效的访问控制。

区块链环境中基于局部敏感哈希的协同过滤推荐研究

汪静, 钱晓东

2022, 44(03): 436-446. doi:

摘要 ( 161 )

PDF (822KB) ( 329 ) 　　

针对区块链环境中海量高维的数据使得推荐性能低下的问题，通过对局部敏感哈希算法的优化，降低其在近邻搜索过程中带来的额外计算和存储开销。利用数据分布的主成分减少传统LSH中不良捕获的投影方向，同时对投影向量权重进行量化，以减少哈希表和哈希函数的使用；通过对哈希桶的间隔进行调整，并且根据冲突次数的大小进一步细化查询结果集，以显著降低距离计算的时间开销；最后采用加权平均策略进行评分预测并产生推荐列表。实验表明：与其他算法相比，优化后的LSH仅需要少量的哈希表和哈希函数就可以获得较为精确的近邻搜索结果，且搜索效率有很大的提高。优化后的LSH可以很好地应对区块链中数据特点所造成的问题，缓解高维大规模数据对推荐性能的影响，在一定程度上提高了推荐质量和效率。

代价约束算法对入侵检测特征提取的优化研究

刘云, 郑文凤, 张轶

2022, 44(03): 447-453. doi:

摘要 ( 137 )

PDF (1028KB) ( 293 ) 　　

入侵检测系统的防御性能经常受到类不平衡数据的影响，为了自动提取稀缺类别的数据特征，提高入侵检测系统识别未知网络攻击的精度，提出一种代价约束算法。首先，基于栈式自动编码器构建深度神经网络，在隐藏层的神经元上添加稀疏约束；其次，通过生成代价矩阵优化代价目标函数，对类不平衡数据特征分配代价；最后，利用反向传播微调神经网络模型参数，得到最优的特征向量。仿真结果表明，在面对多维和类不平衡数据时，与FAE算法和NDAE算法相比，代价约束算法在入侵检测精度和收敛性方面均有提升。

融合双层注意力机制的属性网络节点嵌入

杨凡亿, 马慧芳, 闫彩瑞, 宿云

2022, 44(03): 454-462. doi:

摘要 ( 173 )

PDF (742KB) ( 370 ) 　　

属性网络嵌入旨在学习网络中节点的低维表示，具有拓扑和属性相似的节点在嵌入空间彼此接近。注意力机制能有效学习网络中节点与其邻居的相对重要性并基于邻居重要性聚合节点表示。据此，提出一种在属性网络中融合双层注意力机制的节点嵌入算法NETA，可以有效地实现属性网络嵌入。该算法首先从拓扑结构捕获直接邻居，基于属性关系捕获间接邻居，并在此过程中考虑节点邻居的相对重要性。具体地，首先捕获节点的直接邻居和间接邻居，然后设计节点级注意力分别聚合直接邻居表示和间接邻居表示，最后设计语义级注意力对2种嵌入表示融合得到最终嵌入。在人工数据集和真实数据集上的大量实验验证了本文算法的有效性。

融合改进通道和层剪枝的口罩人脸检测

刘紫燕, 袁磊, 朱明成, 马珊珊

2022, 44(03): 463-470. doi:

摘要 ( 222 )

PDF (1112KB) ( 514 ) 　　

针对实际场景中目标检测算法部署算力缺乏和资源不足的问题，提出了一种基于改进通道和层剪枝的模型剪枝方法，通过设置自适应局部安全阈值以改进通道剪枝，同时通过综合评价整个残差结构值的方法进行层剪枝，并将模型剪枝方法用于口罩人脸检测。首先采用基于人脸的数据扩增方法构建口罩人脸检测数据集并使用该数据集训练YOLOv4目标检测网络；然后使用改进通道和层剪枝的模型剪枝方法对YOLOv4模型进行剪枝得到不同的剪枝模型，将这些剪枝模型在口罩人脸数据集上与YOLOv4和YOLOv4-tiny进行对比实验。性价比最高的剪枝模型（Prune-best）相对于YOLOv4模型参数量和模型大小减少75%，GFLOPS减少60%，模型推理时间减少3.7 ms，同时其mAP仅下降2.7%；极限剪枝模型（Prune-limit）更是以5.56 MB的模型大小和1.428 MB的参数量达到了0.662的mAP，比YOLOv4-tiny高63%，同时模型大小和参数量仅为YOLOv4-tiny的1/4。实验表明，剪枝后的模型其检测性价比更高，更适合实际场景中的口罩人脸检测部署。

基于全局注意力的室内人数统计模型

李静, 何强, 张长伦, 王恒友,

2022, 44(03): 471-478. doi:

摘要 ( 227 )

PDF (1500KB) ( 320 ) 　　

随着人工智能技术的爆炸式发展，机器学习、深度学习等技术在人脸识别、行人检测和视频跟踪等各个领域得到了广泛的应用，其中利用目标检测进行室内人数统计一直以来是一个热门的研究。室内监控画面存在人群相互遮挡，且目标特征模糊等问题，往往导致检测准确率低，误检率和漏检率高等情况的出现。为了解决此问题，提出了一种基于全局注意力的室内人数统计模型，引入注意力机制，对目标检测算法YOLOv3进行改进，通过提取更多小人头或模糊人头的特征来增强检测能力。实验结果表明，改进后的网络模型具有更高的召回率和平均精度。

基于注意力神经网络的糖尿病视网膜病变识别

张彤, 孟亮

2022, 44(03): 479-485. doi:

摘要 ( 268 )

PDF (955KB) ( 354 ) 　　

针对目前糖尿病视网膜病变识别主要依赖于医生的临床经验，病变特征难以用肉眼区分且识别率较低等问题，提出一种基于注意力神经网络的糖尿病视网膜病变分类方法。首先，对原始数据集中的视网膜图像进行归一化、直方图均衡化和数据增强等预处理;其次，调整经典的DenseNet，在避免梯度消失和保证分类精度的前提下，有针对性地减少连接数，提出了2-DenseNet，同时将注意力模块嵌入到2-DenseNet中，指导网络关注视网膜图像中的渗出物、厚血管和微动脉瘤等特征，使用改进后的网络对预处理后的图像进行训练并测试；最后，在公开的Kaggle数据集上对多个网络进行对比，实验结果表明，该网络对糖尿病视网膜病变的分类性能高于其他对比网络。

融合感知损失的单幅雾霾图像深度估计

张蕾, 王园宇, 张文涛

2022, 44(03): 486-494. doi:

摘要 ( 239 )

PDF (1403KB) ( 322 ) 　　

针对雾霾情况下室内外图像深度难以估计的问题，提出了融合感知损失函数的单幅雾霾图像深度估计方法。首先采用双尺度网络模型对雾霾图像进行粗提取，再结合底层特征进行局部细化;然后在上采样阶段使用多卷积核上采样方法，得到雾霾图像的预测深度图；最后将像素级损失函数与感知损失函数结合构造新的复合损失函数，对网络进行训练。在室内NYU Depth v2数据集和室外Make3D数据集上进行训练、测试和验证，结果表明：添加了多卷积核上采样方法和复合损失函数的双尺度网络模型能够很好地估计出单幅雾霾图像的深度信息，提高了雾霾情况下的深度估计精度和质量，同时缩短了模型训练时间，提高了对雾霾图像深度估计的适用性和准确性。

基于朴素贝叶斯分类的网络谣言识别研究

李文丽

2022, 44(03): 495-501. doi:

摘要 ( 342 )

PDF (696KB) ( 460 ) 　　

谣言的传播会破坏社会秩序、危害国家稳定、造成大众恐慌，而社交平台的广泛应用使得信息传播速度更快、波及范围更广，加大了谣言造成的负面影响，如何快速准确地识别网络谣言成为信息传播领域的热点问题。谣言识别本质上是一个二分类问题，因而基于贝叶斯分类的思想设计了网络谣言识别的朴素贝叶斯分类算法，利用Matlab软件构建朴素贝叶斯分类器，并采用从微博中收集的数据对该算法进行实验验证，通过控制训练集，对比识别结果的准确率、精确率、召回率和F1值，探究了不同训练条件下的朴素贝叶斯分类器对谣言与非谣言的识别情况和内含规律。研究表明，朴素贝叶斯分类器对于网络谣言识别具有有效性，且训练集的选取与控制对识别结果的影响较大，识别准确率随着训练条件的不同发生波动。

一种基于span的实体和关系联合抽取方法

余杰, 纪斌, 吴宏明, 任意, 李莎莎, 马俊 , 吴庆波

2022, 44(03): 502-508. doi:

摘要 ( 326 )

PDF (550KB) ( 398 ) 　　

基于span的联合抽取模型在命名实体识别和关系抽取上取得了优异的效果。这些模型将文本span作为候选实体，并将span元组视为候选关系元组。span的语义表示在实体识别和关系分类中共享。然而现有基于span的模型无法很好地捕获这些候选实体和关系的语义，为了解决这些问题，提出了一种融合attention机制的span的联合抽取模型。特别地，attention用于计算相关语义表示，包括span特定特征语义表示和句子上下文的语义表示。实验结果表明，所提出的模型优于以前的模型，并在ACE2005、CoNLL2004和ADE 3个基准数据集上达到了当前最优的结果。

用于绝缘子故障检测的CycleGAN小样本库扩增方法研究

崔克彬, 潘锋

2022, 44(03): 509-515. doi:

摘要 ( 265 )

PDF (1925KB) ( 411 ) 　　

在深度学习的训练中，绝缘子检测需要大量的故障绝缘子，而实际难以获得大量故障绝缘子数据。生成对抗网络为扩增训练样本提供了可行的解决办法。在循环一致性生成对抗网络（CycleGAN）结构上补充缺陷绝缘子样本，通过更改损失函数来优化模型，将正向生成器生成的图像，输入到反向生成器，保持样本整体轮廓的同时，增加了差异性。将改进的CycleGAN模型与其他GAN模型在SSD目标检测方法中进行比较，结果表明改进的CycleGAN扩增数据集的方法相较于其他扩增方法在绝缘子掉串检测识别率上有明显提升。

面向半实物仿真飞行平台的通用型飞行参数测试系统设计

王健, 张会新,

2022, 44(03): 516-520. doi:

摘要 ( 166 )

PDF (1501KB) ( 350 ) 　　

针对半实物仿真飞行平台在飞行科目评估、平台寿命研究及操作标准规范的制定等诸多领域缺乏完整原始数据支持的问题，提出了一种基于LabVIEW的通用型飞行参数测试系统。通过模拟座舱操控输入信息，如飞行摇杆、油门杆、开关控制面板和飞行脚舵等模拟指令，实现了与项目相关方的三维视景仿真软件的系统联试。多次测试结果表明：系统能够对飞行姿态参数、环境参数、发动机参数、各种告警信号以及飞行员通话信息和座舱语音信息等55种飞行仿真数据进行实时监测并循环记录，为飞机制造研发、改进升级、定检排故和飞行员操作动作编码提供了有效且可量化分析的数据支撑。

基于弹幕文本挖掘的社交媒体KOL研究

周忠宝, 朱文静, 王皓, 郭修远, 王立峰

2022, 44(03): 521-529. doi:

摘要 ( 228 )

PDF (835KB) ( 392 ) 　　

社交媒体关键意见领袖KOL为品牌营销带来更多机会，所以备受广告主青睐，但KOL行业的低门槛进入和数据造假行为，导致广告主无法快速找到与自身品牌匹配的KOL。基于以上背景，对KOL发布在社交平台的视频进行研究，对视频中的弹幕文本进行动态主题分析，刻画弹幕主题随时间的变化，同时使用卷积神经网络模型对含有广告的视频弹幕文本进行情感分析，进一步分析观众对于KOL推广行为的情感极性。实验结果表明，本文提出的KOL分析方法更加全面具体地评估了KOL的商业价值，能够帮助广告主高效找到合适的KOL。

基于改进鸽群优化算法的多无人机目标搜索

凌文通, 倪建军, 陈颜, 唐广翼

2022, 44(03): 531-535. doi:

摘要 ( 249 )

PDF (1378KB) ( 303 ) 　　

在三维未知环境中无人机目标搜索是一项非常具有挑战性和现实性意义的任务。鸽群优化算法相比于其他智能算法收敛速度快，搜索效率高，适用于目标优化任务，因此提出一种基于鸽群优化算法的多无人机目标搜索方法，无人机通过搜索目标留下的信息素搜寻目标。针对鸽群优化算法容易陷入局部最优的问题，利用基于差分进化策略对鸽群优化算法进行改进。仿真实验验证了提出的基于改进鸽群优化算法的多无人机目标搜索方法的合理性和有效性。

基于改进蚁群算法的水下自主航行机器人路径规划

刘雨青, 向军, 曹守启

2022, 44(03): 536-544. doi:

摘要 ( 394 )

PDF (1083KB) ( 776 ) 　　

为解决水下机器人AUV自主航行问题,在水底环境状态已知的条件下，利用一种改进的蚁群算法研究AUV在复杂水底环境下的路径规划问题。首先基于栅格法建立水下三维环境模型，在该模型中每只蚂蚁采用分层前进与栅格平面法相结合的搜索模式搜索路径。根据水下自主机器人的速度和在水底的受力情况，来确定水下机器人能耗模型和路径规划的数学模型。在传统蚁群算法的基础上，基于Dijkstra算法改进初始信息素分配，考虑到水下水流的作用，不同的路径点消耗的能量有所差异，因此构造新的启发函数来消除这种影响。通过基于线性回归的信息素更新方式来优化算法的收敛速度及求解质量。最后在使用改进的蚁群算法规划出来的路径基础上，采用贝塞尔曲线改善路径的平滑性，以便于AUV跟踪该路径。实验结果表明，改进的蚁群算法具有较强的全局搜索能力，收敛速度明显加快，规划出的路径明显优于传统蚁群算法和遗传算法的，适合水下机器人的路径规划。

基于RELM的时间序列数据加权集成分类方法

赵林锁, 陈泽, 丁琳琳, 宋宝燕

2022, 44(03): 545-553. doi:

摘要 ( 120 )

PDF (752KB) ( 256 ) 　　

时间序列数据通常是指一系列带有时间间隔的实值型数据，广泛存在于煤矿、金融和医疗等领域。为解决现有时间序列数据分类问题中存在的含有大量噪声、预测精度低和泛化性能差的问题，提出了一种基于正则化极限学习机(RELM)的时间序列数据加权集成分类方法。首先，针对时间序列数据中所含有的噪声，利用小波包变换方法对时间序列数据进行去噪处理。其次，针对时间序列数据分类方法预测精度低、泛化性能较差的问题，提出了一种基于RELM的加权集成分类方法。该方法通过训练正则化极限学习机(RELM)隐藏层节点数量的方法，有效选取RELM基分类器；通过粒子群优化(PSO)算法，对RELM基分类器的权值进行优化；实现对时间序列数据的加权集成分类。实验结果表明，该分类方法能够对时间序列数据进行有效分类，并提升了分类精度。

基于评分离散度的托攻击检测算法

贾俊杰, 段超强

2022, 44(03): 554-562. doi:

摘要 ( 156 )

PDF (859KB) ( 311 ) 　　

检测托攻击的本质是对真实用户和虚假用户进行分类，现有的检测算法对于具有选择项的流行攻击、段攻击等攻击方式的检测鲁棒性较差。针对这一问题，通过分析真实用户和虚假用户的评分分布情况，结合ID3决策树提出基于用户评分离散度的托攻击检测Dispersion-C算法。算法通过用户评分极端评分比、去极端评分方差和用户评分标准差3个特征衡量用户评分离散度，并将其作为ID3决策树算法的分类特征，根据不同特征的信息增益选择特征作为分类属性，训练分类器。实验结果表明，Dispersion-C算法对各类托攻击均有良好的检测效果，具有较好的鲁棒性。

基于动态矩阵的未知环境地图构建与路径规划

张志远, 陈海进

2022, 44(03): 563-570. doi:

摘要 ( 269 )

PDF (2691KB) ( 492 ) 　　

目前主流的SLAM地图构建方法在环境建模中一般要借助人机交互平台，人工成本高，独立性较差。提出基于动态矩阵的未知环境地图构建算法，可以在完全未知的陌生环境中，基于二维空间栅格地图建模并利用A*算法进行回溯，独立实现地图信息的全覆盖采集。针对传统的局部覆盖路径规划算法存在重复率高、运行效率低的问题，进行了改进设计，一旦检测到封闭区域则优先处理，并采用沿边循迹和牛耕式运动相结合的方法进行子区域路径规划。算法使用Matlab进行仿真设计，通过Webots机器人仿真平台进行了验证，仿真结果表明，改进算法与传统的局部覆盖算法相比，在子区域划分数目、回溯路径总长和路径重复率等指标上有明显提高。

当期目录

作者中心

审稿中心

在线期刊