计算机工程与科学

2022年第4期目录

2022, 44(4): 0-0. doi:

摘要 ( 368 )

PDF (277KB) ( 349 ) 　　

分布式存储系统读写一致性算法性能优化研究综述

沈佳杰, 卢修文, 向望, 赵泽宇, 王新,

2022, 44(4): 571-583. doi:

摘要 ( 1277 )

PDF (1053KB) ( 1148 ) 　　

读写一致性算法被广泛部署到分布式存储系统，以保证读写数据的正确性。然而，读写一致性算法通常需要使用一个复杂的通信协议来保证多个节点读写数据的正确性，会带来较大网络传输开销和读写时延。由于各种读写一致性算法实现机制存在较大差异，特定的读写一致性算法往往需要部署到特定的存储应用场景，才能高效地执行数据读写操作，保障对其上应用的服务质量。因此，实际的存储系统开发过程中，开发人员往往需要根据存储应用场景选择读写一致性算法，从而减少数据读写操作带来的系统开销。为了明确各种读写一致性算法适合的应用场景，介绍了分布式存储系统中存在的读写一致性问题，并综述了当前读写一致性算法的实现机制。总结了在副本和纠删码2种存储机制下主流的读写一致性算法，比较了这些读写一致性算法在实现机制、网络开销和数据存储开销等方面的特性。在此基础上，结合了单数据中心分布式存储系统和跨数据中心云际存储系统2种经典的应用场景，总结了开发人员在实际存储系统中部署读写一致性算法过程中需要注意的要点，分析了亟需解决的问题和提升数据读写操作性能的可能途径，展望了读写一致性算法未来的发展方向。

面向大数据存储的主动与被动相结合的性能评测方法体系结构与实现

刘世缘, 李云春, 陈晨, 杨海龙

2022, 44(4): 584-593. doi:

摘要 ( 691 )

PDF (1090KB) ( 605 ) 　　

随着数据量的日益增加，大数据存储在整个大数据应用框架体系中居于重要地位。对大数据存储系统进行性能评测可以指导大数据应用开发人员分析性能瓶颈，进行大数据系统的性能优化。在以往的工作中，通常使用基准测试的方式来对不同大数据框架进行性能评测，或者采用插桩并分析轨迹文件的方式对分布式文件系统进行性能分析。这2种方法采用的分析角度不同，并没有形成合理的评测体系来评价大数据分布式存储系统。本文提出主动与被动相结合的大数据存储系统性能评测方法体系结构及其具体实现。在主动性能评测方法方面，提供了6个领域，超过20个应用的基准测试程序，对大数据存储系统主动发起性能测试，分析大数据存储系统的基准性能指标；在被动性能评测方法方面，提供了对低效任务、低效算子、低效函数的分析及定位方法，通过分析运行在大数据存储系统之上的大数据应用，分析大数据应用程序低效的原因。通过实验表明，该大数据性能评测方法体系结构能够全面地对大数据存储系统进行性能评测。

面向Lustre集群存储的应用日志分析及系统自动优化框架

程稳, 李焱, 曾令仿, 王芳, 唐士程, 杨力平, 冯丹, 曾文君

2022, 44(4): 594-604. doi:

摘要 ( 624 )

PDF (1172KB) ( 667 ) 　　

在科学计算、大数据处理和人工智能等领域，对相关应用负载进行研究，分析负载I/O模式，揭示应用负载变迁规律等，对指导集群存储系统性能优化十分重要。当前应用种类繁多并且应用快速迭代更新，复杂的环境使得对应用负载的特性挖掘充满挑战。针对以上问题，在生产环境中收集了5个Lustre集群存储共计326天的应用日志信息，对应用负载的访问、负载特性进行了深入的探究与分析，并对已有观察进行了验证和补充。通过对应用日志信息横向、纵向和多维度对比分析与信息挖掘，总结了4个发现，并研究相关发现与以往工作的关联性，结合实际生产环境，给出了相应的系统优化策略与切实可行的实施方案，为用户、维护人员、上层应用开发者和多层存储系统设计等人员提供了相关参考与建议。同时，针对实际应用环境复杂、系统优化工作耗时费力等问题，设计并实现了一种系统自动优化框架（SAOF），SAOF可为指定应用负载提供资源预留、带宽限定等功能，初步测试表明，SAOF能根据系统资源与任务负载需求为不同任务提供自动化的QoS保障。

基于深度神经网络的高速信道自适应均衡器

翦杰, 罗章, 赖明澈, 肖立权, 徐炜遐

2022, 44(4): 605-610. doi:

摘要 ( 617 )

PDF (933KB) ( 1139 ) 　　

高速串行接口是提高高性能互连网络带宽的关键技术，而信道均衡器则是提高信号完整性的核心部件。利用现代数字信号处理(DSP)结构，提出了基于深度神经网络(DNN)的高速信道均衡研究方法，此方法在面向未来50 GB以上的高速信道时，克服了传统判决反馈均衡器（DFE）的判决速度受限于反馈回路的固有缺陷问题。仿真结果表明，在采用PAM4编码方式，高速信道波特率为28 GB，信道损耗为15 dB，或者波特率为56 GB，信道损耗为30 dB时，与传统的15阶FFE 组合2阶DFE的均衡器结构相比，本文所提出的3层DNN结构，具有更好的均衡效果，以及更快的均衡收敛速度。

无服务器计算技术研究综述

杨柏蔼, 赵山, 刘芳

2022, 44(4): 611-619. doi:

摘要 ( 1113 )

PDF (723KB) ( 1514 ) 　　

随着云计算的发展以及传统行业的转型，不断提高的技术要求与日益旺盛的市场需求使传统的应用软件开发模式面临挑战。同时，人们正在探索新一代的更经济、更有潜力的云服务模式。无服务器计算依托容器技术，提供了高并发、高兼容的特性，为开发者隐藏了底层服务器的细节，同时采取了更经济的按调用次数或时间计费的服务运营模式，引起了广泛的关注。首先，介绍无服务器计算的概念，并介绍其系统架构与技术特性。然后，介绍无服务器计算在科研、开源社区与工业届的研究现状。随后，列举无服务器计算在众多应用领域的实施案例。最后，阐述无服务器计算技术当前面临的挑战。

异构Spark集群数据倾斜修正调度策略

卞琛, 修位蓉, 于炯

2022, 44(4): 620-630. doi:

摘要 ( 945 )

PDF (1451KB) ( 753 ) 　　

异构Spark集群存在木桶效应，不合理的并行度导致任务分配与工作节点计算能力的适配性较差，进而影响集群计算效率和资源利用率。针对这一问题，首先建立模型，分析数据分布、并行度参数和节点任务分配的耦合关系，提出算法的优化目标，设计异构Spark集群的数据倾斜修正调度策略DSCS，包括并行度预估算法、数据倾斜修正算法和异构节点任务分配算法。预估算法对并行度进行先期设定，数据倾斜修正算法根据首个计算阶段的统计信息进行数据重新划分和并行度修正，由异构节点任务分配算法对集群不同计算能力的工作节点进行合理的任务分配，从而提高数据计算量与节点计算能力的适配性，优化Spark集群的整体性能。实验结果表明：在不同作业类型、不同数据集条件下，算法均取得了一定的性能提升，并能有效减少工作节点外存溢写的概率。

数据中心网络路由研究进展

段晨, 彭伟, 王宝生

2022, 44(4): 631-644. doi:

摘要 ( 1107 )

PDF (676KB) ( 745 ) 　　

随着云计算的迅速发展，运营商对数据中心的需求与日俱增。作为数据中心网络的关键技术，路由负责在数据中心内部以及数据中心之间为流量选路，为不同服务质量要求的流量提供差异化的路由转发服务。当数据中心规模比较大时，由于应用不可预估的通信流量以及数据中心网络的拓扑特点，传统因特网路由方法不能提供令人满意的高吞吐率和资源利用率，网络拥塞使得无法为具有服务质量要求的数据流提供带宽或时延保证。首先对数据中心网络的路由问题进行分类分析，然后着重介绍了单播路由方法的研究进展，进一步对拥塞感知的路由方法进行了介绍，最后讨论了新型数据中心网络的路由技术。

融合正余弦优化与跳距优化的DV-Hop定位算法

张晶, 贺媛媛,

2022, 44(4): 645-653. doi:

摘要 ( 704 )

PDF (642KB) ( 411 ) 　　

针对DV-Hop定位算法中跳距计算不精确以及最小二乘法求解不能达到最优无偏状态导致定位不准确的问题，提出一种融合正余弦优化与跳距优化的DV-Hop定位算法，并给出了最优化锚节点的概念。该算法首先选取每个未知节点周围所有锚节点中平均跳距最小的锚节点作为最优化锚节点；然后选取其余任一锚节点与未知节点构成三角形，将最优化锚节点到未知节点的边作为三角形中的最优化边；其次利用余弦定理计算其余锚节点到未知节点的距离，达到优化跳距的目的；最后利用正余弦优化算法改进最小二乘法，利用正余弦函数的波动性寻找未知节点的最优位置。实验结果表明，该算法相比于传统DV-Hop定位算法和DV-Hop改进算法，定位误差明显降低。

基于机器学习的移动代理应用流量识别方法

崔弘, 赵双, 张广胜, 苏金树

2022, 44(4): 654-664. doi:

摘要 ( 1039 )

PDF (1173KB) ( 1412 ) 　　

随着移动网络的迅速发展，越来越多的用户选择使用代理应用，以保护个人网络隐私，隐藏上网行为或绕开网络活动限制，给网络管理与审计带来了新的挑战。与此同时，恶意攻击者可利用代理应用隐藏身份，使得恶意行为更难以检测和防范。因此，代理应用流量识别对网络管理与安全具有重要的作用，但目前该问题并未得到充分的研究。由于代理应用流量通常经过加密或混淆处理，传统的流量识别技术无法被有效应用。为实现准确、快速的移动代理应用流量识别，提出一组与负载无关的流量特征，并首次加入TCP层option字段用于刻画流量。基于4种机器学习算法训练的分类器和2种流量识别对象，验证提出的特征对识别移动代理应用流量的有效性，并对各类特征的重要性进行分析。实验结果表明，提出的特征能有效识别代理应用流量。在识别流量是否经由代理时，基于随机森林的分类器可达到99%以上的整体准确率。识别流量所属代理应用时，整体准确率高于94%。在公开数据集ISCX VPN-nonVPN上与其他方法相比，提出的方法识别准确率更高，并具有更快的识别速度，适合实时流量识别场景。

动态特征选择算法对恶意行为检测的优化研究

刘云, 肖添, 王梓宇

2022, 44(4): 665-673. doi:

摘要 ( 828 )

PDF (875KB) ( 772 ) 　　

针对互联网中存在的恶意行为，特别是社交网络应用中的在线恶意行为，通常使用基于用户多维特征的聚类分析算法进行检测。提出一种动态特征选择算法(DFSA)，使用具有特征加权熵的模糊C均值目标函数，首先为参数构建一个学习模式，自动计算每个特征权重，并剔除权重小于阈值的特征，动态选择重要的特征，迭代地更新隶属函数、簇中心和特征权重直到最优化为止，最后识别出具有高精度的恶意用户行为簇。仿真结果表明，对比SDAFS算法、ELAFC算法和NADMB算法，DFSA算法在Rand指数、Jaccard指数和归一化互信息量3个主要性能指标上均有改善。

基于可见光视觉图像的路面裂缝识别深度学习方法述评

卢凯良

2022, 44(4): 674-685. doi:

摘要 ( 980 )

PDF (2662KB) ( 1670 ) 　　

基于可见光视觉图像的表面裂缝识别为非接触式，不受被测对象材质限制，可在线自动检测，具有速度快、成本低和精度高等优势。首先较为全面地搜集了典型的路面裂缝公开数据集，整理归纳了样本特征及其随机可变影响因素，并比较了传统手工设计特征工程、机器学习和深度学习3种主要裂缝识别方法的优缺点。然后，从网络架构、性能和效果方面着重评述了自搭架构、迁移学习和编码-解码器等易于训练和部署的深度学习算法新进展，通过算法优化和算力提升可显著提高识别的效果和性能，测试结果表明能够在低算力平台上实现裂缝补丁级快速检测和像素级实时检测。

针对机动目标的改进型交互多模型跟踪算法研究

杨冬英, 贺江鹏

2022, 44(4): 686-691. doi:

摘要 ( 1136 )

PDF (778KB) ( 735 ) 　　

为了提高对机动目标的跟踪精度，更准确地获得目标实时位置与速度信息，提出了一种改进型交互多模型跟踪算法。采用目标特征数据为初始数据提供限定域，然后在滤波器中加入调节参数，从而利用目标状态增益矩阵与协方差矩阵的迭代完成对跟踪精度的优化。实验仿真分析了机动目标的3种常见状态，并与传统交互多模型跟踪算法进行了对比。实验结果显示，该算法调节参量偏转角分别为4°,2°和1°时，均方根误差均值分别为15.91 m, 11.79 m和11.39 m，明显优于传统算法所得的均值21.39 m。随着参数精度的提高，滤波器对由机动目标状态引起的误差波动起到一定的抑制作用。

基于OSE-dResnet网络的列车底部零件检测算法

李利荣, 王子炎, 张开, 杨荻椿, 熊炜, 巩朋成,

2022, 44(4): 692-698. doi:

摘要 ( 1357 )

PDF (777KB) ( 420 ) 　　

针对列车底部零件难以检测的问题，提出了一种基于OSE-dResnet网络的列车底部零件检测算法。为了增加特征提取的丰富度与准确性，以Resnet50网络为基础，通过增加跨层传输来强化特征的提取；其次，在特征提取网络上嵌入OSEnet模块，利用全局特征增强有益特征通道；最后，将不同尺度特征层进行融合，实现特征信息互补。实验结果表明：引入OSEnet模块和d-Resnet网络后的算法对列车底部零件具有很好的检测效果，在测试数据集上对所提算法进行验证，mAP达到了98.77%。

基于字段过滤和伸缩窗口的SNM算法优化

周世杰, 娄渊胜

2022, 44(4): 699-706. doi:

摘要 ( 690 )

PDF (1050KB) ( 489 ) 　　

数据仓库中的问题数据对数据质量有较大的影响，为了查找和去除这些问题数据,首要的工作是处理相似重复数据，目前针对重复数据清除应用最多的算法是基本邻近排序算法(SNM)。通过分析SNM算法的缺陷，提出了一种改进的SNM算法——ISNM。采用属性区分法计算属性权值，解决了人为主观赋予权值导致的问题；使用字段过滤算法计算2条记录的相似度，减少了窗口内记录属性的比对次数，加快了算法的检测速度；使用可变窗口代替固定大小的窗口，防止记录漏配并减少无用的记录比对。实验结果表明，改进后的ISNM算法在查全率、查准率和运行时间开销上有明显的优势。

ED算法和SNP-index算法计算SNP位点的比较分析——以拟南芥为例

甘秋云

2022, 44(4): 707-712. doi:

摘要 ( 988 )

PDF (806KB) ( 578 ) 　　

SNP（单核苷酸多态性）是发生在DNA序列上单个核苷酸碱基之间的变异,是生物可遗传变异中最常见的一种变异。ED算法和SNP-index算法是计算SNP位点的2种常用算法。由高通量测序获得拟南芥F2代全基因组测序数据，基于Linux平台对测序数据进行过滤、筛选和比对，通过算法实现结果，比较不同算法检测得到的SNP位点数量和SNP基因型比例。实验结果表明，通过ED算法得到的SNP位点数量更多，分布更广，相对分布密度大于SNP-index算法的，但是2种算法得到的SNP位点数量和SNP基因型比例相近。

基于节点影响力的理性节点标签传播算法

皇甫斐斐, 杨阳, 邓晓懿,

2022, 44(4): 713-722. doi:

摘要 ( 762 )

PDF (2559KB) ( 718 ) 　　

社区发现能够揭示真实社会网络的拓扑结构和重要节点。由于具有线性时间复杂度，无需定义目标函数及目标参数，标签传播算法(LPA)作为经典社区发现算法被广泛应用在学术和实践领域。针对LPA算法更新顺序的无序性和标签选择的随机性,提出基于节点影响力的理性节点标签传播算法(RLPBNI)。将节点影响力排序作为更新顺序，引入理性节点概念进行标签选择，并定义重叠度进行社区再降维。实验结果表明，与其他对比算法相比,RLPBNI算法不但可有效提高社区划分精度，且更容易发现混合程度较高的网络中隐藏的社区。

基于广义重要度和runner-root算法的特征选择

吴尚智, 徐丹丹, 王旭文, 夏宁

2022, 44(4): 723-729. doi:

摘要 ( 661 )

PDF (594KB) ( 451 ) 　　

特征选择是机器学习、模式识别和数据挖掘等领域数据预处理阶段的重要步骤。现实中采集的数据维度很高，存在大量冗余和噪声数据，这使得计算时间增加的同时还会对建模结果产生误导性。结合属性子集的广义重要度和智能优化runner-root算法提出一种特征选择算法，用runner-root算法进行迭代寻优，用属性子集的广义重要度和所选特征子集的大小作为适应度函数，对所选特征子集进行评估，尽可能在整个样本空间内搜索出对决策重要的特征子集。实验结果表明，该算法可以选择出有效的特征子集，使分类模型得到较高的准确率。

基于预训练的无监督神经机器翻译模型研究

薛擎天, 李军辉, 贡正仙, 徐东钦

2022, 44(4): 730-736. doi:

摘要 ( 1080 )

PDF (655KB) ( 620 ) 　　

依赖于大规模的平行语料库，神经机器翻译在某些语言对上已经取得了巨大的成功。无监督神经机器翻译UNMT又在一定程度上解决了高质量平行语料库难以获取的问题。最近的研究表明，跨语言模型预训练能够显著提高UNMT的翻译性能，其使用大规模的单语语料库在跨语言场景中对深层次上下文信息进行建模，获得了显著的效果。进一步探究基于跨语言预训练的UNMT，提出了几种改进模型训练的方法，针对在预训练之后UNMT模型参数初始化质量不平衡的问题，提出二次预训练语言模型和利用预训练模型的自注意力机制层优化UNMT模型的上下文注意力机制层2种方法。同时，针对UNMT中反向翻译方法缺乏指导的问题，尝试将Teacher-Student框架融入到UNMT的任务中。实验结果表明，在不同语言对上与基准系统相比，本文的方法最高取得了0.8 ~ 2.08个百分点的双语互译评估(BLEU)值的提升。

改进DeepLabV3+的高效语义分割

马冬梅, 李鹏辉, 黄欣悦, 张倩, 杨鑫

2022, 44(4): 737-745. doi:

摘要 ( 1256 )

PDF (1267KB) ( 877 ) 　　

针对目前高精度的语义分割模型普遍存在计算复杂度高、占用内存大，难以在硬件存储和计算力有限的嵌入式平台部署的问题，从网络的参数量、计算量和性能3个方面综合考虑，提出一种基于改进DeepLabV3+的高效语义分割模型。该模型以MobileNetV2为骨干网络，在空洞空间金字塔池化（ASPP）模块中并联混合带状池化（MSP），以获取密集的上下文信息；在解码部分引入有效通道注意力（ECA）模块，以恢复更清晰的目标边界；将深度可分离卷积应用到ASPP模块和解码器中用于压缩模型。在PASCAL VOC 2012数据集上的实验中，该模型的网络参数量为4.5×106，浮点计算量为11.13 GFLOPs，平均交并比为72.07%，在计算效率和分割精度之间达到了良好的均衡。

基于模拟退火算法的人工势场法路径规划研究

赵炳巍, 贾峰, 曹岩, 孙瑜, 刘一鸿

2022, 44(4): 746-752. doi:

摘要 ( 1242 )

PDF (1134KB) ( 971 ) 　　

针对传统人工势场法在路径规划中存在局部极值小点问题，使得移动机器人无法运动到目标点，提出一种基于模拟退火算法的人工势场法，其利用模拟退火算法在出现局部极小点的位置附近增设随机目标点，引导移动机器人逐渐逃离出局部极小点区域。最终通过Matlab仿真表明，所设计的方法能使移动机器人逃离局部极小点位置，成功到达目标点位置，并且用时较短，更加稳定。

特征直连与结构化约束的多视图子空间聚类

张翼飞, 邓秀勤, 王卓薇

2022, 44(4): 753-760. doi:

摘要 ( 511 )

PDF (534KB) ( 431 ) 　　

多视图子空间聚类作为处理多视图数据的聚类算法，其目的在于学习到一个共识的子空间后用于聚类。但是，现存的多视图子空间聚类算法只是将目标放在了原有的多个视图上，忽略了通过特征直连得到的数据。提出的FSMC算法使原有的多个视图与特征直连视图相互学习，通过误差重构和结构化约束子空间得到一个更加合适的子空间表示，同时还考虑了多视图与特征直连视图的权重关系。最后，在4个基准数据集上进行实验，验证了算法的有效性。

当期目录

作者中心

审稿中心

在线期刊