计算机工程与科学

2021年第3期目录

2021, 43(03): 0-0. doi:

摘要 ( 152 )

PDF (284KB) ( 269 ) 　　

基于偏折路由的双环片上网络

齐星云, 戴艺, 赖明澈, 常俊胜, 董德尊

2021, 43(03): 381-388. doi:

摘要 ( 236 )

PDF (620KB) ( 332 ) 　　

为了降低中等规模的片上网络设计复杂度，提高网络效率，提出了一种基于偏折路由的双环片上网络结构，研究了其冲突解决机制，给出了一种简单高效的路由算法，并采用硬件描述语言实现了该网络结构，构建了周期精确的网络性能模拟环境。仿真和实验结果表明，在中小规模网络环境以及网络负载不高（<40%）的情况下，这种双环网络结构在延时和吞吐率等性能指标上，与具备100%吞吐率的YARC结构的片上网络相当，但其硬件开销远远小于YARC的。

基于3D可扩展PE阵列CNN加速器的设计

苏梓培, 杨鑫, 陈弟虎, 粟涛

2021, 43(03): 389-397. doi:

摘要 ( 451 )

PDF (1122KB) ( 351 ) 　　

卷积神经网络具有参数大、运算量大的特点，当将其具体应用在移动端设备时，需要在满足帧率（速度）的前提下，尽量减少功耗与芯片面积。考虑满足现有移动端网络的兼容性、性能和面积等因素，设计一个基于3D可扩展PE阵列的CNN加速器。该加速器兼容3×3卷积、3×3深度可分离卷积、1×1卷积和全连接层，其PE阵列能根据具体应用的网络和硬件约束，设定3个维度上最优的并行度参数，以达到更优的性能。该CNN加速器在512个PE下运行yolo-v2达到76.52 GOPS、74.72%的性能效率，在512个PE下运行mobile-net-v1达到78.05 GOPS、76.22%的性能效率。最后应用CNN加速器构建了一个实时目标检测系统，将yolo-lite网络部署至XILINX Zynq-7000 SoC ZC706硬件开发平台上，其CNN运算性能达到了53.65 fps。

SAR成像应用特征分析及硬件设计空间讨论

孔玺畅, 文梅, 蓝强

2021, 43(03): 398-406. doi:

摘要 ( 234 )

PDF (779KB) ( 274 ) 　　

合成孔径雷达SAR是一种主动式的对地观测系统。近年来SAR逐渐朝着多平台化发展，陆续出现了在无人机、探测车等小型移动平台上。SAR成像是运行在SAR上的成像程序，由于新的特殊运行环境的出现、其对低能耗和高算力有了更严格的要求。如何针对特定的平台，提供高性能、低功耗的应用支持，便成为其核心要点。对SAR成像计算和访存等特征进行了分析，针对性地进行了程序优化并测试了该程序在x86平台上的性能，以获得可靠的性能参考。在此基础上，面向DSP+FFT加速器的硬件结构，构建了一个算力配比数学模型，为硬件设计提供解决方案。

基于长短时记忆网络的电商大数据同一性标定

刘亚波, 吴秋轩

2021, 43(03): 407-415. doi:

摘要 ( 188 )

PDF (1282KB) ( 245 ) 　　

政府采购平台上的电商大数据，由于商品种类繁多且书写格式无统一规范，采用传统模型在大数据中标定出同一种商品时准确率低、速度慢、样本利用率低、泛化能力不足。提出一种基于长短时记忆网络（LSTM）的同一性标定模型，该模型由分词、重要性排序和相似度计算3个子模型串联组成。分词子模型对电商大数据进行预处理，获得有区分度的关键词序列；LSTM重要性排序子模型筛选最能表征商品信息的重要关键词序列；LSTM相似度计算子模型在给定大数据中准确标定出同一种商品。另外还引入二分查找、GloVe词向量化和词序列语义校验技术，分别用于提高标定速度、训练样本利用率与标定泛化能力。实验结果表明，在处理不同品类的电商大数据时，所提模型对易混淆样本的同一性标定准确率高。

分布式深度学习通信架构的性能分析

张立志, 冉浙江, 赖志权, 刘锋

2021, 43(03): 416-425. doi:

摘要 ( 375 )

PDF (1381KB) ( 413 ) 　　

近年来，深度学习技术的进步推动人工智能进入了一个新的发展时期。但是，海量的训练数据、超大规模的模型给深度学习带来了日益严峻的挑战,分布式深度学习应运而生，逐渐成为应对这一挑战的有效手段，而高效的参数通信架构是保证分布式深度学习性能的关键。针对传统分布式深度学习模型同步架构在大规模节点上并行训练的问题，首先，分析了集中式的Parameter Server和去中心化的Ring Allreduce这2种主流的参数通信架构的原理和性能。然后，在天河高性能GPU集群上基于TensorFlow构建了2种分布式训练架构的对比测试环境。最后，以Parameter Server架构为基准线，测试了Ring Allreduce架构在GPU集群环境下训练AlexNet和ResNet-50的对比性能。实验结果表明，在使用32个GPU的情况下，Ring Allreduce架构扩展效率可达97%，相比Parameter Server架构，其分布式计算性能可提升30%，验证了Ring Allreduce架构具有更好的可扩展性。

一种基于遗传算法的多站点协同计算卸载算法

季子豪, 江凌云

2021, 43(03): 426-434. doi:

摘要 ( 332 )

PDF (786KB) ( 405 ) 　　

边缘计算为资源受限的物联网IoT设备扩展计算资源、增强存储容量，可以改善IoT应用程序的执行性能。在IoT环境中，大多数应用都将以分布式架构的形式部署在各站点中，站点之间需要协作完成任务。为了解决物联网环境中多站点协同计算的代价优化问题，提出了一种基于遗传算法的多站点协同计算卸载算法GAMCCO。该算法将应用程序抽象为任务依赖关系图模型，分析各任务之间的依赖关系，将多站点协同计算卸载的问题建模为代价模型，并利用遗传算法寻找最小代价的卸载方案。实验与评估结果表明，所提出的GAMCCO算法可以有效减少IoT应用的时延，同时降低终端设备的能耗。

物联网感知数据边缘卸载机制研究

袁培燕, 耿丽娟, 张豪

2021, 43(03): 435-441. doi:

摘要 ( 193 )

PDF (673KB) ( 264 ) 　　

物联网的普及与增强现实等计算密集型应用产生的大量数据，给当前骨干网络带来沉重的流量负担。为了提升用户体验，需要将感知数据迁移到距离用户更近的边缘服务器中。考虑到边缘服务器的资源相对有限，如何确定适当的数据卸载比例是一个无法回避的问题。首先，将该问题表述为一个包含延迟和能量消耗2个关键性能指标的序列二次规划问题。其次，利用有效集算法进行求解，得出在一定计算卸载能耗约束下的最佳工作负载分配比例。最后，通过Matlab仿真实验，验证了在任务负载到达率远远大于边缘服务器处理速率时，所提方案具有最佳的延迟性能。

能耗均衡的多跳多路径认知分层路由算法

王俊喜, 陈桂芬

2021, 43(03): 442-448. doi:

摘要 ( 170 )

PDF (909KB) ( 262 ) 　　

为了缓解频谱资源紧缺的现状，提高认知无线传感器网络能量消耗的均衡性，并减少网络的能量消耗，提出了一种适用于异构认知无线传感器网络的能耗均衡多跳多路径认知分层路由EMMCH算法。首先，根据节点剩余能量、节点位置和邻居节点密度改进了簇首选举概率；其次，结合竞争半径的概念，平衡区域簇首能耗；然后，根据节点信道可用性和剩余能量选举最优簇首，簇首总数依据动态选举的思想确定；最后，簇首节点选取剩余能量高、距离汇聚节点近且存在空闲信道的节点进行多跳传输路径规划，再结合沿途消耗和不均衡程度选取最优路径。仿真结果显示，与对比算法相比，EMMCH算法具有更长的生命周期、更高的稳定性、更多的数据传输量和更均衡的网络能耗。

天地一体化网络地面核心网基于5G网络切片的设计与实现

谷聚娟, 张亚生, 庞金坤

2021, 43(03): 449-455. doi:

摘要 ( 238 )

PDF (940KB) ( 296 ) 　　

针对天地一体化网络地面核心网组网灵活性不足和资源利用率低的问题，提出了采用5G网络切片技术的架构设计方案，并基于Docker平台实现了原型系统。在原型系统上加载了IMS多媒体通信、物联网信息采集和上网下载3种切片业务进行测试，结果表明，不同网络切片可以根据服务的性能要求灵活地分配网络资源并独立提供服务，相关设计方案能有效提高天地一体化网络地面核心网的组网灵活性。

基于Strcmp分解超Lorenz混沌的图像加密算法

靳旭文, 李国东

2021, 43(03): 456-464. doi:

摘要 ( 191 )

PDF (3043KB) ( 278 ) 　　

由于初始参数恒定造成混沌系统性能衰弱，且结合加密混沌源序列方式单一，因此，提出一种基于数理逻辑逆运算的Strcmp序列分解的图像加密算法，结合超Lorenz混沌系统并设置密文熵反馈机制，多次重置混沌发生器，利用分解的序列对图像分块进行优化置乱和加取模扩散加密。仿真实验表明，所提算法分解的序列随机性好，对Lena图像进行仿真，得到的NPCR值为99.62%，UACI值为3348%，熵值为7.999 4，相较其他算法能更有效地利用混沌序列，且对特殊图像亦具有良好的加密效果，因此能够有效地抵御选择明文攻击等。

基于EEG微状态方法的视觉想象识别研究

李昭阳, 伏云发

2021, 43(03): 465-472. doi:

摘要 ( 245 )

PDF (761KB) ( 251 ) 　　

运动想象MI是基于想象的脑机交互BCI中常用的任务，但MI不易习得和控制，且存在“BCI盲”现象，使得该类BCI的实用化受限。
针对较易习得和控制的视觉想象VI任务进行识别，旨在构建基于VI的BCI(VI-BCI)。招募了15名被试者参加2种动态图像的视觉想象任务并采集脑电EEG数据；然后采用EEG微状态方法研究了这2种VI任务诱发的EEG在微状态时间参数上的差异，并选用差异显著的微状态时间参数构建特征向量；最后采用SVM对2类VI任务进行识别。结果显示提取微状态特征所取得的最高、最低和平均分类精度分别为90%,56%和80.6±2.58%。表明微状态方法可以有效提取VI相关EEG特征并得到具有可比性的分类精度，可望为构建相对较新的在线VI-BCI提供思路。

基于卷积神经网络的霉变烟叶图像识别方法研究

李亚召, 云利军, 叶志霞, 王坤, 翟乃琦

2021, 43(03): 473-479. doi:

摘要 ( 332 )

PDF (597KB) ( 470 ) 　　

针对人工在线精选霉变烟叶时,存在效率低下、容易漏检等缺点，提出了一种基于卷积神经网络模型对霉变烟叶图像进行筛选、分类识别的方法。首先建立烟叶数据集，然后搭建卷积神经网络模型，利用卷积神经网络先初步提取特征，再筛选提取主要特征,然后进行各部分的特征汇总；最后实现图像的分类，从而实现了快速、准确的识别霉变烟叶图像和正常烟叶图像。实验结果表明，与人工挑选霉变烟叶的方法和烟叶传统图像分类算法相比较，搭建的卷积神经网络不仅具有较高的识别准确率，也简化了人工提取图像特征的复杂过程。

基于双线程LSTM在线更新的视频追踪算法

曾上游, 贾小硕, 李文惠

2021, 43(03): 480-485. doi:

摘要 ( 183 )

PDF (1199KB) ( 249 ) 　　

针对视频追踪中基于孪生网络的追踪算法在对有遮挡物或运动突变的物体进行追踪定位时会出现定位不准确的问题，设计了在线更新网络的视频追踪算法TripLT。该算法采用循环神经网络进行目标位置的预测，并采用全卷积神经网络对目标进行相似度的判定。TripLT算法可预测下一帧的目标位置，以摆脱遮挡物的影响，并且TripLT算法采用在线更新的机制，避免了运动突变的干扰。在数据集VOT和OTB100上的实验结果表明，和已有算法相比，TripLT算法表现出更好的性能。

基于多特征融合与极限学习机的植物叶片分类方法

火元莲, 李俞利

2021, 43(03): 486-493. doi:

摘要 ( 181 )

PDF (748KB) ( 289 ) 　　

对植物的分类多通过对植物叶片的分类来实现，为提高植物叶片分类的准确率提出了一种基于多特征融合与极限学习机的植物叶片分类方法。首先对植物叶片彩色图像进行预处理，得到去除叶片颜色与背景的二值图像和灰度图像；然后从二值图像中提取植物叶片的形状特征和不变矩特征，利用灰度图像提取灰度共生矩阵参数作为叶片图像的纹理特征，共得到28维的特征向量，最后采用极限学习机分类策略对特征向量进行训练和测试。在公开的植物叶片数据集Flavia上进行实验，训练分类准确率达到99%以上，测试准确率达到98%以上。实验结果表明，本文方法可以有效提高植物叶片分类的准确率。

无人货架场景下的人体关节点定位算法研究

李梦瑶, 周亚同, 韦创, 李民

2021, 43(03): 494-502. doi:

摘要 ( 171 )

PDF (1250KB) ( 285 ) 　　

在新零售场景下，无人货架上商品种类繁多，易受光照等外界因素干扰，且顾客手持商品时手部或身体会对商品关键信息形成遮挡，使得自然场景中仅采用图像识别算法不能满足无人货架应用需求。针对无人货架实际应用场景的特性，基于深度学习中人体关节点定位算法与图像分类算法对该场景中的手持商品识别提出了解决方案。首先，利用人体关节点定位算法准确定位顾客上身关节点；然后，用图像分类算法识别以手臂相关关节点为中心截取的包含商品主要特征的图像。为了提升算法的实用性，对卷积姿态机CPM从关节点定位的速度与精度2个方面进行改进，设计了L-CPM和EP-L-CPM算法，并采用公开数据集和实际无人货架场景人体姿态数据集验证算法性能。实验结果表明，所提出的算法能够准确、高效地定位人体关节点。

基于广义变参Fibonacci混沌系统的压缩感知测量矩阵构造算法

郭媛, 王充, 杜松英

2021, 43(03): 503-510. doi:

摘要 ( 164 )

PDF (2512KB) ( 305 ) 　　

针对常见混沌映射随机性不高、序列元素相关性较强、构造测量矩阵元素需间隔采样来满足数据统计的独立性等问题，通过级联量子Logistic混沌系统和广义Fibonacci数列构造一种新的复合混沌系统。在信息熵、空间特性和相关系数等方面对不同混沌测量矩阵进行定量分析，验证了提出的混沌系统具有遍历性和很强的混沌特性要求，序列元素具有较低相关性，满足数据统计的独立性要求。证明了提出的混沌系统构造的压缩感知测量矩阵满足RIP条件。实验分别对一维稀疏信号和二维图像进行仿真和讨论，结果表明，相较于其他测量矩阵采样率在1/2时，基于所提系统的压缩感知矩阵构造算法的一维稀疏信号重构成功率提高了4%，二维图像重构的信噪比提高了0.2 dB。测量矩阵的构造无需对采样间隔进行提前估计，提高了数据利用率，解决了其他混沌测量矩阵间隔采样造成的极大数据资源浪费的问题。

基于用户长短期兴趣与知识图卷积网络的推荐

顾军华, 佘士耀, 樊帅, 张素琪

2021, 43(03): 511-517. doi:

摘要 ( 297 )

PDF (552KB) ( 299 ) 　　

基于知识图谱的推荐可以提高推荐的精确性、多样性和可解释性。结合知识图谱与用户长短期兴趣提出了基于用户长短期兴趣与知识图卷积网络的推荐模型（LSKGCN）。在知识图谱推荐算法的基础上提出了将用户长期兴趣偏好与短期兴趣偏好结合的用户表示方法。根据时间筛选近期历史项目并通过知识图卷积网络得到历史项目的向量表示，通过注意力机制得到短期兴趣表示。根据与所有历史项目的最小欧氏距离得到长期兴趣表示。最后在真实数据集MovieLens-20、Amazon Music、 Last.FM上进行测试，验证了该算法的有效性。

基于隐马尔可夫模型的多真值发现算法

王会举, 李孟萱, 黄卫卫, 周秋怡

2021, 43(03): 518-524. doi:

摘要 ( 241 )

PDF (536KB) ( 323 ) 　　

数据量的增长加大了信息获取的难度，如何从大量数据中准确获得有效信息是当前的研究热点。借鉴隐马尔可夫模型的状态转移概率，构建了基于图模型的多真值发现算法GraphTD，借助各数据源中描述的可信度转移矩阵，计算出数据值为真的概率的收敛值。同时，提出改进的初始真值的确定算法CVote，可有效提高GraphTD的正确率，避免了投票法在多真值发现中存在的诸多不足。在书籍作者数据集上的实验结果表明，基于图模型的GraphTD真值发现算法能够提高真值识别的准确率，CVote算法通过对初始真值选择的改良，可以有效提高真值发现算法的正确率。

代价敏感的KPCA-Stacking不均衡数据分类算法

曹婷婷, 张忠林

2021, 43(03): 525-533. doi:

摘要 ( 200 )

PDF (699KB) ( 256 ) 　　

代价敏感学习是解决不均衡数据分类问题的一个重要策略，数据特征的非线性也给分类带来一定困难，针对此问题，结合代价敏感学习思想与核主成分分析KPCA提出一种代价敏感的Stacking集成算法KPCA-Stacking。首先对原始数据集采用自适应综合采样方法(ADASYN)进行过采样并进行KPCA降维处理；其次将KNN、LDA、SVM、RF按照贝叶斯风险最小化原理转化为代价敏感算法作为Stacking集成学习框架的初级学习器，逻辑回归作为元学习器。在5个公共数据集上对比J48决策树等10种算法，结果表明代价敏感的KPCA-Stacking算法在少数类识别率上有一定提升，比单个模型的整体分类性能更优。

基于模糊逻辑NSGA-Ⅲ的开关磁阻发电机多目标优化算法

李艺辉, 刘作军, 李洁

2021, 43(03): 542-550. doi:

摘要 ( 250 )

PDF (705KB) ( 255 ) 　　

为了减小开关磁阻发电机SRG转矩脉动,提高发电机系统运行效率及发电机功率密度，提出一种基于模糊逻辑NSGA-Ⅲ的开关磁阻发电机多目标优化算法。搭建1 kW四相8/6极SRG多目标优化设计模型；采用响应面法RSM搭建SRG优化目标的响应面模型；基于模糊逻辑搭建了模糊推理系统，完成了在SRG优化过程中对NSGA-Ⅲ算法内种群个体相对强度值的赋值，在SRG多目标优化过程中引入决策者的偏好信息，生成满足决策者偏好的Pareto最优解集。通过与NSGA-Ⅲ的对比实验验证了考虑决策者偏好的模糊逻辑NSGA-Ⅲ的优越性，对比SRG优化前后的运行性能，验证了所提SRG多目标优化算法的有效性。

基于枢轴语言的汉越神经机器翻译伪平行语料生成

贾承勋, 赖华, 余正涛, 文永华, 于志强,

2021, 43(03): 542-550. doi:

摘要 ( 1 )

PDF (1184KB) ( 24 ) 　　

低资源型的汉越神经机器翻译中，数据稀疏问题是影响翻译性能的主要原因，目前缓解该问题的途径之一是通过语料扩充方法生成伪平行数据，并用于机器翻译模型的训练，伪平行数据生成方法主要有基于词的替换、单语数据回译和枢轴翻译3种。目前的研究集中于3种方法的单独使用，缺少方法间融合利用方面的研究工作，针对此问题，提出了融入双语词典的正反向枢轴方法，利用英语作为枢轴语言，在汉到英到越正向枢轴的基础上，融入利用稀有词构建的汉-英和英-越双语词典，将汉语单语数据通过模型翻译成英语数据，再利用英-越模型将其翻译成越南语数据，其次进行越到英到汉反向枢轴翻译将越南语单语数据翻译为汉语，以此在2个方向上生成汉越伪平行数据，并利用语言模型对生成的伪平行数据进行筛选。汉-越翻译任务上的实验结果表明，提出的融入双语词典的正反向枢轴方法，能够产生更优的伪平行语料，进而显著提升汉越神经机器翻译任务的性能。

开源软件社区知识协作网络核心开发者识别

卢冬冬, 吴洁, 刘鹏, 盛永祥

2021, 43(03): 551-559. doi:

摘要 ( 180 )

PDF (862KB) ( 262 ) 　　

开源软件社区中开发者是流动的，有效识别出核心开发者并对其采取保护措施能够更好地促进社区集体智慧涌现。以开源软件项目AngularJS为例，通过获取开发者在GitHub上的提交记录，抽取开发者协作关系构建知识协作网络，运用社会网络分析的方法，在原有度中心性和介数中心性指标的基础上，将开发者节点的社团结构考虑进来提出新的评价指标。采用TOPSIS多属性决策方法进行核心开发者识别。仿真模拟核心开发者的流失，探究识别效果。研究发现：考虑社团结构的指标和以往指标识别出的核心开发者具有较大的相似性，和真实名单对比均具有一定的准确性，但在重要性排序上考虑社团结构的指标体系识别效果更显著。

基于蒙古语新闻领域本体的分布式检索方法

赵俊生, 王鑫宇, 尹玉洁, 张林

2021, 43(03): 560-570. doi:

摘要 ( 157 )

PDF (2403KB) ( 326 ) 　　

目前蒙古语语义Web方面的研究成果都是基于单机环境的，当语义Web信息检索系统投入实际运行时，单机环境存在存储容量有限和多用户并发查询速度慢等问题。针对此问题，提出了基于蒙古语新闻领域本体的分布式语义Web检索方法。首先依据蒙古语新闻领域的特点，参照七步法和骨架法，构建蒙古语新闻领域本体，研究适合本体的混合语义相似度算法进行语义扩展。然后将本体数据与算法部署于Hadoop分布式平台，解决了大规模本体数据存储的逻辑描述、物理结构和并行处理问题，实现了基于蒙古语新闻领域本体的分布式检索系统。实验结果表明，该方法有效地减少了查询关键词的响应时间，提高了新闻检索的查全率和查准率。

当期目录

作者中心

审稿中心

在线期刊