Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    2021年第12期目录
    2021, 43(12): 0-0. doi:
    摘要 ( 97 )   PDF (333KB) ( 164 )     
    高性能计算
    2021年中国高性能计算机发展现状分析
    袁国兴, 张云泉, 袁良
    2021, 43(12): 2091-2097. doi:
    摘要 ( 346 )   PDF (976KB) ( 369 )     
    根据2021年11月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域和部署机构等方面进行了讨论分析,同时对未来发展进行了展望。

    面向敏捷硬件设计的符号模拟器设计与实现
    邹鸿基, 李暾, 罗丹, 方雨德
    2021, 43(12): 2098-2104. doi:
    摘要 ( 120 )   PDF (485KB) ( 173 )     
    敏捷硬件设计方法中,RTL建模常使用自定义的描述语言,并将设计转换为某种中间格式,为设计验证带来了新挑战。符号模拟技术是(限界)模型检验、等价性检查和测试生成等验证技术的基础,为构建敏捷硬件设计方法验证技术基础,针对PyRTL语言及其中间格式,设计并实现了一个符号模拟器。介绍了符号模拟器的设计原理、转换规则等关键技术。实验结果表明了所实现的符号模拟器的正确性。

    OpenCL计算软件栈评估
    朱浩, 周博洋, 卢雪山, 杜溢墨
    2021, 43(12): 2105-2114. doi:
    摘要 ( 246 )   PDF (1442KB) ( 225 )     
    随着智能计算和大数据应用的发展,人们对GPU等加速部件的需求不断增长。计算软件栈比如CUDA、OpenCL软件栈是能充分发挥GPU硬件性能的关键。考虑计算软件栈未来在国产基础软硬件平台(比如飞腾CPU和麒麟操作系统)上的可移植性和适配性,重点研究OpenCL开源计算软件栈。测试分析OpenCL应用在不同平台上的表现,评估应用在不同OpenCL软件栈上
    (比如Mesa、ROCm等)进行GPU计算的表现,评估软件栈中驱动、内核等对GPU计算的影响,并且整个测试涵盖了编译、数据传输和内核执行等OpenCL计算各个阶段的时间开销。经过测试评估发现,国产平台更迫切也更适合使用GPU进行加速计算,ROCm是比较理想的OpenCL开源软件栈,有较好的性能和稳定性,并且与闭源软件栈相比存在一定的优化空间。

    基于机器学习的海洋中尺度涡检测识别研究综述
    张家灏, 邓科峰, 聂腾飞, 任开军, 宋君强
    2021, 43(12): 2115-2125. doi:
    摘要 ( 424 )   PDF (758KB) ( 524 )     
    海洋中尺度涡是一种重要的海洋中尺度现象,在海洋环流、物质能量传输中发挥重要作用,对舰船航行安全、水声通信等也具有重要的影响。高效准确地检测识别出海洋中尺度涡无论对于物理海洋认知还是海洋开发利用都有着重要的研究价值。传统涡旋检测识别方法依赖专家经验设计的单一阈值,具有显著的主观性。随着深度学习的兴起,机器学习方法在涡旋检测识别的准确性和自动化程度上表现出一定的优势。通过总结与对比分析现有基于机器学习的检测识别方法,为发展海洋中尺度涡检测识别的研究提供系统认知和参考依据。

    基于不完全算法的并行FPGA SAT求解器
    黎铁军, 马柯帆, 张建民
    2021, 43(12): 2126-2130. doi:
    摘要 ( 193 )   PDF (561KB) ( 209 )     
    可满足性问题是计算机理论与应用的核心问题。在FPGA上提出了一个基于不完全算法的并行求解器pprobSAT+。使用多线程的策略来减少相关组件的等待时间,提高了求解器效率。此外,不同线程采用共用地址和子句信息的数据存储结构,以减少片上存储器的资源开销。当所有数据均存储在FPGA的片上存储器时,pprobSAT+求解器可以达到最佳性能。实验结果表明,相比于单线程的求解器,所提出的pprobSAT+求解器可获得超过2倍的加速比。
    关于矩阵乘法问题的人工蜂群优化算法研究
    庄鹤林, 杨火根, 夏小云, 廖伟志
    2021, 43(12): 2131-2138. doi:
    摘要 ( 144 )   PDF (567KB) ( 173 )     
    矩阵乘法运算作为计算机科学和数学的一个基本运算,在科学研究和工程计算中有着广泛的应用。确定2个矩阵乘积所需要的最小乘法数是当今计算机代数中一直未能求解的重要问题之一。通过将矩阵乘法问题建模为一个组合优化问题,采用人工蜂群启发式搜索算法进行矩阵乘法问题求解。对人工蜂群算法进行了改进,给出一种绕圈遍历方法,避免了对同一个解的相同邻域的重复搜索。通过在2×2矩阵乘法问题上的数值实验验证了算法的有效性,所提算法能够快速地找到2×2矩阵分解的乘积方法。


    YOLOv3-tiny的硬件加速设计及FPGA实现
    陈浩敏, 姚森敬, 席禹, 张凡, 辛文成, 王龙海, 任超
    2021, 43(12): 2139-2149. doi:
    摘要 ( 508 )   PDF (1275KB) ( 397 )     
    YOLOv3-tiny具有优秀的目标检测能力,但模型所需的计算力依然较大,难以实现面向嵌入式领域的应用。提出一种YOLOv3-tiny的硬件加速方法,并在FPGA平台上实现。首先,针对网络定点化设计,以数据精度与资源消耗为设计指标,通过对模型中数据分布的统计以及数据类型的划分,提出了不同的定点化策略。其次,针对网络并行化设计,通过对卷积神经网络计算特性的分析,使用循环调整、循环分块、循环展开和数组分割等方法,设计了可扩展的常用硬件计算单元架构。然后,针对网络流水化设计,从层间与层内2个方面进行研究,以层间数据流方向和层内任务划分为基础,设计了一种灵活的流水化计算架构。最后,在XILINX XC7Z020CLG400-1平台上进行实验,结果表明,相较于667 MHz的单核ARM-A9处理器,加速比高达290.56。

    计算机网络与信息安全
    基于无线能量采集的多跳网络安全传输中的路径选择
    火元莲, 徐晓鹏, 郑海亮
    2021, 43(12): 2150-2156. doi:
    摘要 ( 91 )   PDF (839KB) ( 165 )     
    针对具有无线能量采集技术的多跳传输网络,提出了全双工中继网络在有多个窃听者和多个功率节点场景下进行多跳多路径传输时的路径选择问题。首先,所提系统模型在有多个窃听者和功率节点的场景下进行信息传输,将源发射端和接收端之间的最佳路径作为数据传输路径。然后,为了增强系统性能,中继节点对功率节点发出的射频信号进行能量采集并利用所获能量来进行下一跳的数据传输。最后,推导出了所提路径选择方法在瑞利衰落信道下端到端中断概率的精确表达式,蒙特卡洛仿真和理论分析曲线拟合较好,说明了理论推导的正确性,以及所提方法具有性能上的优越性。

    区块链环境下电商消费者网络多子群混合增长模型构建及特性研究
    燕云鸿, 钱晓东
    2021, 43(12): 2157-2168. doi:
    摘要 ( 89 )   PDF (1381KB) ( 189 )     
    为探究区块链环境下电商消费者行为的复杂网络特性,在对传统局域网络与BBV增长网络研究的基础上,针对区块链环境下电子商务消费者行为的特性,提出2个方面的创新优化:
    (1)建立基于声誉的有限信任共识机制;
    (2)构建基于去中心化特性的消费者社团交互选择的智能合约。将共识机制与智能合约融入多子群混合增长模型中,研究在特定参数下,区块链电商消费者网络在复杂网络结构方面的特性。实证研究表明:即使是在具有去中心化、去信任的区块链电子商务环境下,消费者网络依旧会呈现出节点幂律分布的特点和小世界特性。在多子群混合增长模型中,消费者社团划分明显,消费者之间会出现“富者愈富”的马太效应,但是与传统网络电子商务消费者网络相比,其社团结构则更为松散,具有反垄断的特性。实验表明,在该环境下消费者的消费行为更加自由与透明。

    基于多粒度语义分析的二进制漏洞搜索方法
    刘豪, 马慧芳, 龚楠, 闫彩瑞
    2021, 43(12): 2169-2176. doi:
    摘要 ( 126 )   PDF (708KB) ( 183 )     
    二进制文件相似度检测旨在通过比较来自不同平台、编译器、优化配置甚至是不同软件版本的2个二进制文件的相似程度来判断二者是否高度相似,其中二进制漏洞搜索为其在信息安全领域的应用之一。二进制漏洞的产生为现代软件应用带来了诸多问题,如操作系统易受攻击、隐私信息易被窃取等。二进制漏洞产生的主要原因是软件开发过程中进行了代码复用却没有进行严格的监管。据此,提出了一种基于多粒度语义特征分析的二进制漏洞搜索方法Taurus,该方法通过3种粒度的语义特征来搜索跨平台的潜在二进制漏洞。给定待检测二进制文件和漏洞数据库,需要对其与漏洞数据库中的每个二进制漏洞进行逐一搜索。首先,分别对2个二进制文件进行语义提取,以获取二者在基本块、函数和模块3个粒度下的语义特征,并执行相似度计算;然后,整合3种粒度下语义特征的相似度,以计算3种文件的整体相似度得分;最后,将待检测二进制文件与漏洞数据库中所有漏洞的相似度得分结果进行降序排序,便获得了该二进制文件的搜索结果报告。经过合理配置下的实验对比,结果表明,
    Taurus方法在准确性方面要优于基线方法。


    LoRa数据传输网络混合加密设计
    张治, 魏嘉鑫, 王林
    2021, 43(12): 2177-2182. doi:
    摘要 ( 119 )   PDF (466KB) ( 191 )     
    随着LoRa网络应用深度与广度的增加,关于信息安全的需求逐渐变大,所以确保数据传输网络的安全性是LoRa网络发展与应用的必要条件。传统LoRa网络在数据传输过程中自身具有加密机制,其使用AES-128加密算法对数据报文进行加密。但是,在加/解密过程中,2个密钥是相对称的,以至于各项参数大致相同,当一对密钥中任何一个密钥泄露时,都很容易计算出另外一个密钥。针对存在的安全问题,提出一种改进的混合加密方案:在LoRa网络的基础上引进RSA非对称加密算法,利用RSA加密算法安全性高的优势对AES加密算法加/解密数据过程中所用到的密钥进行加密处理,降低LoRa网络数据传输过程中的安全隐患,提高安全性;并在此基础上对AES和RSA加密算法优化改进,以确保数据传输的效率。最后,对本文设计的方案进行测试,测试结果表明,本文方案在保证数据传输效率的同时增强了密钥的防窃取性,很大程度上提高了LoRa网络数据传输的安全性。

    基于时空协作的多移动充电器充电路径规划的研究
    尹玲, 谢志军
    2021, 43(12): 2183-2189. doi:
    摘要 ( 104 )   PDF (840KB) ( 163 )     
    为解决大型无线可充电传感器网络中节点的实时充电问题,对具有多个移动充电器的网络进行了研究。在将网络公平划分为多个簇的基础上提出一种基于时空协作的多移动充电器实时充电算法STMA:通过联合考虑节点的空间位置和截止充电时间要求规划移动充电器的充电路径,在充电过程中及时获取最新的充电请求,并按照充电请求的紧急程度及时调整充电路径。仿真结果表明,采用STMA算法比单纯考虑时空要求的算法的能量利用率提高约14%,节点存活率提高约9%,更加适应节点的实时充电需求。

    图形与图像
    基于深度学习的草图检索方法研究进展
    姬子恒, 王斌
    2021, 43(12): 2190-2205. doi:
    摘要 ( 362 )   PDF (1413KB) ( 444 )     
    草图检索(SBIR)是基于内容的图像检索(CBIR)的扩展,是一种灵活便捷的目标图像检索方式,其研究的焦点是如何减少手绘草图域与自然图像域之间的域差。传统方法提取手工特征完成草图域与图像域之间的近似转换以减少域差,但该类方法无法有效拟合2个域内容,导致检索精度不高。深度学习方法依赖大量数据进行图像高维特征的提取,突破了传统方法的局限,已被证明可以有效解决跨域建模问题。研究聚焦于基于深度学习的草图检索方法,在深度特征提取模型、公开的数据测试集、粗粒度和细粒度检索、哈希技术和类别泛化等几个方面对草图检索的深度学习方法的相关研究工作进行了综述和评论。然后进行了实验比较研究,一方面,对现有3个公开的SBIR测试集Sketchy、TU-Berlin和QuickDraw进行适用性评估;另一方面,选取3个最新的SBIR深度学习模型GRLZS模型、SEM-PCYC模型和SAKE模型进行性能分析与比较。最后,对草图检索面临的挑战和未来研究方向进行了总结与展望。

    基于深度学习的人体行为检测方法研究综述
    陆卫忠, 宋正伟, 吴宏杰, 曹燕, 丁漪杰, , 张郁
    2021, 43(12): 2206-2215. doi:
    摘要 ( 300 )   PDF (825KB) ( 378 )     
    行为检测是视频理解与计算机视觉领域炙手可热的研究内容,备受国内外学者的关注,在智能监控、人机交互等多领域被广泛应用。随着科技的进步,深度学习在图像分类领域取得了重大突破,将基于深度学习的识别方法应用于人体行为检测研究已成为行为检测中的热点。基于此,首先对几种常用于行为检测的数据集,及近几年深度学习在行为检测领域的研究现状进行了介绍;接着分析了行为检测方法的基本流程,以及几种常用的基于深度学习的检测方法;最后,从方法性能优劣、应用前景等方面对人体行为检测方法的尚存问题与未来发展趋势进行了分析和展望。


    一种结合自注意和多尺度生成对抗网络的图像去雨方法
    李然, 周子淏, 张月芳, 罗东升, 邓红霞
    2021, 43(12): 2216-2222. doi:
    摘要 ( 127 )   PDF (1031KB) ( 363 )     
    为去除雨天拍摄照片上的雨滴,针对被雨滴所覆盖区域未知,雨滴区域中大多数背景信息已经丢失,以及需要提升图像清晰度和对全局信息关注度的问题,在生成对抗网络中生成网络的自动编码器结构中添加自注意层,并在判别网络中引入多尺度判别器。通过注意力分布图的引导,自注意层的优化和多尺度判别器的评估,生成网络在关注雨滴区域的前提下进一步关注全局信息,多尺度判别器可由粗到细更好地判别雨滴图像与清晰图像之间的差距。实验完成了所提方法与其他方法的对比,以及自对比,并用峰值信噪比和结构相似性进行评估,结果表明了所提方法的有效性,其质量和指标数值均高于其他方法。

    人工智能与数据挖掘
    基于深度残差网络的光伏故障诊断模型研究
    谢祥颖, 刘虎, 王栋, 冷彪
    2021, 43(12): 2223-2230. doi:
    摘要 ( 162 )   PDF (911KB) ( 330 )     
    分布式光伏电站的部署环境较为复杂,在实际运行中难免会产生多种故障。针对上述问题,提出了一种基于深度残差网络结构的分布式光伏电站故障诊断模型,对光伏电站的设备运行时序数据进行分析处理,实现对故障类别的快速准确判断。该模型使用一维卷积核感知时序数据特征,通过多级卷积结构提升模型的诊断能力,并采用残差结构解决模型深度增加造成的梯度消失问题,加速了深度模型的训练。光伏电站的测试数据实验结果表明,提出的模型相较于多种常见的智能模型具有较高的故障诊断准确度。该模型的推广使用不仅可以大幅减少光伏电站故障巡检投入,而且还能够提高光伏电站故障诊断效率。

    多源覆盖信息系统下的加权广义多粒度粗糙集模型及其应用
    骆公志, 陈佳馨
    2021, 43(12): 2231-2237. doi:
    摘要 ( 90 )   PDF (403KB) ( 155 )     
    考虑到多源覆盖信息系统中数据的复杂性以及单个信息系统之间的不平等性,引入诱导覆盖粗糙集,并对信息系统的属性赋予权重值,提出了多源覆盖信息系统下的加权广义多粒度粗糙集MCS-WGMRS模型。定义了属性权重的计算方法,给出模型的上、下近似,并获取了相应的决策规则。通过实例分析验证了MCS-WGMRS模型的有效性,结果表明该模型对目标集的分类能力更强,适当调整阈值可进一步提高模型的容错性。

    基于Siamese循环神经网络的泰文句子切分方法
    线岩团, 张志菊, 王红斌, 文永华,
    2021, 43(12): 2238-2242. doi:
    摘要 ( 107 )   PDF (416KB) ( 168 )     
    泰文很少运用标点符号,句子间没有明显的分隔符,需要根据语义进行断句,为泰文词法分析、句法分析和机器翻译等自然语言处理任务带来了额外的困难。针对泰文断句问题提出一种基于Siamese循环神经网络的句子自动切分方法。相比传统泰文断句方法,该方法无需人工定义特征,而是采用统一的循环神经网络分别对候选断句点前后的词序列进行编码;然后,通过综合前后词序列的编码向量作为特征来构建泰文句子切分模型。在ORCHID泰文语料上的实验结果表明,所提出的方法优于传统泰文句子切分方法。

    基于局部中心度量的边界点划分密度聚类算法
    张梅, 陈梅, 李明
    2021, 43(12): 2243-2252. doi:
    摘要 ( 120 )   PDF (2815KB) ( 183 )     
    针对聚类算法在检测任意簇时精确度不高、迭代次数多及效果不佳等缺点,提出了基于局部中心度量的边界点划分密度聚类算法——DBLCM。在局部中心度量的限制下,数据点被划分到核心区域或边界区域。核心区域的点按照互近邻优先成簇的分配方式形成初始簇,边界区域的点参考互近邻中距离最近点所在簇进行分配,从而得到最终簇。为验证算法的有效性,将DBLCM与3个经典算法和3个近几年新提出的优秀算法,在包含任意形状、任意密度的二维数据集和任意维度的多维数据集上进行测试。另外,为了验证DBLCM算法中参数k的敏感性,在所用的数据集上做了k值与簇质量的相关性测试。实验结果表明,DBLCM算法具有识别精度高,检测任意簇效果好和无需迭代等优点,综合性能优于6个对比算法。

    基于改进蚁群算法的四足机器人步态规划
    胡平志, 李泽滔
    2021, 43(12): 2253-2262. doi:
    摘要 ( 115 )   PDF (1166KB) ( 177 )     
    四足机器人关节众多、运动方式复杂,步态规划是四足机器人运动控制的基础。传统的算法多基于仿生原理,缺乏广泛适应性。
    在建立运动学方程的基础上,提出了一种基于改进蚁群算法的步态规划算法。该算法利用了四足机器人4条腿运动的线性无关性,将步态规划问题转换为在四维空间里求取最长路径问题。仿真结果表明,该算法得出了满足约束条件的所有步态,最后通过机器人样机检验,验证了该算法求取结果的有效性和合理性。

    一种改进的KNN案例推理检索算法
    孙宝贵, 车文刚, 廖江福,
    2021, 43(12): 2263-2271. doi:
    摘要 ( 174 )   PDF (1054KB) ( 224 )     
    案例推理作为人工智能领域中通过已知知识解决问题的方法,其核心之一是检索算法。为了改善案例推理检索算法的预测结果质量,提出一种改进的KNN案例推理检索算法。首先,利用遗传模拟退火-模糊C均值聚类算法对案例库聚类,形成多个类簇;其次,通过改进的粒子群优化混合算法优化各类簇近邻K值;然后提出最优原则检索策略,确定检索子案例库及近邻K值;最后使用Mackey-Glass混沌时间序列数据进行仿真预测。实验结果表明,相较于传统KNN案例推理检索算法,改进的KNN案例推理检索算法预测结果的精度显著提高。


    基于蚁群遗传混合算法改进的连接查询研究
    张逸风, 佟国香, 刘军, 屈亚宁
    2021, 43(12): 2272-2280. doi:
    摘要 ( 130 )   PDF (724KB) ( 167 )     
    连接查询优化技术对提升数据库性能至关重要,提出一种改进的连接查询算法,结合Wander Join连接查询算法,使用蚁群遗传混合算法对连接顺序进行优化。执行新的连接计划后,用剪枝策略降低样本的连接复杂度,达到了减少存储代价的目的。
    理论分析和基于TPC-H数据集、TPC-DS数据集的算法对比实验表明,在多表连接的样本置信区间大于或等于95%的条件下,根据选择率的不同,加入蚁群遗传混合算法和剪枝策略的连接查询算法的相对错误率与Wander Join连接查询算法相比下降了20%~70%。