Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2020年第9期目录
    2020, 42(09): 0-0. doi:
    摘要 ( 162 )   PDF (287KB) ( 218 )     
    高性能计算
    一种高效的压缩Page Walk Cache结构
    贾朝阳, 张敦博, 王琼, 沈立
    2020, 42(09): 1521-1528. doi:
    摘要 ( 254 )   PDF (606KB) ( 220 )     
    通用图形处理单元(GPGPU)已被广泛应用于现代高性能计算系统中。GPGPU的单指令多线程执行模型导致快表命中率较低,特别是对于那些不规则应用,需要借助PWC减少实际的页表访问次数。传统PWC中存在很多冗余信息,加之容量有限,实际效果并不理想。分析了传统PWC中的信息冗余情况,提出了一种新结构——压缩PWC。压缩PWC在保证查找开销不变的基础上,完全消除了冗余信息,压缩了空间,使PWC能够记录更多的页表访问历史,从而有效减少地址转换过程中访问页表的次数。测试结果表明,与相同容量的传统PWC相比,压缩PWC可以显著缩短虚实地址转换时间开销。

    面向模型并行训练的模型拆分策略自动生成方法
    王丽, 郭振华, 曹芳, 高开, 赵雅倩, 赵坤
    2020, 42(09): 1529-1537. doi:
    摘要 ( 298 )   PDF (804KB) ( 185 )     
    随着训练数据规模的增大以及训练模型的日趋复杂,深度神经网络的训练成本越来越高,对计算平台提出了更高的算力需求,模型训练并行化成为增强其应用时效性的迫切需求。近年来基于分布式训练的AI加速器(如FPGA、TPU、AI芯片等)层出不穷,为深度神经网络并行训练提供了硬件基础。为了充分利用各种硬件资源,研究人员需要在集合了多种不同算力、不同硬件架构AI加速器的计算平台上进行神经网络的模型并行训练,因此,如何高效利用各种AI加速器计算资源,并实现训练任务在多种加速器上的负载均衡,一直是研究人员关心的热点问题。提出了一种面向模型并行训练的模型拆分策略自动生成方法,该方法能够基于静态的网络模型自动生成模型拆分策略,实现网络层在不同AI加速器上的任务分配。基于该方法自动生成的模型分配策略,能够高效利用单个计算平台上的所有计算资源,并保证模型训练任务在各设备之间的负载均衡,与目前使用的人工拆分策略相比,具有更高的时效性,节省拆分策略生成时间100倍以上,且降低了由于人为因素带来的不确定性。

    一种面向SoC的能量迹预处理方法
    蔡晓敏, 李仁发, 李少青, 沈高, 邝世杰
    2020, 42(09): 1538-1543. doi:
    摘要 ( 202 )   PDF (812KB) ( 163 )     
    差分功耗攻击技术是恢复密码设备密钥最有效的攻击手段之一,但在攻击过程中,如果使用不合适的采样点,将引入额外噪声,会降低攻击成功率。为此,提出了一种基于能量模型的能量迹分类方法,旨在定位能量迹中与密钥具有较强相关性的特征点。分别利用汉明距离和汉明重量2种能量模型定位特征点,截取特征点附近少量采样点构成特征区间。攻击不同密钥下载有128位AES算法的SoC芯片,实测结果表明:利用汉明距离能量模型得到的最佳特征区间的长度较短。最终,基于汉明距离能量模型得到的特征点定位方法具有较低的样本计算量,且缩减了大量的样本量。

    移动系统的实时调度与可调度性分析
    陈聪, 洪中, 陈杨杨, 张仕, 蒋建民,
    2020, 42(09): 1544-1555. doi:
    摘要 ( 130 )   PDF (772KB) ( 130 )     
    对于一个复杂的实时移动系统,为了确保其在运行过程中的安全性,需要通过形式化方法对其行为进行建模和分析。其中,判断各个移动对象在正常运行时是否互相碰撞是验证实时移动系统安全性的一个重要指标。为此,有必要对各个移动对象进行隔离分析,而隔离分析离不开调度理论的支持。然而,传统的调度理论是基于粗粒度的任务调度,不能直接用于细粒度的隔离分析。为了解决这一问题,可通过时间依赖结构TDS模型来建模移动系统。该模型是基于事件的更细粒度的形式化模型,通过在时间依赖结构的基础上定义实时调度的方法,进而讨论实时调度的性质并进行隔离的可调度性分析,能够判断系统在运行过程中的安全性。
    计算机网络与信息安全
    基于RLWE的双因子三方认证密钥交换协议
    申艳梅, 李亚平, 王岩, 王辉, 黄鹂娟
    2020, 42(09): 1556-1562. doi:
    摘要 ( 139 )   PDF (1539KB) ( 147 )     
    为了使格上Diffie-Hellman式密钥交换协议能够实现认证性并且适用于客户-服务器-客户模式的大规模通信,提出了一个基于环上误差学习RLWE的双因子三方认证密钥交换协议。该协议将口令和生物特征作为客户的长期密钥,实现服务器对客户的显式身份认证。首先利用环上误差学习的困难问题的优势(密钥及密文尺寸短、运行效率高)来构造密码体制;其次服务器通过口令和生物特征的哈希值传递环元素,并结合丁式错误协调机制使得通信方获得随机均匀的会话密钥。最后分析表明,该协议适用于大规模通信,提高了通信量,具有更高的安全属性,可以抵抗口令泄露用户假冒攻击。

    国家电网边缘计算应用安全风险评估研究
    郭昊, 何小芸, 孙学洁, 陈红松, 刘周斌, 颉靖
    2020, 42(09): 1563-1571. doi:
    摘要 ( 191 )   PDF (952KB) ( 162 )     
    依据国家网络安全等级保护与风险评估系列标准以及电力信息系统特点,提出国家电网边缘计算应用安全的风险评估模型,然后采用漏洞扫描工具AWVS、AppScan分别对集成最新安全漏洞的开源Web应用靶机软件BWAPP进行安全漏洞评测与风险评估实验,再运用模糊层次分析法对Web应用安全进行综合安全评价。针对应用程序的安全检测实验结果整理安全评估数据,实现对国家电网边缘计算应用安全风险评估的实例化验证。

    基于奇异向量鲁棒性的水印方法的质量补偿分析
    王文冰, 刘胜利
    2020, 42(09): 1572-1577. doi:
    摘要 ( 120 )   PDF (602KB) ( 125 )     
    对基于奇异向量鲁棒性的水印方法做质量补偿可在一定程度上提升水印的不可视性,质量补偿效果取决于补偿参数。为了优化补偿参数,通过分析水印方法的嵌入原理,找出载体像素值变化与奇异向量变化之间的关系,研究质量补偿前后像素的改变规律,从而给出最优补偿参数值,并分析质量补偿与鲁棒性的关系及影响质量补偿效果的因素。实验部分验证了质量补偿效果,
    通过与同类方法的比较,表明该质量补偿方法可以提升水印方法的性能。



    图形与图像
    基于深度学习与超分辨率重建的遥感高时空融合方法
    张永梅, 滑瑞敏, 马健喆, 胡蕾
    2020, 42(09): 1578-1586. doi:
    摘要 ( 221 )   PDF (1253KB) ( 222 )     
    针对遥感影像的“时空矛盾”,提出一种改进STARFM的遥感高时空融合方法。利用SRCNN对低分辨率影像进行超分辨率重建,由于所融合的2组影像分辨率差距过大,网络训练困难,先将2组影像均采样至某一中间分辨率,使用高分辨率影像作为低分辨率影像的先验知识进行SRCNN重建,再将得到的中间分辨率影像重采样后以原始高分辨率影像作为先验知识进行第2次SRCNN重建,得到的最终重建图像相比原先使用插值法重采样所得图像,在PSNR和SSIM上均有提升,缓解了传感器差异所造成的系统误差。STARFM融合方法在筛选相似像元与计算权重时均使用专家知识提取人工特征,基于STARFM时空融合的基本思想,以SRCNN作为基本框架
    自动提取特征,实验结果表明,其MSE值相比原方法更低,进一步提高了遥感时空融合的质量,有利于充分利用遥感影像。

    融合TLD框架的DSST实时目标跟踪改进算法
    黄浩淼, 张江, 张晶, 保峻嵘
    2020, 42(09): 1587-1598. doi:
    摘要 ( 210 )   PDF (1429KB) ( 178 )     
    针对目标快速运动导致的图像模糊,使DSST算法难以区分目标与背景信息,滤波器在训练阶段循环移位采集密集样本容易产生边界效应,导致跟踪漂移的问题,提出了一种融合TLD框架的DSST实时目标跟踪改进算法(TLD-DSST)。改进DSST算法的位置滤波器,通过空间正则化的方法加入权重系数矩阵,降低非目标区域的响应,对快速运动目标进行粗定位;与此同时,引入朴素贝叶斯分类器改进TLD检测器,提高检测器对目标与背景信息的区分能力,然后将DSST目标响应的位置与TLD检测器得到的目标区域进行最优相似性匹配,得到精确定位的结果。通过TLD检测器正负样本在线更新机制,不断优化算法的鲁棒性。实验结果表明,TLD-DSST算法对于快速运动等复杂情景下的目标跟踪,具有很高的精确度和成功率。

    基于颜色与果径特征的苹果树果实检测与分级
    樊泽泽, 柳倩, 柴洁玮, 杨晓峰, 李海芳
    2020, 42(09): 1599-1607. doi:
    摘要 ( 200 )   PDF (3005KB) ( 275 )     
    苹果是多地的主产水果和主要经济作物之一,通过自然环境下的苹果树图像对苹果检测并分级有助于推进果业现代化。结合深度学习和传统方法,提出融合颜色与果径特征的果实检测与分级算法。为提高果树图像中小目标的检出和光照不匀、果实颜色差异大时检测边框的准确率,基于卷积神经网络提出自然场景下的苹果检测算法,在2组不同尺度的特征图上进行果实检测,提取检测框内图像在CIELAB颜色空间下b*、(1.8b*-L*)颜色分量,将图像二值化并精确提取目标轮廓二次校正检测框。实验结果显示,苹果检测算法的准确率达91.60%,F1-score值达87.62%。据图像内目标大小与实际尺寸的映射方法计算苹果直径,实现果实分级,实验表明分级准确率达90%。

    基于改进SSD模型的工件表面缺陷识别算法
    李兰, 奚舒舒, 张才宝, 马鸿洋
    2020, 42(09): 1608-1615. doi:
    摘要 ( 231 )   PDF (829KB) ( 229 )     
    工件表面缺陷是影响机械设备性能的重要因素,快速高效的检测方法是目前研究的重点。为了解决工件表面缺陷检测问题,提出一种基于改进SSD模型的检测算法。该算法用本文提出的DH-MobileNet网络代替SSD结构中的VGG16网络,从而简化检测模型,减少了运算量。同时采用反向残差结构进行位置预测,并用空洞卷积代替下采样操作以避免信息损失。利用扫描电子显微镜得到工件表面图像,建立工件表面缺陷数据集并进行扩充,最后针对碎屑、剥落和梨沟这3类高频缺陷进行训练和测试,并与YOLO、Faster R-CNN和原始SSD模型进行效果比较。检测结果表明该算法能够更准确、快速地检测工件表面缺陷,为实际工业场景中的缺陷检测提供了新的思路。
    基于自适应阈值投影的双行车牌分割方法
    马永杰, 陈振宇, 马芸婷
    2020, 42(09): 1616-1624. doi:
    摘要 ( 165 )   PDF (1031KB) ( 142 )     
    针对国内双行车牌号分割方法少,且准确率低的问题,提出了一种自适应投影法的双行车牌分割方法。首先利用车牌图像在HSV颜色空间的特性,将图像二值化,然后利用自适应投影法将双行车牌分割为单行车牌,最后分割出车牌号上的字符。实验表明,该方法能够对蓝底白字、白底红字、绿底黑字和黄底黑字的双行车牌进行有效分割,对双行电动自行车车牌号分割的准确率更高;同时,该方法克服了基于深度学习方法的训练时间长、需要大量数据集等问题,是一种简单高效的分割方法。

    人工智能与数据挖掘
    分数阶Rucklidge系统复杂度分析及有限时间同步
    那格思, 赵海燕
    2020, 42(09): 1625-1631. doi:
    摘要 ( 169 )   PDF (740KB) ( 133 )     
    非线性系统作为金融领域的一项复杂课题,其复杂度变化和控制方法一直是专家学者研究的重点和难点。早期的非线性系统研究基于整数阶非线性系统,伴随着分数阶系统的研究越来越深入,人们逐渐意识到分数阶系统的复杂度普遍高于整数阶系统。通过对其复杂特性进行分析研究,有助于定义系统参数,提升系统的复杂度。以分数阶Rucklidge系统为例,研究了其动态复杂特性。针对分数阶非线性系统,设计了同步控制器对其同步控制并进行了仿真。仿真结果表明,运用该控制器能够在较短时间内实现同步。

    基于相似义原和依存句法的政外领域事件抽取方法
    崔莹
    2020, 42(09): 1632-1639. doi:
    摘要 ( 130 )   PDF (973KB) ( 124 )     
    以政外领域新闻数据为研究基础,针对基于传统模式匹配事件抽取存在的提取困难、召回率和准确率低,基于深度学习方法在特定领域事件抽取中抽取准确率不高等问题,提出基于相似义原和依存句法的政外领域事件抽取方法。通过计算义原描述式的相似性,扩展事件触发词表,为精准识别事件类型奠定基础;进一步基于模式的指导,结合文本依存句法分析实现对于政外领域事件元素的识别和抽取,从而达到对事件的结构化描述。抽取结果准确率明显优于基于深度神经网络的端到端事件抽取模型抽取结果,并对其他特定领域事件抽取具有可借鉴性和实施性。最后对事件抽取面临的主要困难和应用前景进行了探讨和总结。

    基于深度编码器的复杂网络社区发现算法
    #br#
    张士进, 张胜, 田纪彪, 吴志强, 戴维凯
    2020, 42(09): 1640-1648. doi:
    摘要 ( 166 )   PDF (1592KB) ( 158 )     
    复杂网络是复杂系统的典型表现形式,社区结构是复杂网络最重要的结构特征之一。针对目前社区发现算法精确度低以及不适合大规模网络的问题,提出一种新的算法DA-EF和用于度量节点之间相似度的影响力扩散指标。DA-EF利用多层自动编码器与森林编码器构成二级级联模型,相似度矩阵进行降维和表征学习处理,转化成低维高阶特征矩阵,最终使用K-means得到准确的社区划分结果。级联结构在保持算法同等深度的情况下,大幅降低了算法时间复杂度。在人工合成数据集和真实数据集上的实验表明,DA-EF与同类算法K-means、DA-EML和CoDDA相比,其标准互信息NMI和模块度Q值高,而且聚类运行时间最少,具有精确度高和效率快的优势。在算法性能实验中,验证了算法的级联结构、自动编码器的深度以及影响力扩散指标的合理性和有效性。



    基于混合混沌磷虾算法的短期水火电调度研究
    肖雄, 高渺, 陈功贵
    2020, 42(09): 1649-1660. doi:
    摘要 ( 162 )   PDF (1585KB) ( 144 )     
    短期水火电调度(STHS)是一个非线性、多约束且时变的优化问题,当将阀点效应引入后该问题变得非凸从而更加复杂。为提高磷虾算法(KHA)在STHS问题中的寻优能力,引入混合混沌映射来改善KHA的全局收敛速度。为避免算法过早收敛,通过记录每代最优个体的燃烧费用值保持不变的次数,决策对非位置占优的个体在其可行域内进行位置突变,从而提出混合混沌磷虾算法(HCKHA),并将提出的HCKHA和KHA、CKHA分别应用于标准的4水3火和4水10火测试系统。仿真结果表明:HCKHA的寻优能力、系统的燃烧费用值和网络损耗值优于KHA、CKHA和相关其他文献的优化方法。

    基于知识图谱嵌入与多神经网络的序列推荐算法
    沈冬东, 汪海涛, 姜瑛, 陈星
    2020, 42(09): 1661-1669. doi:
    摘要 ( 245 )   PDF (728KB) ( 229 )     
    循环神经网络在序列推荐中占有重要地位,但在推荐中,用户的行为序列远比自然语言处理中的句子或计算机视觉中的图像要复杂得多。单一的循环神经网络结构难以充分地挖掘用户偏好,因此提出一种新型的序列推荐算法,同时考虑序列的时间信息以及内容信息。主要分为2个部分:改进的项目嵌入和序列偏好学习。首先,提出一种融合知识图谱的项目嵌入方法,用于生成高质量的项目向量;其次,提出一种卷积神经网络结合长短时记忆神经网络的序列建模方法。更进一步地提出一个基于注意力的框架,动态地结合用户的兴趣点。在公开数据集MovieLens10M上与传统方法以及现有的同类型方法进行了比较。实验结果表明,所提算法在推荐评价指标平均倒数排名MRR@N以及召回率Recall@N上有显著的提升,验证了该算法的有效性。

    基于深层语境词表示与自注意力的生物医学事件抽取
    魏优, 刘茂福, 胡慧君,
    2020, 42(09): 1670-1679. doi:
    摘要 ( 194 )   PDF (669KB) ( 160 )     
    生物医学事件抽取是生物医学文本信息抽取中最重要的、也是最富有挑战性的任务之一,近年来得到了广泛关注。生物医学事件抽取中最重要的2个子任务为触发词识别和事件要素检测。已有的大部分方法将触发词识别作为分类任务,忽略了句子级标签信息。构建基于长短时记忆神经网络与条件随机场的序列标注模型用于触发词识别,分别将组合字符级词表示的静态预训练词向量和基于预训练语言模型的动态语境词表示作为模型输入;同时,针对事件要素检测任务,充分利用实体以及实体类型特征,提出基于自注意力的多分类模型。最终触发词识别F1值为81.65%,整体事件抽取F1值为6004%,实验结果表明提出的方法对于生物医学事件抽取是有效的。

    基于近端策略优化与对抗学习的对话生成
    蔡钺, 游进国, 丁家满
    2020, 42(09): 1680-1689. doi:
    摘要 ( 168 )   PDF (661KB) ( 127 )     
    对话生成是自然语言处理的重点研究方向,对抗生成网络GAN最近在对话生成领域得到了较好的应用。为了进一步改善对话生成的质量,并且解决GAN训练过程中判别模型返回奖励重复利用率低从而导致模型训练效率低的问题,提出一种基于近端策略优化PPO的对话生成算法PPO_GAN。该算法通过GAN模型生成对话,通过判别模型区分生成的对话与真实的对话。并采用近端策略优化的方法训练GAN,能处理GAN在对话生成时导致的反向传播不可微分的情况,在保证生成模型单调非减训练的同时,通过限制生成模型迭代的梯度使判别模型得到的奖励可以重复利用。实验结果表明,对比于极大似然估计与Adver-REGS等对话生成算法,PPO_GAN算法提高了对话训练的效率并且改善了对话生成的质量。
    基于改进粒子群算法的无人机路径规划
    王翼虎, 王思明
    2020, 42(09): 1690-1696. doi:
    摘要 ( 383 )   PDF (642KB) ( 364 )     
    针对传统粒子群算法PSO求解无人机路径规划问题时存在极易陷入局部最优的问题,在PSO算法中引入细菌觅食算法BFO的趋化操作、迁徙操作,以提高其寻优能力。首先根据无人机飞行环境建立三维高程环境模型,并使用路径长度代价、障碍危险代价和航迹高程代价来构造适应度函数;然后在分析了粒子群算法和细菌觅食算法原理及特点的基础上,给出了算法的改进方法及其具体流程。最后,通过Matlab仿真验证表明:混合算法有效改善了粒子群算法的缺陷,在进行无人机路径规划时,相比于传统PSO算法,混合算法寻优精度和稳定性有明显改善。

    基于强化学习的多样性文档排序算法
    官蕊, 丁家满, 贾连印, 游进国, 姜瑛,
    2020, 42(09): 1697-1703. doi:
    摘要 ( 213 )   PDF (478KB) ( 176 )     
    在排序学习方法中,通过直接优化信息检索评价指标来学习排序模型的方法,取得了很好的排序效果,但是其损失函数在利用所有排序位置信息以及融合多样性排序因素方面还有待提高。为此,提出基于强化学习的多样性文档排序算法。首先,将强化学习思想应用于文档排序问题,通过将排序行为建模为马尔可夫决策过程,在每一次迭代过程中利用所有排序位置的信息,不断为每个排序位置选择最优的文档。其次,在排序过程中结合多样性策略,依据相似度阈值,裁剪高度相似的文档,从而保证排序结果的多样性。最后,在公共数据集上的实验结果表明,提出的算法在保证排序准确性的同时,增强了排序结果的多样性。

    引入自编码机制对抗网络的文本生成模型
    韩虎, 孙天岳, 赵启涛
    2020, 42(09): 1704-1710. doi:
    摘要 ( 162 )   PDF (571KB) ( 134 )     
    自编码模型是一种无监督的学习算法,主要用于数据的降维和特征提取。在对抗神经网络模型基础上引入自编码模型,旨在提高输入数据的特征表示。主要使用前馈神经网络和Seq2seq模型学习原文本特征,将随机数据变为具有特征的数据作为输入,加快训练的速度,提高模型的准确率。同时使用强化学习模型解决反向传播中离散化数据梯度难以下降的问题。模型的鉴别器使用CNN网络和交叉熵模型,使生成的文本具有新颖性。使用BELU评价指标和主观评价的实验结果均表明了该模型的有效性。