Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2023年第4期目录
    2023, 45(04): 0-0. doi:
    摘要 ( 162 )   PDF (255KB) ( 253 )     
    高性能计算
    一种面向IO Die的敏捷验证方法
    罗莉, 石伟, 何鸿君, 潘国腾, 王蕾, 龚锐
    2023, 45(04): 571-576. doi:
    摘要 ( 207 )   PDF (990KB) ( 277 )     
    IO Die可以用做IO 扩展芯片,也可作为芯粒(chiplet)复用于多个项目。提出一种面向IO Die的敏捷验证方法,验证平台包括子系统级、簇级、全片级3个层次,可实现测试激励的跨层次复用;针对各验证层次的测试激励的自动生成方式进行优化,分别采用覆盖率驱动、可配置约束产生、多目标优化策略,提高测试激励的生成效率。实验结果表明,该方法在保证效率和可靠性的前提下,可以降低验证成本,缩短验证时间,快速获得已知合格裸片KGD。

    卷积神经网络硬件加速的通用性设计
    王玉雷, 谢凯亮, 陈思贇, 胡杰, 常胜
    2023, 45(04): 577-581. doi:
    摘要 ( 218 )   PDF (608KB) ( 385 )     
    随着人工智能的兴起,应用于各种场景的神经网络算法蓬勃发展。这使得以卷积神经网络为代表的各类算法的通用边缘部署加速设计成为了一大难题。对此,提出了基于数据相关性原理和Roofline模型的一般性和通用性设计准则,并据此对神经网络进行面向硬件加速的并行化设计。对卷积层、池化层和全连接层这3个最重要的部分进行了优化,基于优化后的模块可根据应用场景需求搭建各种卷积神经网络,从而实现通用性设计。以LeNet-5网络为对象,在XILINX ZC702和XILINX ZC706 FPGA平台上分别以MNIST测试集为基准验证,对各层优化后基于高层次综合构建的交互式识别系统,在XILINX ZC702平台上达到了95.09%的准确率和每幅图像4.1 ms的推理速度,在XILINX ZC706平台上达到了相同的准确率和每幅图像0.997 ms的推理速度,二者都具备了很高的处理速度。
    面向复杂多陷阱的随机电报噪声提取技术
    肖雨, 纪志罡
    2023, 45(04): 582-589. doi:
    摘要 ( 221 )   PDF (1504KB) ( 393 )     
    随着集成电路的发展,器件尺寸不断减小,导致MOSFET栅氧化层中的陷阱增多。低频噪声随之产生,尤其是随机电报噪声RTN变得愈发明显,对器件的可靠性提出了挑战。当器件中的陷阱个数多于1个时,陷阱间的耦合效应也对RTN信号的分析产生了重要影响。因此,开展针对复杂多陷阱情况下的RTN信号的提取技术的研究变得尤为迫切。目前现存的RTN提取技术在处理大数据量时迭代所耗费的时间成本大,且自动化程度不高,这些问题亟需解决。基于RTN信号非高斯性质,提出了自动化检测RTN信号的方法和自动化判定陷阱数方法,使得RTN信号的提取更加准确和高效。另外,还针对迭代过程中重要参数提出了自适应模型的方法,实现了大部分RTN信号提取的迭代加速。最后,对实测RTN信号应用上述方法进行参数提取,并分析了耦合效应对参数产生的影响。

    一种面向蒙特卡洛程序的128核可扩展体系结构
    张立, 黎铁军, 张建民
    2023, 45(04): 590-598. doi:
    摘要 ( 178 )   PDF (1343KB) ( 301 )     
    蒙特卡洛方法是研究粒子输运问题的重要方法,为蒙特卡洛方法设计定制加速体系结构成为粒子输运模拟的研究热点。分析了一种典型的蒙特卡洛方法代理程序Quicksilver的程序特征,并对存储层次和簇规模等影响可扩展性的结构参数进行了探索,提出了一种面向蒙特卡洛程序的128核可扩展体系结构,在128核配置下实现了相比单核90倍的加速比和70.1%的扩展效率。
    基于模算术系数解析的稀疏插值算法
    唐敏, 戚妞妞, 邓国强
    2023, 45(04): 599-606. doi:
    摘要 ( 151 )   PDF (498KB) ( 256 )     
    稀疏多元多项式插值是利用多项式的稀疏结构及其给定的插值点信息重构黑盒函数的一种有效策略,被广泛应用于科学和工程领域。传统的基于Prony方法的稀疏插值算法,其复杂度与多项式项数和次数相关,遇到大规模问题时由于执行多个高阶代数运算而效率较低。提出一种新的求解稀疏多元多项式插值问题的算法,核心操作是利用模算术解析单变元多项式的系数,避免了传统方法必需的高阶方程组求解、高次方程求根等。该算法设定一变元为主元,将黑盒多元多项式视为该主元的单变元多项式,通过解析主元的系数多项式在不同插值点处的函数值,进而重构这些系数多项式以恢复整个多元多项式。理论分析和数值实验表明了算法的有效性和可行性。

    基于某国产双路服务器的液冷散热性能实验研究
    叶琴, 陈才, 陈彪, 张坤
    2023, 45(04): 607-612. doi:
    摘要 ( 132 )   PDF (1080KB) ( 287 )     
    随着服务器集成度不断提高,功率密度也逐渐增大,其散热问题成为制约服务器发展的一大障碍。与风冷相比,液冷具有良好的散热优势,在未来更高功率密度服务器散热过程中具有重要应用前景。另外液冷技术可以有效降低数据中心的PUE值,减少碳排放。基于此,通过实验研究了某国产双路服务器散热性能。首先,通过实验对比了该服务器的风冷与液冷散热效果。然后,通过对比内/外循环液冷性能,发现外循环液冷散热具有更大的散热调控性能,控温范围更广泛,适合的应用场景也更丰富。在较低进水温度和较大进水流量下,外循环液冷能够获得更好的散热效果。

    软件工程
    一种基于Event-B语言的时间触发系统建模方法
    姚袭欣, 章博, 陈香兰, 乔磊, 李曦
    2023, 45(04): 613-621. doi:
    摘要 ( 153 )   PDF (774KB) ( 198 )     
    安全关键信息物理系统的时间属性建模和验证至关重要。Event-B模型验证避免了基于状态遍历模型检查方法的状态空间爆炸问题,验证时耗少,适用于高并发系统。然而,常规的Event-B方法缺乏时间语义表达结构,特别是缺乏对可提高系统可预测性的时间触发属性的支持。首先,介绍支持时间触发系统的抽象建模框架TTEB,从系统行为和实现2个抽象层次对时间属性进行建模和精化。然后,通过有序事件链组成的时间触发转移描述行为层时间触发属性;通过全局时钟到分布式本地时钟的精化和分解实现行为模型到实现模型的转化;运用时间触发转移建模分布式时钟周期同步。最后,基于从车跟车系统建模与验证说明方法的可用性和有效性。

    基于决策表的AUTOSAR操作系统一致性测试研究
    陈灿, 杨兴达, 方菱
    2023, 45(04): 622-629. doi:
    摘要 ( 107 )   PDF (731KB) ( 187 )     
    汽车开放系统架构(AUTOSAR)规范为车载嵌入式操作系统及其相关服务定义了一系列的抽象标准接口,得到了广泛应用。传统AUTOSAR操作系统一致性测试方法针对性不强,无法测试不同一致类级别的操作系统,被测系统需要符合最高一致类级别要求才可以通过测试,因此需要额外抽取符合要求的测试用例。基于决策表设计了一种面向 AUTOSAR 操作系统的一致性测试方法。决策表是一种表达事件在逻辑上相互依赖关系的符号手段,可将复杂的逻辑关系和多种条件组合情况详细地列举出来,且可根据需求进行重制。通过在设计测试用例时参照一致类进行划分,使得测试用例在生成时被赋予一致类属性,可针对不同级别操作系统进行测试。在实际实验中,该方法实现了不同一致类操作系统的针对性测试,对5个功能模块的4种一致类执行了测试,避免了379条测试用例的额外抽取,提升了测试效率。

    一种基于构件的软件系统的薄弱构件确定方法
    王玉琢, 刘海涛, 袁昊劼, 张志华
    2023, 45(04): 630-637. doi:
    摘要 ( 122 )   PDF (604KB) ( 231 )     
    基于构件的软件系统是以结构设计为核心的系统。在设计阶段确定系统的可能薄弱环节,并尽可能将潜在的隐患消除在设计阶段,对于科学保障软件系统质量、减少因盲目开发带来的资源浪费和损失具有重要意义。针对构件可靠性服从G-O模型的软件系统,定义了2个系统参数——系统缺陷总数和系统缺陷检出率,建立了基于相应构件参数的系统参数估计模型。在此基础之上给出了一种系统薄弱构件的确定方法,并通过仿真对所提方法的有效性进行了验证。该方法能对测试或运行环境下最有可能被优先检测出缺陷的构件进行推断,对于辅助软件设计人员确定薄弱构件、优化结构设计具有参考价值。

    基于注意力机制的Tree2Seq代码注释自动生成
    赵乐乐, 张丽萍, 赵凤荣
    2023, 45(04): 638-645. doi:
    摘要 ( 171 )   PDF (643KB) ( 277 )     
    代码注释可以帮助开发人员快速理解代码,降低代码维护成本。为了保留代码的结构信息,针对经典的Seq2Seq模型将代码的结构信息压缩为序列,导致结构信息丢失的问题,提出使用Tree-LSTM编码器直接将代码转化成抽象语法树进行编码,使注释生成模型能有效获取代码的结构信息,提升注释生成效果。采用基于注意力机制的Tree2Seq模型实现代码注释生成任务,避免了编码器端将所有输入信息压缩为固定向量,导致部分信息丢失的情况。通过在Java和Python 2种编程语言的数据集上进行实验,使用3种机器翻译常用的自动评测指标进行评估验证,并选取一部分测试数据进行了人工评估。实验结果表明,基于注意力机制的Tree2Seq模型能为解码器提供更全面且丰富的语义结构信息,为后续实验分析和改进提供指导。

    图形与图像
    改进InceptionV3与迁移学习的太阳能电池板缺陷识别
    史册, 南新元
    2023, 45(04): 646-653. doi:
    摘要 ( 105 )   PDF (1055KB) ( 199 )     
    传统识别方法对太阳能电池板表面缺陷的识别准确率低、速度慢,针对该情况,提出一种基于改进InceptionV3与迁移学习的识别方法。首先对采集到的太阳能电池板图像进行预处理;其次采用平衡因子δ,引入了新损失函数来改进InceptionV3神经网络,保证了网络的识别率;最后结合迁移学习方法建立缺陷识别模型,进一步提升性能。仿真结果表明,该方法有效提升了太阳能电池板的缺陷识别准确率和速度,其识别准确率高达96.43%,相较于传统InceptionV3模型提升了2.45%,平均分类时间缩短了4.5 ms,表明此方法取得了很好的效果,且具有广阔的应用前景。

    基于改进YOLOv4模型的乳腺钼靶图像肿块检测
    白钰杰, 裴以建, 朱秀军
    2023, 45(04): 654-664. doi:
    摘要 ( 199 )   PDF (1132KB) ( 280 )     
    针对目前主流目标检测算法在乳腺钼靶图像的良恶性肿块目标检测中存在应用较少、检测准确率低和检测速度慢等问题,提出一种基于改进YOLOv4的乳腺钼靶图像肿块检测模型。该方法可以在一个框架中同时高效进行肿块的检测和分类。首先,引入了分流聚合双通道(JAnet)残差结构对模型的骨干网络进行改进;其次,引入深度可分离卷积来替换原YOLOv4模型中的标准卷积;最后,在后处理阶段提出了较大值求平均方法。以DDSM数据集作为训练集训练检测模型,并以INbreast数据集作为独立测试集。实验结果表明,提出的基于改进YOLOv4的乳腺钼靶图像肿块检测模型的Recall值、mAP值、FPS和AUC值相比原YOLOv4算法的分别提高了7.3%,6.45%,5.9 fps和13.02%。模型整体效果优于目前主流的目标检测模型的,体现出了良好的鲁棒性和有效性,可以在医师对乳腺癌临床诊断过程中发挥计算机辅助诊断作用。

    基于多模态融合的动态手势识别研究
    胡宗承, 段晓威, 周亚同, 何昊
    2023, 45(04): 665-673. doi:
    摘要 ( 283 )   PDF (1081KB) ( 526 )     
    针对复杂环境中动态手势识别精度低且鲁棒性不强的问题,提出一种基于多模态融合的动态手势识别算法TF-MG。TF-MG结合深度信息和三维手部骨架信息,利用2种不同网络分别提取对应特征信息,然后将提取的特征融合输入分类网络,实现动态手势识别。针对深度信息运用运动历史图像方法,将运动轨迹压缩到单帧图像,使用MobileNetV2提取特征。针对三维手部骨架信息采用门控循环神经单元组成的DeepGRU对手部骨架信息进行特征提取。实验结果表明,在DHG-14/28数据集上,对14类手势识别精度达到93.29%,对28类手势识别精度达到92.25%。相对其他对比算法实现了更高的识别精度。

    基于改进YOLOv5+DeepSort算法模型的交叉路口车辆实时检测
    贾志, 李茂军, 李婉婷
    2023, 45(04): 674-682. doi:
    摘要 ( 321 )   PDF (1449KB) ( 392 )     
    针对传统目标检测跟踪算法检测精度低、鲁棒性差的缺点,以及交叉路口图像视频资源冗余的现象和车辆密集程度高的特点,提出了一种基于改进YOLOv5和DeepSort算法模型的交叉路口实时车流量检测方法,在MS COCO和BDD100k相结合的数据集上,采用改进的YOLOv5算法模型实现视频小目标车辆检测,利用深度学习多目标跟踪算法DeepSort对检测的车辆进行实时跟踪计数,实现了交叉路口监控端对端的实时车流量检测。通过分析比较不同参数的模型,最终选定了YOLOv5m模型。实验结果表明,该方法在复杂环境、车辆遮挡和目标密集程度高等环境下检测速度更加快,对车辆的检测效果更好,平均准确度达到96.6%。该方法完全满足目标实时性检测的要求,能充分满足交叉路口车辆检测的有效性,满足实际需要的使用需求。

    基于多尺度联合网络的图像超分辨率重建方法
    王万军, 丁新涛, 刘朝, 章智强
    2023, 45(04): 683-690. doi:
    摘要 ( 144 )   PDF (1329KB) ( 280 )     
    图像超分辨率在视频修复等方面具有广泛应用。针对基于深度学习的图像超分辨率重建(FSRCNN)方法存在的问题,提出基于多尺度联合网络的图像超分辨率重建方法。首先,通过构建基于多尺度网络的特征采样模型来提取低分辨率(LR)图像的特征;其次,通过特征融合和构造亚像素卷积层的方法对特征进行增强;最后,定义基于均方误差MSE和峰值信噪比PSNR的联合损失函数。在Set5、Set14和BSD100数据集上进行了对比实验,实验结果表明,该方法获得了相对较好的结果。最后针对低分辨率影视作品《西游记》和《红楼梦》进行了高分辨率修复,取得了一定的效果。
    人工智能与数据挖掘
    基于二分网络的长期推荐
    王玫申, 张鹏, 薛乐洋,
    2023, 45(04): 691-700. doi:
    摘要 ( 82 )   PDF (1216KB) ( 188 )     
    目前在基于二分网络的推荐算法研究中,关注更多的是推荐的短期性能,而在现实生活中,对每一个用户的推荐是一个长期的过程,在线网络会随着时间的推移而发展,并且用户在购物时往往有求新的消费心理,因此长期推荐的多样性也需要更多的关注。针对这些问题,将短期推荐中表现良好的经典算法应用到长期推荐中,发现长期的推荐多样性和准确性逐渐变差;为了改善长期推荐的表现,设计了一个融合时间因子的推荐算法,并将其应用到长期推荐中;实验结果表明,提出的算法在不损失推荐准确性的前提下,显著提高了长期推荐的多样性。

    基于细粒度观点挖掘和Kano模型的用户满意度分析研究
    曾祥俊, 叶晓庆, 刘盾
    2023, 45(04): 701-710. doi:
    摘要 ( 164 )   PDF (989KB) ( 236 )     
    在线评论在客户关系管理、产品营销等方面发挥着重要作用,有效利用在线评论来分析用户满意度,对企业改善其服务和产品至关重要。传统的满意度分析方法的变量设计往往依赖专家建议,较少考虑正负属性的不对称影响。为解决这些问题,利用文本细粒度观点挖掘技术,对用户在线评论进行特征挖掘,构建产品服务质量分数,并采用PRCA技术对服务属性的正负影响进行量化,将服务属性投射为Kano属性分类,然后分析不同粒度下不同品牌的客户满意度特点,并给出不同品牌的属性优先顺序。最后,从咖啡评论数据中挖掘出5个关键属性。实验结果表明,不同属性对满意度影响具有不对称效应,且不同粒度下的顾客满意度影响因素具有不同的特点,并给出了相应的精细化企业管理策略。

    基于ALBERT预训练模型的事件抽取技术研究
    杜洁, 骆力明, 孙众
    2023, 45(04): 711-717. doi:
    摘要 ( 136 )   PDF (646KB) ( 251 )     
    信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务,首先采用ALBERT预训练模型学习特征,其次引入条件随机场CRF模型提高序列标注性能,最后完成事件类型以及事件要素的识别分类。在ACE2005标准语料库上的实验结果表明,与现有模型相比,ALBERT-CRF模型在触发词识别和分类任务上的召回率和F值均有所提高。

    基于粒子群优化和深度强化学习的策略搜索方法
    彭坤彦, 尹翔, 刘笑竹, 李恒宇
    2023, 45(04): 718-725. doi:
    摘要 ( 287 )   PDF (980KB) ( 353 )     
    深度强化学习DRL算法是一种常用的策略搜索方法,已成功应用于一系列具有挑战性的控制任务。但是,由于DRL难以应对奖励稀疏问题,缺乏有效的探索以及对超参数具有极其敏感的脆弱收敛性,使其难以应用于大规模实际问题。粒子群优化算法PSO是一种进化优化算法,它使用整个episode的累积回报作为适应性值,对奖励稀疏的环境不敏感,且该算法也具有基于种群的多样化探索以及稳定的收敛性,但样本效率低。因此,提出了PSO-RL算法,结合PSO和基于策略梯度的离策略DRL算法,DRL通过PSO种群提供的多种数据来训练种群中累积奖励最低的几个策略,并且每次都将训练后累积奖励得到提升的策略插入PSO种群,增强DRL与PSO之间的信息交流。PSO-RL算法能够提升PSO的样本效率,而且能够改善DRL算法的性能和稳定性。在pybullet模块具有挑战性的连续控制任务中的实验结果表明,PSO-RL的性能不仅优于DRL的,且优于进化强化学习算法的。

    基于多任务学习的图神经网络推荐模型研究
    罗可劲, 刘广聪, 杨文浩
    2023, 45(04): 726-733. doi:
    摘要 ( 198 )   PDF (673KB) ( 327 )     
    图神经网络处理非欧氏空间数据的强大能力促使越来越多的研究将其应用于推荐领域。然而,现有的基于图神经网络的推荐模型大多数仍然采用多个邻接矩阵来表示多种节点或边属性等异质信息,没有充分利用异质信息之间的交互。因此,提出一种新型的图神经网络推荐模型,把所有信息实体之间的丰富交互建模成异质图,并在异质图上使用稠密子图采样策略进行子图采样;此外,模型还加入多任务学习方法用于共同优化链接预测与推荐任务,使得模型学习到更好的节点表示,以提升推荐效果。2个公开数据集上的实验结果表明,所提模型相比基线模型,在Top-N推荐任务性能上有所提高。

    改进特征金字塔的小目标深度学习模型
    黄星威, 陈曦, 张塑凡
    2023, 45(04): 734-742. doi:
    摘要 ( 177 )   PDF (979KB) ( 240 )     
    现有的目标检测模型常采用特征金子塔的多尺度特征融合来提升小目标检测性能。然而,在特征金字塔的浅层特征层,大目标的存在会削弱模型对小目标的检测,侧向连接会丢失高层特征层的语义信息。针对以上问题,提出了I-FPN特征金字塔。在浅层特征层,抹去大目标信息让模型更关注小目标;在高层特征层,使用残差特征增强模块减少信息损失。此外,模型还使用数据增广技术提升鲁棒性。I-FPN特征金字塔使用Resnet为主干网络,在VEDAI小目标数据集和PASCAL VOC通用目标数据集上进行了实验。实验结果表明,在不影响检测速度的条件下,在VEDAI测试集上较原特征金字塔的mAP指标提升了2.4%,在VOC测试集上mAP指标提升了0.5%。

    面向二分网络的谱近似社区搜索方法
    赵琰, 金柳, 马慧芳, 苏变萍, 高玮蔚
    2023, 45(04): 743-750. doi:
    摘要 ( 111 )   PDF (945KB) ( 190 )     
    社区搜索旨在从网络中查找给定查询节点所在的局部社区,基于谱的社区搜索方法是流行的方法之一。现有基于谱的社区搜索方法多面向简单网络而无法处理具有2类实体关联的二分网络,且面向二分网络的社区挖掘方法多是对网络进行整体划分。据此,提出了面向二分网络的谱近似社区搜索方法,旨在将谱方法引入到二分网络中进而精确定位与查询节点关联紧密的社区。具体来说,首先考虑二分网络中2类实体的关联,基于局部模块度设计了面向二分网络的局部模块度;其次,基于谱图理论,在二分网络上利用融合不同实体关联的模块度矩阵局部逼近特征子空间,设计了适用于二分网络的谱方法;最后,利用结合谱性质的二分网络上的局部模块度,设计了谱子空间中以查询节点集为支撑的稀疏指示向量的线性规划问题,目标社区可通过线性规划问题的求解而获得。真实数据集上的实验结果表明了本文方法有效性和效率。

    基于细粒度信息感知BERT-EEP的情绪分类方法
    胡慧君, 杨雨烟, 易洋, 刘茂福
    2023, 45(04): 751-760. doi:
    摘要 ( 158 )   PDF (1066KB) ( 225 )     
    网络舆情情绪分析专注于挖掘特定领域文本中深层次的情绪信息,对及时评估和化解舆情风险有重要意义。以往研究大多依赖情感符号、词性等基本情绪知识构建情绪语义特征,忽略了文本中情绪的持有者、线索等细粒度语言表达。为此,针对COVID-19疫情期间网络舆情数据的特点,引入同步双通道循环递归网络抽取细粒度情绪信息。在此基础上,提出辅助句构造法和基于BERT的情绪表达感知网络BERT-EEP,利用细粒度情绪信息辅助标签分类,并通过多头注意力机制和双向门控循环单元学习辅助信息和上下文之间的依赖关系,最终实现情绪分析。为评估所提方法的有效性,构建了一个具有细粒度表达的COVID-19中文情绪数据集。实验结果表明,所提方法能有效地融合细粒度情绪信息,在情绪分类任务上获得了优异的性能。