Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2025年第8期目录
    2025, 47(8): 0-0. doi:
    摘要 ( 99 )   PDF (249KB) ( 111 )     
    高性能计算
    面向隐私计算的模运算加速设计
    刘宏伟1, 支梁2, 秦梦远1, 陈铭志1, 董文阔1, 郝沁汾1
    2025, 47(8): 1331-1342. doi:
    摘要 ( 209 )   PDF (4260KB) ( 276 )     
    隐私计算技术是数据中心保证数据安全的重要手段,随着量子计算的发展,基于格的后量子算法和全同态加密算法逐步发展流行。在这些算法中,模运算都是广泛使用的非线性算子之一,主要用于避免计算过程中出现溢出。面向隐私计算及密码学应用中广泛使用的模运算问题,在FPGA平台上基于PCIe接口设计实现了一个软硬件协同加速设计,能够有效掩盖通信延迟,并支持高达2 048位的模运算,包括模乘和模幂运算,以服务于有隐私计算需求的数据中心场景。已有研究工作都仅关注模运算本身,而此软硬件协同框架则给出了一个完整的加速框架,不仅包含运算核心,还给出了数据和软硬件接口,并减少了通信延迟的影响。最后结合一个具体的运营商场景,实现了针对性的加速应用,通过实验验证了设计的性能优势。

    基于FT-X DSP轨迹跟踪的插桩工具设计与实现
    魏臻1, 2, 原玉磊1, 刘月辉1, 2, 莫家胜1, 2, 扈啸1, 2
    2025, 47(8): 1343-1353. doi:
    摘要 ( 134 )   PDF (2489KB) ( 81 )     
    程序插桩技术包括动态技术和静态技术,在程序执行过程中主要用于动态分析,广泛应用于漏洞挖掘、缺陷检测、性能分析与优化等领域,是进行程序执行路径收集、函数调用分析的主要手段。在嵌入式系统中,传统的插桩方法常常因无操作系统、复杂体系结构和有限内存等限制而难以实施。以静态插桩算法为研究目的,聚焦嵌入式系统调试场景中的插桩需求,除了介绍程序插桩技术的基本原理,系统性地分析目前插桩的典型方法以外,设计并实现了基于FT-X DSP轨迹跟踪的插桩工具Dbtrace。同时,针对插桩开销问题,全面测量了不同插桩方案程序执行的时间开销和代码膨胀率,并与未插桩的程序进行对比。实验结果表明,Dbtrace能有效跟踪和记录程序执行的轨迹信息,降低了内存占用和插桩开销,可以有效解决嵌入式系统的插桩调试问题。

    带状垂直差分结构分析与优化
    章幻, 李滔, 胡晋
    2025, 47(8): 1354-1363. doi:
    摘要 ( 91 )   PDF (3608KB) ( 111 )     
    随着差分信号速率的不断提升,传统差分过孔的不连续性对信号完整性的影响越来越不容忽视。为了解决多层PCB垂直方向上信号反射、衰减和阻抗不连续问题,急需开展新型垂直差分结构的研究。首先采用三维电磁仿真软件HFSS构建了Model I和Model II 2种类型的带状垂直差分结构与传统差分过孔模型;其次对2种带状垂直差分结构的传输性能进行仿真与分析,发现Model I模型传输性能优于Model II模型;再次分析结构参数对带状垂直差分结构Model I模型的电性能传输参数的影响;最后,对比分析了带状垂直差分结构Model I模型与传统差分过孔的电性能传输参数,并通过时域眼图进行了验证。结果表明:减少面连接盘尺寸、垂直导体深度与残桩长度,增大钻孔直径与反焊盘尺寸,可以改善Model I模型的传输性能;Model I模型转换相比传统差分过孔转换带来的眼高和眼宽增大了4.47%和4.31%,抖动减少了57.16%,Model I模型具有更优的时域传输性能。

    基于TAGE与基于神经网络分支预测器的比较与分析
    郑伟巍, 郑重, 陈微, 陆洪毅
    2025, 47(8): 1364-1380. doi:
    摘要 ( 174 )   PDF (6170KB) ( 274 )     
    随着处理器性能需求的不断增长,超标量和深度流水线技术被广泛应用于现代微处理器中,从而提升指令执行的并行性。然而,程序中的条件分支指令对流水线的连续执行构成了挑战,限制了指令并行执行的能力。为解决这一控制冒险问题,分支预测技术应运而生,其核心在于预先推测分支指令的跳转方向和地址,进而最小化因分支指令引起的流水线停顿延迟。基于统一的性能评估框架,对比分析了当前主流的基于TAGE的分支预测器和基于神经网络的分支预测器。实验结果表明,不同分支预测器对特定轨迹存在不同的偏好性,融合多种预测机制或可以进一步挖掘预测潜能。同时,执行任务上下文对分支预测性能的影响不容忽视,特别是在多进程环境中。此外,实验还发现当前CNN预测器在处理复杂分支时的性能不稳定,整体表现未能超越基准TAGE-SC-L预测器,仍需继续优化。
    面向芯粒互联的Retimer结构及关键技术研究
    孙玉波1, 周宏伟2, 3, 孙星语2, 3, 何星洋2, 3, 宋朝阳2, 3, 陈志强2, 3
    2025, 47(8): 1381-1390. doi:
    摘要 ( 129 )   PDF (2759KB) ( 161 )     
    通过芯粒互联接口电路连接多个裸芯(die)的方式构建芯片成为后摩尔时代芯片设计的主流方法。芯粒互联接口电路仅用于在单封装内的多裸芯互联,传输距离极短。在大规模计算系统中,需要利用多个计算芯片单元构建更大规模的计算结点,如何实现多个芯片中的裸芯在板级长距离互联,成为十分重要的问题。Intel等在通用芯粒互联(UCIe)规范中定义了一种面向芯粒互联接口的中继器(Retimer),但并未公开其结构细节,国内面向芯粒互联接口的Retimer的研究尚处于空白。结合自主芯粒互联接口标准制定工作,提出了一种面向芯粒互联到芯片互联的Retimer(D2C_Retimer)结构,支持芯粒的芯粒间互联(D2D)接口转换为芯片间互联(C2C)接口,实现裸芯在板级跨芯片互联。通过Retimer的可靠性传输机制、Retimer的信用机制和层次化边带传输链路等关键技术,实现了对自主芯粒互联标准的兼容,而且在信用管理、可靠性传输等方面具有优势。实验表明,实现的Retimer结构能够在不改变现有自主互联标准的情况下,实现芯粒间跨封装长距离互联,对于健全国产芯粒互联互通生态,具有重要的参考意义和工程实现价值。

    计算机网络与信息安全
    大规模IPv6网络IP-ID类型测量
    黄峰元, 杨轶帆, 喻波, 杨振中, 蔡志平, 侯冰楠
    2025, 47(8): 1391-1398. doi:
    摘要 ( 106 )   PDF (1488KB) ( 78 )     
    IPv6网络中,用于为网络层数据报提供分片和重组支持的IP-ID字段不再作为固定字段出现,而是被放入扩展头部中,以供灵活使用。近年来有利用IPv6分片机制引发IPv6目标主机生成IP-ID,并进行别名前缀解析等的工作,说明在IPv6网络中IP-ID字段仍然存在信息泄露等问题,存在一定的安全风险。由于现有的IP-ID利用方法都是使用简单、可预测的IP-ID类型,因此探测互联网IPv6设备的IP-ID类型是否可预测,对IPv6网络安全和资产评估有重大意义。因此提出一种方法对互联网的IPv6设备进行探测,并且根据探测得到的结果对该设备生成IP-ID的方式进行分类。在得到的近500万个IPv6地址返回的IP-ID结果中,仍然有41.1%的地址使用可预测的IP-ID类型。探测结果表明IPv6网络并非免疫于基于分片和IP-ID的攻击,IPv6网络中仍然有相当多的设备使用存在高安全风险的可预测IP-ID类型。
    区块链中可搜索加密电子病历数据共享方案
    李亚红1, 2, 李哲玮1, 李强1, 王彩芬3, 张学军1
    2025, 47(8): 1399-1407. doi:
    摘要 ( 126 )   PDF (1510KB) ( 79 )     
    针对电子病历存在数据安全和存储、数据共享等方面的问题,提出区块链中可搜索加密电子病历数据共享方案。首先,所提方案利用云服务器实现电子病历的存储,并对相应密文进行重加密,以保证不同医疗机构之间的数据共享。其次,使用区块链存储索引,搜索阶段在联盟链上调用智能合约执行关键词密文搜索,实现索引安全存储的同时,降低半诚实的第三方不实搜索风险。同时,该方案将条件隐藏在重加密密钥中来保证数据的机密性,保证代理无法了解任何有关条件的信息。最后,通过实验分析可知,该方案是轻量级的,在计算和通信开销方面具有很大优势。

    CNN-ViTAMR:一种基于Transformer的自动信号调制识别算法及其轻量化实现#br#
    刘畅, 徐炜遐
    2025, 47(8): 1408-1416. doi:
    摘要 ( 253 )   PDF (1889KB) ( 135 )     
    随着物联网、5G通信、无线自组网以及无人集群系统等技术的迅猛发展和普及应用,信号自动调制识别在无线通信、雷达信号处理和电子战等领域有着广泛的应用,并且开始向边缘智能端侧设备渗透。因此,轻量化的智能调制识别算法及其实现成为当前通信领域亟待解决的关键问题之一。传统的基于CNN和RNN的信号调制识别算法模型无法准确地把握信号的全局信息,因而在AMR任务中存在一定的局限性。近年来,Transformer借助其内部多头自注意力机制的全局信息特征提取能力,突破了DNN模型泛化能力的约束,在时间序列信息处理中取得了重大突破。因此,提出一种基于Transformer结构的AMR算法模型,该模型在Transformer中嵌入基于CNN的Token化模块,从而使模型在兼具Transformer的全局信息提取能力的同时,又保留了Token内部的局部时序特征,从而保证了算法的识别正确率。同时,所提模型的参数量较少,适合部署在边缘侧设备终端。基于Zynq Ultrascale+MPSoC平台的评估结果表明,相较运行于较高基准频率CPU平台的软件算法版本,FPGA硬件加速平台以较低的时钟频率实现了高达2.47倍的硬件加速。

    基于多视角时空对齐学习的恶意域名检测方法
    金学奇1, 2, 徐红泉3, 黄银强4, 孙志华5
    2025, 47(8): 1417-1424. doi:
    摘要 ( 95 )   PDF (1536KB) ( 62 )     
    针对当前恶意域名检测方法对域名字符串信息利用不充分和全局编码特征丢失的问题,提出一种基于多视角时空对齐学习的恶意域名检测新方法。首先,将域名字符串嵌入到图像中,并借助降噪自编码网络和卷积神经网络将域名字符串编码到文本和视觉特征空间,构造多视角特征集。然后,将特征图下采样为不同尺度的特征层,通过逐层迭代学习特征的梯度信息,增强特征的语义表达能力。最后,借助交叉注意力机制实现文本特征图和视觉特征图的对齐,并在对齐特征图上利用全局平均池化构造原型集,通过关联原型和待测域名特征,快速给出待测域名合法性的判定。在公开数据集上进行了二分类与多分类的测试,验证了所提方法的优越性。
    图形与图像
    BF-YOLO:基于YOLOv8改进的小目标检测算法
    蒲小莉, 赖惠成, 高古学
    2025, 47(8): 1425-1436. doi:
    摘要 ( 289 )   PDF (7736KB) ( 149 )     
    针对现有的目标检测算法对无人机拍摄目标检测精度较低、模型大且不易于部署的问题,提出改进YOLOv8的目标检测算法BF-YOLO。首先,对网络的输出检测层进行重构,增强了算法模型对小目标的检测能力;其次,引入感受野注意力卷积替换普通卷积,使网络关注目标位置信息,增强了模型对目标特征的学习能力;此外,设计了多尺度信息提取模块,通过多个分组卷积单元来提取不同感受野下的目标信息,减少模型参数量的同时提高了检测精度;最后,引入加权双向特征融合来改进颈部网络,实现多尺度特征融合,提高了模型对多尺度目标的识别能力。实验结果表明,在VisDrone-DET2019数据集上,改进后算法的mAP50比YOLOv8s提高了7.3%,且模型参数量减少了67.1%,有效实现了检测精度和模型轻量化的平衡。

    基于Ghost高效层聚合网络的多尺度融合YOLOv7-tiny改进算法#br#
    欧阳玉旋, 张荣芬, 刘宇红, 彭垚潘
    2025, 47(8): 1437-1448. doi:
    摘要 ( 141 )   PDF (3215KB) ( 81 )     
    针对现有的大多数神经网络参数量大、推理速度慢、检测性能低且不便于部署边缘设备等问题,提出一种改进的YOLOv7-tiny算法。首先,根据原算法模型的结构特点,引入Ghost-ELAN模块以大幅度压缩模型;其次,使用Ghost Bottleneck-2代替网络Neck部分的卷积,进一步降低模型的规模;然后,使用多尺度融合模块Ghost-SPPCSPC提升模型对特征信息的理解能力,并采用GhostConv替换输出层卷积,在降低普通卷积冗余性的同时最大程度地利用模型中的语义信息;最后,使用迁移学习的方法,让模型学习到丰富的通用特征,提高模型的性能。实验结果表明,改进模型的参数量和模型大小较原模型分别降低和减小了57.19%和55.28%,实现了对原模型的重量级压缩,并提升了模型的精度,FPS达到了278,使模型达到快速、高效和便携的目的,更易于部署在边缘设备上。

    基于细粒度局部伪影的生成式图像检测
    袁程胜1, 2, 陈金瑞1, 2, 徐晨维3, 刘庆程1, 2, 付章杰1, 2
    2025, 47(8): 1449-1458. doi:
    摘要 ( 151 )   PDF (2267KB) ( 108 )     
    随着人工智能技术的飞速发展,利用生成对抗网络(GAN)与扩散模型(Diffusion Model)等模型生成的图像,已达到肉眼难以辨识真伪的高度逼真水平。尽管当前检测技术能在特定任务中展现优异性能,但是面对未知模型生成的图像时,其泛化能力往往不尽如人意。为了应对这一挑战,提出一种基于细粒度局部伪影的双分支框架,旨在深入挖掘图像全局的空间特征以及多个局部区域的伪造痕迹。利用生成式图像普遍存在的上采样操作在空间域上导致的细粒度伪影现象,并结合图像全局结构信息与局部细节信息,显著提升了检测方法在不同场景中的泛化能力。通过这一方法,能够更全面地分析图像的细粒度篡改痕迹并学习生成式图像的独特指纹,在鉴别AI生成式图像方面展现出更强的鲁棒性和准确性。实验结果表明,本文所提方法在处理多种GAN和扩散模型生成的数据集时均表现出色,进一步验证了其有效性。

    动态空间Transformer与多级融合的视网膜病变分级算法
    梁礼明, 钟奕, 康婷, 金家新
    2025, 47(8): 1459-1469. doi:
    摘要 ( 123 )   PDF (6294KB) ( 170 )     
    针对糖尿病视网膜病变图像存在误分级和病灶边缘信息关注较少的问题,提出一种动态空间Transformer与多级融合视网膜病变分级算法。该算法首先将视网膜图像经PVT v2主干网络实现对病灶信息的初步提取;其次在网络前3层引入轮廓增强模块,凸显病灶边缘特征,提高算法对病灶像素的定位感知能力;再次在网络底层设计动态空间注意力模块,有效联系全局和局部空间信息,以提升算法挖掘深层语义信息的能力;最后构建多级门控融合模块,实现非诊断信息的滤除,同时对可诊断信息进行多级融合,进一步提高视网膜病变分级准确率。在IDRID和APTOS 2019数据集上进行实验验证,其二次加权系数分别为91.71%和89.89%,IDRID数据集上准确率和APTOS 2019数据集ROC曲线下方面积的占比分别为79.61%和93.06%。实验结果表明,所提出算法在视网膜病变分级领域具有一定应用价值。

    人工智能与数据挖掘
    文本问答中基于双向叠加注意力的证据区间预测
    吐尔地·托合提1, 2, 罗长虹1, 2, 艾斯卡尔·艾木都拉1, 2
    2025, 47(8): 1470-1482. doi:
    摘要 ( 153 )   PDF (1623KB) ( 82 )     
    文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉匹配来丰富隐式交互的文本语义;其次,根据证据分布互异性设计软证据标签对来表示前向和后向证据得分;最后,对序列中每个位置的证据得分双向叠加以获得更符合上下文语境要求的证据区间。实验结果表明,所提方法在Span-F1,Span-EM等评价指标上较基线模型有所提升,证实了其在复杂语境中能够有效提高证据区间预测精确度和问答准确性。

    基于密集卷积和多特征感知的链接预测模型研究
    刘金竹, 张东, 李冠宇
    2025, 47(8): 1483-1492. doi:
    摘要 ( 135 )   PDF (1405KB) ( 78 )     
    ConvE将卷积神经网络应用于链接预测任务,其优异的性能引起了学术界的关注。但是,ConvE等卷积神经网络模型对图结构信息的特征提取仍不充分且没有考虑知识图谱中关系存在的多特征属性。为了充分利用图结构信息特征以及关系的多特征属性,提出了一个新的链接预测模型——ComConvR。该模型对关系的多特征进行提取,并向卷积神经网络添加密集卷积块,增强了网络的信息提取能力,实现了多特征融合,以完成链接预测任务。最后,使用ComConvR在4个基准数据集上进行链接预测实验并进行消融实验和关键参数讨论,表明了密集卷积块的有效性和高效性。 

    基于知识图谱中多维元路径的科技文档查询扩展
    徐建民, 仝思梦, 张国防
    2025, 47(8): 1493-1502. doi:
    摘要 ( 89 )   PDF (1800KB) ( 131 )     
    针对现有科技文档的查询扩展方法存在文档信息利用不充分、文档间关联关系未能有效利用等方面的局限性,提出一种基于知识图谱中多维元路径的科技文档查询扩展方法。首先,对伪相关反馈文档集进行处理得到候选扩展词集;其次,在对科技文档知识图谱进行分析的基础上,寻找合适的元路径表示用户查询与候选扩展词的关联关系,并基于节点间不同的元路径关联计算用户查询与候选扩展词之间的多维语义相关度;最后,融合多维语义相关度以及候选扩展词在伪相关反馈文档集中的权重选择最终扩展词,实现对用户查询的扩展。实验结果显示,与已有的查询扩展方法相比,基于知识图谱中多维元路径的科技文档查询扩展方法在mAP,DCG和NDCG上分别至少提升了9.21%,10%和11.7%。

    基于藏字构件的低资源多方言藏语语音合成方法研究
    王嘉文1, 2, 高定国1, 2, 尼琼1, 2, 巴果1, 2
    2025, 47(8): 1503-1510. doi:
    摘要 ( 155 )   PDF (6228KB) ( 72 )     
    藏语语音合成是人工智能领域的一个重要研究方向,对推动藏语语言信息处理的发展和创新具有重要意义。针对藏语语音语料稀缺、文本复杂以及方言多样的合成难点,首先提出了一种基于藏字构件的语料处理方法,以减少文本处理的难度;其次采用端到端的语音合成模型,探讨了2种低资源的多方言藏语合成方案。实验结果表明,所提方法通过混合数据集训练能够实现单一模型对多方言的语音合成,提高语音的自然度和表现力,达到了平均MOS为 4.56 的语音质量。

    基于一种新参数距离的概率语言多属性决策方法
    黄帅1, 王佩2, 申真3
    2025, 47(8): 1511-1520. doi:
    摘要 ( 96 )   PDF (1372KB) ( 71 )     
    概率语言术语集(PLTS)由语言术语及其概率信息组成,能够有效表达决策信息的不确定性。针对PLTS中语言术语数量不同的问题,提出了一种基于最大公约数的标准化方法,使所有术语具有相同的概率。随后,设计了一种新的参数化距离,通过设定参数值来表示不同尺度的术语,解决了现有距离公式依赖语言下标或特定标度函数的局限性。此外,针对属性权重未知的场景,结合信息熵和离散度,构建了一种混合权重模型以计算权重信息。最后,提出了一种基于PLTS的TOPSIS多属性决策方法,并以地铁选址为例验证了该方法的有效性和优越性。结果表明,所提出的方法在理论和实践中具有较强的适用性。