计算机工程与科学

2026年第4期目录

2026, 48(4): 0-0. doi:

摘要 ( 154 )

PDF (256KB) ( 76 ) 　　

超智融合高性能计算技术发展探讨

卢锡城, 杨博, 刘杰, 黄立波, 陈新海

2026, 48(4): 571-579. doi: 10.3969/j.issn.1007-130X.2026.04.001

摘要 ( 341 )

PDF (708KB) ( 101 ) 　　

高性能计算(HPC)技术演进始终与国防军事、基础科学及产业工程等领域的战略需求紧密交织，其发展历程大致可划分为专用向量机、大规模并行计算机、异构并行计算机和超智融合计算机4个关键阶段，各阶段在体系结构、软件生态和应用模式上不断演进。当前，高性能计算正经历一场由人工智能驱动的深刻范式转移，“AI for Science”成为一种新型科学研究范式，科学计算的高性能、高精度与智能计算的高性能、混合精度特征呈现出深度融合态势，对底层计算架构在精度协同、数据交换以及I/O模式适配等方面提出了严峻挑战。展望未来基于超智融合的高性能计算技术发展，竞争焦点正从单一的浮点峰值性能，转向数据搬移效率、能效比以及系统可扩展性的综合考量。计算单元间更紧密的集成、更高效的数据流动以及更统一的编程抽象，将成为下一代高性能计算系统的关键特征。CPU-SIMT融合计算架构作为一种有前景的超智融合计算体系结构，采用的“融合计算架构+层次化互连网络+融合并行存储”方案，有望突破超智融合紧耦合计算应用的“通信墙”瓶颈，为构建下一代高性能计算系统提供新的技术路径，高效支撑新型“AI for Science”计算范式应用。

HSI：一种面向多芯粒的高带宽低延时协议转换机制

王勇, 杨乾明, 付文文, 王永文

2026, 48(4): 580-589. doi: 10.3969/j.issn.1007-130X.2026.04.002

摘要 ( 256 )

PDF (1477KB) ( 98 ) 　　

芯粒技术因其成本低、良率高、集成度高成为延续摩尔定律和提升芯片性能的新兴技术。目前芯粒间传输的研究聚焦于高速互连接口，而片上网络至芯粒接口的协议转换技术的研究处于空白阶段，使其成为芯粒间传输延时和带宽的瓶颈。提出一种高带宽低延时的协议转换机制HSI，其采用基于组合式轮询调度策略读取片上网络中多类型Flit以降低传输延时和增加带宽，使用多切片报文格式封装Flit以提升有效带宽利用率，使用多写单读式队列结构支持多Flit并行访存以降低解析延时。为了验证HSI的优越性，面向主流的CHI网络协议和UCIe芯粒接口协议对HSI机制进行实现验证，结果显示HSI传输带宽可达512 Gbit/s，可与32通道UCIe传输带宽、DDR5.0访存带宽相适配，并且单Flit传输延时仅为6.05 ns，突发时Flit流的平均传输延时为1.2~1.7 ns。

深度驱动图划分的关键路径延时优化研究

余学雯, 陈海燕, 黄鹏程

2026, 48(4): 590-598. doi: 10.3969/j.issn.1007-130X.2026.04.003

摘要 ( 239 )

PDF (2309KB) ( 52 ) 　　

在微处理器设计中，关键路径延时是制约微处理器主频和性能提升的重要因素，而日益增长的设计复杂度使传统优化方法面临着挑战。针对这一难题，提出了一种自动化的深度驱动图划分的关键路径延时优化策略，并实现了相应算法。将延时优化问题建模为有向无环图划分选择问题，基于半定制设计流程所得的逻辑网表，利用深度驱动图划分识别并选取一批具有优化潜力的子电路结构，进行逻辑重构，并替换逻辑网表中相应的逻辑单元集。实验结果表明，提出的算法可对电子设计自动化工具设计完成的电路进行优化，有效降低了关键路径上的逻辑深度，进而为在有限成本下优化关键路径延时提供了一种有效的策略，以实现微处理器性能的提升。

面向带宽受限型DSP的高效大语言模型推理方法

陈阳, 杨希, 苏华友, 陈抗抗

2026, 48(4): 599-607. doi: 10.3969/j.issn.1007-130X.2026.04.004

摘要 ( 266 )

PDF (1240KB) ( 56 ) 　　

随着大语言模型的兴起，神经网络模型的参数规模呈指数级增长并达到千/万亿量级，模型的推理任务对计算设备的算力和带宽提出了巨大挑战。为实现低带宽设备上的高性能LLMs推理，针对带宽受限、长向量数字信号处理器体系结构，设计并实现高效的LLMs推理方法，提出基于张量形状感知的低精度矩阵乘方法，充分利用DSP的计算能力和降低访存压力的能力；提出基于数据依赖关系的算子融合方法减少中间临时数据的传输；使用延迟算子执行方法提升DSP设备内核执行效率。实验表明，该方法能够有效提升大模型在带宽受限DSP设备上的推理性能，优化后的推理方法相较于普通实现能够实现1.4~2.3倍的加速比；相较于内存带宽更高的多核ARM CPU以及Intel Xeon Gold CPU，同等核心数量下LLMs推理性能的加速比分别达到2.5倍和1.2倍以上。

基于可重构低功耗处理的高速乘法器设计

陈一凡, 杨宇恒, 姜岩峰, 蔡孟冶

2026, 48(4): 608-616. doi: 10.3969/j.issn.1007-130X.2026.04.005

摘要 ( 315 )

PDF (879KB) ( 44 ) 　　

针对传统radix-4 Booth编码乘法器所导致的高延迟和高功耗，设计并实现了一种改进型radix-4 Booth编码的低功耗高速乘法器。该乘法器采用改进型radix-4 Booth编码，通过超前置零编码模块改善了原有编码带来的功耗损失，并采用预处理方法增加扩展符号位，减小关键路径延迟；通过优化生成规则部分积阵列，减少压缩器数量；通过改进压缩器结构和可重构压缩设计缩短关键路径长度，降低压缩树整体功耗。所设计的乘法器采用180 nm工艺完成设计，通过Design Compiler进行综合，采用该结构32位乘法器关键路径延迟为6.73 ns，电路面积为116 736 μm2，通过随机产生5 000组随机数得到整体功耗为13 838 μW。

一种基于强化学习的PE恶意软件对抗样本生成方法

张朝然, 马玉骐, 张三峰, 杨望

2026, 48(4): 617-627. doi: 10.3969/j.issn.1007-130X.2026.04.006

摘要 ( 311 )

PDF (911KB) ( 73 ) 　　

提出一种基于强化学习的PE恶意软件对抗样本生成方法。将PE恶意软件对抗样本生成视为序列到序列的生成任务，并对离线强化学习数据集进行序列建模，利用Transformer强大的序列生成能力，通过每次预测一个动作来逐步生成序列。此外，引入信息传输机制来实现强化学习过程中跨回合信息传输，提高数据效率。实验表明，基于所提出方法生成的PE恶意软件对抗样本的逃逸率优于对比实验，并具有可转移性。

基于多视图特征对比学习的多维时序异常检测收

邱鸿锐, 王超群, 柳毅, 罗玉

2026, 48(4): 628-639. doi: 10.3969/j.issn.1007-130X.2026.04.007

摘要 ( 220 )

PDF (1985KB) ( 67 ) 　　

针对多维时间序列异常检测中复杂的时间依赖性、异常样本稀缺性，以及现有模型未充分利用时序数据频域信息的问题，提出了一种基于多视图特征对比学习的多维时间序列异常检测模型。通过学习时域信息和频域信息的表征来构建双特征通道，并利用纯对比损失指导学习过程。此外，在时域通道的设计中采用了分块策略和图注意力机制；在频域通道中将时间变化的分析扩展到二维空间，并使用多尺度卷积模块，以进一步增强时间序列的表示能力，从而提高异常检测准确性。在5个公开的多维时间序列数据集上的实验表明，提出的模型在多维时间序列异常检测任务中取得了较高的性能。

群智感知中基于三支决策的恶意用户检测方法

李志雯, 万子轩, 赵国生, 廖祎玮

2026, 48(4): 640-649. doi: 10.3969/j.issn.1007-130X.2026.04.008

摘要 ( 193 )

PDF (1637KB) ( 46 ) 　　

恶意用户是群智感知网络的重要安全威胁，严重影响群智感知网络的服务性能和数据质量。然而，现有非黑即白的恶意用户检测方法缺乏对可疑用户的处理机制，导致始终存在安全隐患。针对此问题，提出一种基于三支决策的恶意用户检测方法。首先，以用户行为、数据质量和用户推荐为评价指标构建评估概率函数；其次，利用三支决策方法，将用户归类为可信用户、可疑用户和恶意用户；最后，通过灰色关联分析方法动态处理可疑用户，检测其中的恶意用户。仿真实验表明，提出的检测方法在准确率、误报率以及漏报率上表现较好，有效增强了群智感知网络的安全性能。

基于差分中值定理的可逆隐藏简牍图像水印算法

刘雪艳, 李喜良, 齐钰娇, 贾博龙

2026, 48(4): 650-658. doi: 10.3969/j.issn.1007-130X.2026.04.009

摘要 ( 246 )

PDF (1876KB) ( 53 ) 　　

简牍图像水印是简牍图像数据的版权保护、篡改检测和完整性保护的关键技术，然而，目前大多的图像水印密钥缺乏权威机构监管，在感知透明性与安全性之间未能实现良好的平衡。以甘肃简牍博物馆提供的简牍数字图像为研究对象提出基于差分中值定理的可逆隐藏简牍图像水印算法，水印密钥由权威部门和竹简部门结合生成，针对简牍图像出土后纹理及颜色分布不均的特点，嵌入过程基于差分中值定理向简牍图像RGB三通道中嵌入拆分后不同的水印密钥信息，并在最低有效位LSB替换时，利用Logistic映射进行置乱，进一步提高水印密钥信息的安全性与感知透明性。实验结果表明，所提算法嵌入的水印具有较好的不可见性，且算法对被攻击图像的篡改部分具有很高的定位精度。

基于超像素的模糊C均值林地遥感图像提取算法

冯丹丹, 王小鹏

2026, 48(4): 659-666. doi: 10.3969/j.issn.1007-130X.2026.04.010

摘要 ( 334 )

PDF (3064KB) ( 37 ) 　　

由于林地中树种和生长环境等因素的影响，遥感图像中的林地区域出现分布不均匀和孔洞等现象，利用传统模糊C均值聚类算法难以对其进行精确提取，为此，提出了一种基于超像素的模糊C均值遥感图像林地提取算法。首先，通过GAN形态学复合型滤波器对林地遥感图像中的孔洞进行填充。其次，利用多尺度形态学将基于单个像素聚类转化为基于超像素聚类，降低聚类算法的复杂度。最后，对超像素块进行基于直方图的模糊C均值聚类，提取林地区域信息。光学林地遥感图像实验结果表明，该算法在分割准确度、归一化互信息、F1-score和Kappa系数等性能方面均优于其他几种FCM算法，算法的ACC与 F1-score最高分别达到了89.05%和93.95%。

基于多分组绝对矩块截断编码和排序映射的彩色图像压缩

张孟涛, 熊礼治

2026, 48(4): 667-675. doi: 10.3969/j.issn.1007-130X.2026.04.011

摘要 ( 169 )

PDF (946KB) ( 34 ) 　　

数字图像作为一种重要的信息载体，已被应用于各个领域。不断产生的大量彩色图像，占用了大量的存储空间和网络带宽。因此，彩色图像压缩成为一项关键技术。绝对矩块截断编码（AMBTC）作为经典的图像压缩方案之一，已被广泛研究。然而，在现有的相关方案中，重构图像的视觉质量和压缩率都相对较低。为了解决这一问题，一种基于多分组绝对矩块截断编码（MGAMBTC）和排序映射的彩色图像压缩方案被提出。利用MGAMBTC含有多个量化级别的特点，提出了排序映射算法，通过对量化级别重新排序，映射到位图的前几个比特上以压缩位图。所提方案在相同比特率下，所重构图像的视觉质量高于其他方案的。同时，在实验中表明了排序映射算法的有效性。

复杂天气下交通标志识别算法研究

王海群, 赵涛, 王柄楠, 晁帅

2026, 48(4): 676-688. doi: 10.3969/j.issn.1007-130X.2026.04.012

摘要 ( 305 )

PDF (2837KB) ( 53 ) 　　

处于复杂天气背景下的交通标志图像清晰度降低，识别难度增加，现有算法不能准确识别。为此，提出一种基于YOLOv8改进的交通标志识别算法。首先，依据残差学习的思想设计了特征映射增强模块替换主干网络中C2f的残差块来提升主干网络的特征提取能力。其次，在坐标注意力CA的基础上进行特征分组并添加3×3卷积分支实现跨空间信息聚合，实现更精细特征的捕捉，使所提算法更加专注于目标区域而不是背景；再次，采用混合池化来优化空间金字塔池化网络，提升模型的特征表达能力；最后，为了增强目标多尺度特征的表达能力，设计了基于特征重组和双分支降采样的多尺度特征融合网络，有效地促进不同层次特征间的信息交互。在自制的复杂天气交通标志数据集SWTSD上进行实验，均值平均精度达到90.4%，相较基准算法提升了3.9%，FPS达到109.4，可满足实时性要求。

基于特征增强和自适应多尺度特征融合的场景文本检测

李琼, 漆昌仕, 谢凯

2026, 48(4): 689-698. doi: 10.3969/j.issn.1007-130X.2026.04.013

摘要 ( 246 )

PDF (2585KB) ( 53 ) 　　

针对自然场景中文本形态各异和背景复杂多变引起文本区域定位不准确的问题，提出了一种基于特征增强和自适应多尺度特征融合的文本检测算法。首先，改进残差网络，以减少语义信息的流失。其次，将坐标注意力嵌入到提取的特征中，以抑制冗余的背景信息和提高对文本区域的关注，从而增强对文本边界的定位能力。再次，结合自适应多尺度特征融合模块，将学习到的空间位置权重融入到不同尺度特征图中,以更充分地融合多尺度特征信息。最后，采用可微分二值化算法来生成文本检测结果。为了验证该算法的有效性，在公开数据集ICDAR2015、MSRA-TD500和Total-Text上进行实验，其综合指标F1值分别达到了88.1%,87.7%和86.3%。实验结果表明，该算法在文本检测上具有良好的鲁棒性和泛化性。

基于自适应特征融合的低质量钢印字符检测和识别

吕淑静, 娄鹏杰, 彭世全, 赵春龙, 刘运丹, 吕岳

2026, 48(4): 699-708. doi: 10.3969/j.issn.1007-130X.2026.04.014

摘要 ( 230 )

PDF (3017KB) ( 37 ) 　　

针对金属制品钢印所面临的字符倾斜、模糊、字体不统一及铁锈污渍干扰等问题，提出一种基于自适应特征融合的字符检测模型YOLO-CHAR，采用MobileNet特征提取网络动态调整通道特征权重，增强模型对关键特征的捕捉能力，在特征融合层采用GFPN网络结构和SimAM注意力机制，灵活捕捉多尺度特征并加强特征融合能力；基于该字符检测模型，设计并实现了一套低质量火车轮轴钢印字符检测识别系统，该系统已投入使用，轮轴的整体识别日均准确率达到92%以上，满足现场使用要求。

一种高精度的频偏估计算法设计及FPGA实现

黄寅健, 郑隆浩, 唐立军

2026, 48(4): 709-717. doi: 10.3969/j.issn.1007-130X.2026.04.015

摘要 ( 372 )

PDF (1839KB) ( 44 ) 　　

在研究Rife和Quinn算法性能的基础上，针对传统频偏估计算法精度易波动以及抗噪能力弱的问题，提出了一种改进型算法。该算法结合了Rife算法在频偏因子较大时的精度优势和Quinn算法的稳定性，并利用添加权重系数的多谱线插值去克服实际频率接近量化频点时产生的修正方向误判问题。实验结果表明：所提算法在较低的信噪比下仍然能保持较高的频率估计精度，相较于其他同类型算法整体性能更稳定、更接近克拉美-罗下界。最后，通过FPGA平台部署算法，并将结果与实际信号频率进行比较和分析，其均方根误差最大在16 Hz左右。

基于社区结构的CDCL启发式算法

何飞, 王晓峰, 唐傲, 彭庆媛, 华盈盈, 王军霞

2026, 48(4): 718-730. doi: 10.3969/j.issn.1007-130X.2026.04.016

摘要 ( 331 )

PDF (735KB) ( 35 ) 　　

工业SAT实例存在社区结构，而VSIDS和LRB未能有效利用这种结构。针对该问题，提出一种基于社区奖励的Cr分支优化算法。Cr算法的核心原理是增加相同社区变量的活性分数，以集中搜索局部解空间来降低重启和回溯成本，从而提高求解效率。首先依据社区中变量连接方式，将变量区分为桥变量和内变量，再根据社区中的变量将社区划分为3种类型。接着围绕变量和社区类型，尝试不同方法增加相同社区变量的活性分数。相同社区的判断依据当前社区的设置，而当前社区由活性最高的变量决定。变量类型和当前社区是Cr算法的2个关键因素，在Minisat、Maplesat和Glucose求解器的初步实验中，通过全局学习率GLR、提出的Incr序列和奖励因子α，分析了这3个因素对求解效率的影响。进一步地，依据分析结果在先进SAT求解器lstech_maple中应用Cr算法，实验表明利用社区结构可以有效提高先进SAT求解器的效率。为解释社区在冲突驱动子句学习CDCL搜索中可能起到的作用，提出社区连续指数CCI，并结合LBD解释社区的作用。

融合ROUSTIDA和改进的概率直觉模糊聚类的协同过滤推荐算法

张艳菊, 吴一玄, 陈泽荣

2026, 48(4): 731-742. doi: 10.3969/j.issn.1007-130X.2026.04.017

摘要 ( 402 )

PDF (2069KB) ( 41 ) 　　

模糊聚类衡量用户评价的模糊性并将相似用户划分为同一簇，能够改善传统协同过滤算法的可扩展性和数据稀疏性，但现有基于模糊聚类的协同过滤算法通常没有考虑聚类中心初始化和模糊集权重的问题，造成聚类效果不稳定和无法全面利用评价信息的问题，影响推荐精度。针对上述问题，提出了一种融合ROUSTIDA和改进的概率直觉模糊聚类的协同过滤推荐算法。该算法基于粗糙集理论中的属性约简规则，并以缺失矩阵与相似矩阵的差异最小为原则填补缺失数据，降低数据稀疏性，引入密度函数初始化方法并完成聚类中心的选择，缓解模糊聚类对初始聚类中心的高敏感度，在聚类计算中分别求解隶属度和非隶属度的概率权重和犹豫度相关系数，以添加权重的概率欧氏距离作为聚类的邻近函数以筛选出相关邻居集合，在聚类过程中保留了更多的用户评价信息。在MovieLens 100K和Jester数据集上的实验结果显示，相较于UFCM与FCM-Slope One等其他基于模糊聚类的推荐算法，所提算法的MAE与RMSE指标更低，有更好的推荐精度。

基于显著性检测器与衰减掩码自注意力模块的声音事件检测和定位研究

王春丽, 陈善立, 刘素倩, 赵小春

2026, 48(4): 743-751. doi: 10.3969/j.issn.1007-130X.2026.04.018

摘要 ( 193 )

PDF (731KB) ( 36 ) 　　

提出了一种基于显著性检测器与具有衰减掩码的多头自注意力结合的声学模型，此模型可以在执行声音事件检测与定位任务时更好地关注空间信息。通过显著性检测器在局部信息内关注显著性高的部分，使模型更加关注信息丰富度高的类别。其次在多头自注意力模块中引入了衰减掩码，这种设计可以使模型更加专注于局部信息，引入自适应约束使注意力头多样化。实验结果表明，提出的模型相较于基线模型性能更好，与融合Transformer和Multi-scale模型相比较，所提模型具有更优的检测与定位效果。最后利用视频信息充当额外数据来提升性能，表现出良好的性能。

基于大数据的多属性网络舆情预测方法

帕丽旦·木合塔尔, 郭文强, 路翀

2026, 48(4): 752-760. doi: 10.3969/j.issn.1007-130X.2026.04.019

摘要 ( 260 )

PDF (1335KB) ( 60 ) 　　

为量化分析社交媒体网络舆情控制能力，提出基于多属性决策和综合权重分析的网络舆情风险预测方法。首先，选择网络爬虫方法进行数据采集，对采集到的网络舆情数据采用抗干扰的匹配滤波方法对其进行数据清洗。其次，针对预处理后的网络媒体舆情数据，构建多属性综合决策对象模型，以获取多个可量化的属性集合，并采用分词技术将文本数据分解为词语。基于分词结果，挖掘出舆情风险演化与人们喜好之间的关联规则，进而计算得到关联度。最后，将关联度作为BERT预训练向量模型的输入，获取网络舆情风险指向特征值，利用网络舆情风险演化特征实现网络舆情风险演化预测。仿真结果表明，所提方法进行网络舆情风险演化预测的寻优能力较强，F1综合评价指标比标准方法有所提高，提高了舆情分类的准确性，并且舆情风险演化预测精度达到了97.6%。

当期目录

作者中心

审稿中心

在线期刊