Please wait a minute...
中国计算机学会会刊
中国科技核心期刊
中文核心期刊
首页
期刊介绍
编委会
投稿指南
投稿须知
排版规范
投稿模板
审稿流程
常见问题
开放获取
出版道德
期刊订阅
下载中心
联系我们
English
当期目录
2025年, 第12期 刊出日期:2025-12-25
上一期
本期栏目:
目录
高性能计算
计算机网络与信息安全
图形与图像
人工智能与数据挖掘
目录
2025年第12期目录
2025, 47(12): 0-0. doi:
摘要
(
109
)
PDF
(267KB) (
48
)
高性能计算
2025年中国高性能计算机发展现状分析
张云泉, 邓力, 袁良, 袁国兴
2025, 47(12): 2091-2098. doi:
摘要
(
204
)
PDF
(1066KB) (
74
)
根据2025年11月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、体系结构和行业领域等方面进行了讨论分析,同时对未来发展进行了展望。
基于多元混合编码的SRAM数字存算一体宏设计
郭瑞琦, 杨卓航, 陈销丰, 王磊, 王扬, 胡杨, 尹首一
2025, 47(12): 2099-2107. doi:
摘要
(
132
)
PDF
(1866KB) (
48
)
存算一体芯片技术被认为是有望解决处理器芯片“存储墙”瓶颈,大幅提升人工智能算力能效和算力密度的关键技术和重要解决方案。提出了一款新型的数字式SRAM存算一体宏单元架构,利用权重数据、激励数据混合编码的方式优化功耗开销,提升芯片能效;并针对核心加法树电路进行了一系列电路层级的优化,提升芯片的面积效率。在TSMC 28 nm工艺库下,对所提出的数字式SRAM存算单元进行了仿真验证,测试模型为ResNet20。结果显示,在0.9 V,250 MHz下,混合编码优化可以提升2.17倍的能效;通过加法树优化可以将存算一体单元的面积减少14.2%;处理ResNet20模型时,256×64的存算阵列可以实现20.83 TOPS/W能效。
基于静动态样本点重构的处理器功耗建模精度提升方法
钟佳卿, 陈娟, 周一畅, 吴贤瑜, 王蕊, 喻湘
2025, 47(12): 2108-2118. doi:
摘要
(
124
)
PDF
(1688KB) (
30
)
建立高精度细粒度CPU功耗模型对于计算机系统的功耗管理与优化至关重要。针对多核处理器建模中建模数据集数量、类型分布不均衡等问题,提出一种基于静动态程序样本点重构的处理器建模精度提升方法。程序样本由程序运行时的性能计数器(PMC)采集数据构成。静态重构算法从特征选择、时间粒度细化和空间去冗余3个维度对程序样本点进行重构。动态重构算法作为静态重构算法的补充,关注程序在不同编译选项或不同资源加载等优化手段下运行时的行为,选择合适优化手段的程序样本,补充程序样本点。为评估静动态样本点重构算法对功耗建模的影响,在x86和ARM处理器平台上对5个程序基准测试集进行评估。实验结果表明,在2个x86平台上,功耗模型分别采用线性模型、神经网络模型和随机森林模型,精度提升的平均结果分别为74.80%,65.70%,32.24%以及61.61%,80.44%,18.76%,在ARM平台上,线性模型、神经网络模型和随机森林模型的精度提升平均结果为22.34%,34.63%和34.36%。
面向天河超算的OpenFOAM不可压缩流体模拟算法优化
刘忠民, 张翔, 马迪, 孙扬, 周磊, 邱琪, 龚春叶
2025, 47(12): 2119-2128. doi:
摘要
(
133
)
PDF
(1933KB) (
39
)
流体力学开源软件OpenFOAM中的不可压缩等流体模拟求解器具有跨平台适用性,但它们的性能优化大多是针对Intel等现有架构的超算系统,故其算法优化无法发挥天河超算系统上ARM架构的向量化并行优势。为此,以不可压缩流体模拟求解器为研究对象,运用ARM向量化技术来优化它的对称高斯赛德尔法和对角不完全Cholesky预条件共轭梯度法,提升求解器的运行效率。为实现向量化目标,分析了2类求解算法的一次迭代中近邻网格单元间的关系,发现这些近邻单元数目最多为2,且近邻之间无依赖。利用该先验信息,以尽可能最小的成本改动原有算法代码,即新增4行if-else条件语句,就能向量化近邻单元,加速算法。不同配置下的实验结果表明,改进后算法的单核加速比最高为1.75,多核加速比最高为149.16,且并行效率仍有29.13%。
OpenLM:多平台高性能的大语言模型推理框架
刘高, 徐建良, 张先轶, 刘贤冬
2025, 47(12): 2129-2138. doi:
摘要
(
177
)
PDF
(1260KB) (
44
)
随着计算设备种类的增加和计算能力的迅速提升,以及模型数量的不断增加,在多平台上实现多模型的高效推理已成为一项复杂且艰巨的任务。为应对这一挑战,开发了OpenLM框架,该框架旨在在多个平台上快速实现多模型的高性能推理支持。OpenLM框架具备广泛的模型兼容性,内置了多平台和多架构的高性能计算算子,以最大限度发挥硬件性能。同时,OpenLM拥有灵活的框架结构,便于快速集成和支持最新的模型。为进一步优化推理过程中的显存和内存消耗、任务调度与系统稳定性,框架中引入了分页注意力机制、动态批处理、权重量化和KV cache量化等特性。经实验证明,上述优化策略能够有效提升推理效率,并降低资源开销,以增强框架的整体性能。
计算机网络与信息安全
基于MDS码和NMDS码的(几乎)最优可扩展码构造
李文婷, 衡子灵, 李晓茹
2025, 47(12): 2139-2149. doi:
摘要
(
167
)
PDF
(539KB) (
21
)
在分组密码实现中,侧信道攻击(SCA)和故障注入攻击(FIA)是密码分析十分重要的方法。设C是Fq上生成矩阵为G的线性码,C′是Fq上生成矩阵为G′=[G:Ik]的线性码,其中Ik为k阶单位矩阵。若d(C⊥)=d(C′⊥),则称C为最优可扩展线性码;若d(C⊥)=d(C′⊥)+1,则称C为几乎最优可扩展线性码。最优或几乎最优可扩展码可有效保护存储在寄存器中的敏感数据,使其不受SCA和FIA的影响,从而保护整个算法。通过特殊的生成矩阵构造了1类维数为5的几乎最优可扩展线性码,并求出了其参数和重量计数器。此外,证明了另外4类维数为5以及2类维数为4的NMDS码为最优可扩展线性码。特别地,所构造的(几乎)最优可扩展码的参数与已知(几乎)最优可扩展码的参数不同,在直和掩码设计中有潜在应用价值。
网络战环境下的通信网络结构及负载配置研究
李勇慧, 吴雨悦, 邓凤贤, 司守奎, 赵文飞
2025, 47(12): 2150-2159. doi:
摘要
(
156
)
PDF
(1540KB) (
35
)
网络战环境下,军事通信网络的结构设计与负载配置需要着重考虑预防和应对节点或边损坏的不利情况,节点间通信需求的满足程度是评价网络性能的合适指标。为此,定义了网络负载富余度的概念,考虑预先设置备份路径以应对网络受打击后的功能损失情况,以减小通信路径跳数、增大和均衡各路径富余度为网络设计目标,创新性地将复杂的军用网络负载配置问题通过一个逐步动态规划路径的最小跳数路径搜索模型和一个较为简单的双目标规划模型解决,提出的路径与负载设计算法相比已有研究更加贴合军事网络设计需求。通过算例仿真,对比验证了算法在给定网络环境下的普适性与优越性,并且就当前算法分别提出进一步寻找最优解的建议和针对复杂大型网络减小运算难度的改进方向。
基于模糊神经网络的异构无线网络垂直切换算法
路庆松, 仇英辉
2025, 47(12): 2160-2168. doi:
摘要
(
120
)
PDF
(833KB) (
30
)
针对异构无线网络中的垂直切换问题,根据不同的业务类型和网络端参数,提出了一种基于混合滤波和模糊神经网络的算法。首先采用卡尔曼滤波和滑动平均滤波相结合的方法,对接收信号进行处理。然后,将经处理之后的接收信号强度(RSS)、带宽和时延作为模糊神经网络的输入,输出为候选网络的评价值。最后,系统根据不同的业务类型和网络的评价值选择最佳的接入网络。仿真结果表明,所提算法能够在复杂多变的异构无线网络场景下做出合理的决策,有效降低切换失败概率和业务的阻塞概率,提高系统的吞吐率,保证用户的服务质量(QoS)
融合聚类和结构优化的属性访问控制策略评估
夏桐, 袁凌云, 谢天玉
2025, 47(12): 2169-2180. doi:
摘要
(
114
)
PDF
(2331KB) (
27
)
为加快用户请求资源的响应速度,提出一种融合聚类和结构优化的属性访问控制策略评估方法。首先,构建规则距离权重矩阵,以计算非数值型规则数据点间的实际距离;其次,基于CKmeans双阶段聚类方法处理大规模策略集,将其划分为若干个小规模策略簇,缩小策略匹配范围;最后,基于规则结构优化整合方法,压缩簇中规则条目,减少访问请求与簇规则的比较次数,并同时加入哈希缓存表,加快重复请求的访问速度。使用现实系统中的多个XACML访问控制策略验证所提方法的有效性。实验结果表明,相比于现有的Sun’s XACML和Xengine评估引擎以及4类机器学习方法,所提方法在LMS,VMS和ASMS这3个策略集上的时间开销显著减少,至多降低了约3个数量级,极大提升了策略的评估效率。
图形与图像
面向图像后处理的面部操纵对抗防御方法
许锟, 祁树仁, 张玉书, 温文媖, 张华
2025, 47(12): 2181-2194. doi:
摘要
(
165
)
PDF
(2245KB) (
36
)
当前面部操纵技术已经能够轻易对人脸属性进行修改,人眼难以辨别真假。面部图像数据易被获取用来实现对人脸的伪造,这些都时刻威胁着用户的个人隐私和信息安全。因此利用对抗防御方法防止面部图像被操纵成为当前研究的热门。然而,目前现有的方法多关注图像添加对抗扰动的防御效果,缺乏后续对抗扰动被破坏情况下的深度分析。为此,提出了一种面向图像后处理的面部操纵对抗防御方法,通过深层次综合分析原始图像、添加对抗扰动的图像以及对抗扰动被破坏的图像,构建基于对比学习的图像对抗防御模型。对提出的对抗防御方法进行了全面的对比和评估,实验结果表明,所提出的方法具有较好的面部操纵防御效果。
基于多级对抗均值教师网络的夜间城市景观语义分割
徐梦繁, 黄微, 古倬铭
2025, 47(12): 2195-2203. doi:
摘要
(
186
)
PDF
(1537KB) (
23
)
针对目前方法对于夜间场景适应性不足导致的分割效果不佳问题,基于域适应提出一种多级对抗均值教师网络。所提出方法的分割流程可分为2个阶段:首先,使用课程式风格迁移策略选择黄昏场景为目标风格,并将昼夜图像变换为黄昏风格,从而将复杂的风格转换任务分解为2个更简单的任务,有助于实现输入风格对齐;其次,利用多级对抗均值教师网络在特征级和预测概率级分别执行对抗学习,多层次地实现源域与目标域间的域适应,有助于提高模型在不同域之间的泛化能力。另外,网络使用动态类域混合额外引入一个混合样本,使模型学习到更丰富的动态类特征。实验结果显示,该方法的模型在Dark Zurich,ACDC和Nighttime Driving数据集上的mIoU分别达到46.5%,37.9%和47.8%,这表明该方法可以有效改善适应能力,提升夜间城市景观的分割精度。
改进YOLOv8的航拍图像小目标检测模型
韦柳梅, 罗雪梅, 康健
2025, 47(12): 2204-2215. doi:
摘要
(
170
)
PDF
(1505KB) (
45
)
针对无人机航拍图像中小目标的检测精度低且易被漏检和误检等问题,提出了一种改进的小目标检测模型MDH-YOLOv8。首先,运用Focal-EIoU损失函数替换CIoU Loss,解决回归结果不准确的问题。设计小目标特征信息提取SAE模块,改善空间金字塔池化SPPF信息提取不足的问题,使模型同时关注图像中多个重点小目标区域。其次,提出可适应复杂几何形变的C2f_DCN模块,可变形卷积融合瓶颈层多次迭代,增强检测模型的鲁棒性。最后,新增一个专门针对小目标的检测头STDH模块,降低小目标的误检率和漏检率,提高检测精度。在VisDrone2019和DOTA数据集上验证实验结果,MDH-YOLOv8模型较YOLOv8模型,mAP@0.5提高了4.2个百分点,mAP@0.5:0.95提高了3.4个百分点。与目前小目标检测的主流模型相比,MDH-YOLOv8模型在满足轻量化的同时提高了对小目标的检测精度。
混合多策略的麻雀搜索算法与应用
娄莉, 张慧茹
2025, 47(12): 2216-2226. doi:
摘要
(
151
)
PDF
(2171KB) (
35
)
模糊c均值FCM聚类算法以其实现简单、符合实际等优点成为许多研究人员在进行图像分割时的选择,但传统的FCM算法也存在缺点:聚类中心随机初始化。为了恰当选取聚类中心,提出了一种混合多策略的麻雀搜索算法,利用麻雀搜索算法较强的寻优能力来优化FCM算法的初始聚类中心,提高FCM算法的分割效果。算法思路如下:首先,针对麻雀搜索算法后期种群多样性变差的问题,引入Fuch混沌映射;针对麻雀种群易在局部极值点震荡的问题,引入小孔成像反向学习对发现者位置进行更新;针对麻雀种群全局搜索能力较差的问题,引入高斯-柯西变异对跟随者位置进行更新;最终得到一种寻优精度和速度都较好的改进麻雀搜索算法,将FCM算法的目标函数作为改进麻雀搜索算法的寻优函数,进行自然场景和细胞图像分割实验,与标准的FCM算法相比,该算法的平均划分系数提升了5个百分点左右,鲁棒性也有所提升。
人工智能与数据挖掘
搜索结果多样化排序:新进展与展望
李金忠, 刘伟东, 陈盛博
2025, 47(12): 2227-2252. doi:
摘要
(
148
)
PDF
(1291KB) (
30
)
传统搜索引擎仅通过关键词查询以返回相关性搜索结果的排序无法满足用户日益多样化的信息需求。为此,搜索结果多样化排序技术应运而生,它在保持查询相关性的基础上,考虑不同文档的新颖性以及用户潜在的多样化查询意图,向用户呈现内容更为丰富全面的排序结果。随着深度学习技术的快速发展与突破,生成对抗网络GAN和图神经网络GNN等深度学习模型也被广泛应用于搜索结果多样化排序领域。虽然近期涌现了较多搜索结果多样化排序的最新研究成果,但较缺乏对新近提出的搜索结果多样化排序方法等相关研究的综述性工作。基于此,针对近5年来搜索结果多样化排序的研究进展进行了一个较为全面的综述。首先,回顾了搜索结果多样化排序的发展现状和相关综述,并阐述了搜索结果多样化排序问题的定义;其次,对近5年来搜索结果多样化排序的最新方法进行了分类,并重点分析了每个类别中的代表性方法;再次,对主流和新颖的搜索结果多样化评价指标进行了阐述与分析,并总结了现有的主要搜索结果多样化数据集,同时梳理和分析了最新搜索结果多样化排序方法的性能,以及总结了当前搜索结果多样化排序技术的应用进展;最后,对搜索结果多样化排序的未来研究方向进行了展望,以期为相关人员研究搜索结果多样化排序提供参考,并促进这一领域的进一步发展与创新。
基于大语言模型的面向领域的非连续命名实体识别
唐晋韬, 张成贤, 鲍琛龙, 李文静
2025, 47(12): 2253-2260. doi:
摘要
(
187
)
PDF
(689KB) (
40
)
专业领域中术语间的组成逻辑更加复杂,出现了以非连续命名实体为代表的复杂实体等现象。针对非连续命名实体识别任务,提出一种借助大语言模型的理解与生成能力进行识别的方法。该方法将非连续实体识别建模为句子改写任务,设计规则将非连续命名实体识别数据集转换为句子改写数据集,对大语言模型进行输出微调。在命名实体识别阶段,基于改写后的句子,借助提示学习设计规则指令,通过人物角色对话隐式提示大语言模型数据领域等信息,进一步提升了实体识别的效果。实验表明,在3个数据集上,该方法比基于小模型的现有最好方法在药物不良事件语料库CADEC、共享医疗标注2013版 ShARe13和共享医疗标注2014版ShARe14上,F1值分别提升了3.23%,0.28%和1.04%,验证了大语言模型生成能力有助于专业领域命名实体识别的复杂任务。
基于多任务学习和知识蒸馏的多模态蒙古语端到端的语音翻译
臧日成, 高光来, 飞龙
2025, 47(12): 2261-2268. doi:
摘要
(
140
)
PDF
(1117KB) (
32
)
端到端语音翻译技术,旨在实现从源语言到目标语言的自动转换,近年来在多个领域取得了显著进展。然而,在蒙古语的语音翻译方面,效果尚有待提升。其挑战主要源于蒙汉语音翻译数据集的稀缺,现有模型在处理蒙古语语音翻译任务时效果较差。为了克服这些难题,采取了以下措施:首先,收集并构建了一个大规模的蒙汉对照语音翻译数据集,以支持翻译模型的训练。其次,引入联合学习策略,通过编码器和解码器之间的参数共享,促进语音翻译与机器翻译任务之间的知识迁移。此外,为了缩小语音与文本之间的模态差异,采用了交叉注意力正则化方法,以增强模型对不同模态输入的理解和利用。通过知识蒸馏技术,动态更新机器翻译模型,进一步提升了语音翻译模型的性能。最后,集成语音合成模块,实现了从蒙古语语音到汉语语音的翻译。实验结果表明,所提模型在翻译准确率上取得了显著提升,与直接训练的语音翻译模型相比,其BLEU将近提升了2.00。
基于ITCN-IDBO-SVM的间歇过程故障诊断研究
梁秀霞, 何月阳, 刘冲, 梁涛
2025, 47(12): 2269-2280. doi:
摘要
(
130
)
PDF
(3370KB) (
29
)
为提高间歇过程故障诊断的准确性,并解决传统分类器在特征提取上的依赖性问题,本文提出了一种基于改进的时间卷积网络ITCN-改进的蜣螂优化算法IDBO-支持向量机SVM结合的故障诊断模型。故障诊断分为故障特征提取和分类诊断2个过程。首先,利用ITCN从间歇过程数据中提取特征,并将全连接层的输出作为IDBO-SVM分类层的输入。其次,通过IDBO优化SVM参数以提高模型的分类精度,同时使用T-SNE进行可视化分析进一步验证模型的特征提取和分类能力。最后,在青霉素发酵过程数据集上,与原始的时间卷积网络TCN和卷积神经网络CNN进行对比实验。实验结果表明,所提模型不仅提升了故障识别的准确性,还具备良好的泛化性能。
作者中心
作者投稿查稿系统
作者须知
论文模板
版权转让协议
审稿中心
外审专家审稿
编委审稿
主编审稿
编辑部办公
在线期刊
当期目录
最新录用
过刊浏览
出版专刊
下载排行
引用排行