Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2023年第12期目录
    2023, 45(12): 0-0. doi:
    摘要 ( 169 )   PDF (265KB) ( 299 )     
    高性能计算
    2023年中国高性能计算机发展现状分析
    张云泉, 邓力, 袁良, 袁国兴
    2023, 45(12): 2091-2098. doi:
    摘要 ( 566 )   PDF (979KB) ( 770 )     
    根据2023年11月发布的中国高性能计算机性能TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域、部署机构等方面进行了讨论分析,同时对未来发展进行了展望。

    基于Clos网络的高阶路由器结构
    施得君, 李宏亮, 胡舒凯
    2023, 45(12): 2099-2112. doi:
    摘要 ( 219 )   PDF (2670KB) ( 313 )     
    路由器为高性能互连网络的关键组成部分,利用高阶路由器可灵活构建网络直径低、路由路径丰富、容错性能高的拓扑结构。分层结构将整个路由器分成多个子交叉开关实现,子交叉开关规模较小,典型实现为子交叉开关的数量等于路由器端口数,每个子交叉开关对应一个输入/输出端口。分层结构每个子交叉开关的输入和输出都设有缓冲区,导致分层结构路由器内部有大量缓冲区,扩展性受限。网络结构将用于构建系统的网络拓扑实现在片内,如通过网格、全互连或胖树连接较小的交换机,并通过集成电路技术实现在一个路由器中,对外表现为一个高阶路由器。网络结构成本低,构建系统网络后除了要考虑系统网络拓扑的性能,还需要考虑路由器本身的路由问题。提出基于Clos网络的分层结构路由器,综合了传统分层结构高性能和网络结构低成本的优点,并提出2种Clos网络的调度算法,在均匀流量模式下接近100%带宽,RTL综合评估其实现最多减少面积25.9%。

    基于RISC-V的图卷积神经网络加速器设计
    周理, 赵祉乔, 潘国腾, 铁俊波, 赵王
    2023, 45(12): 2113-2120. doi:
    摘要 ( 256 )   PDF (974KB) ( 367 )     
    图卷积神经网络GCN当前主要在PyTorch等深度学习框架上基于GPU实现加速。然而GCN的运算过程包含多层嵌套的矩阵乘法和数据访存操作,使用GPU虽然可以满足实时性需求,但是部署代价大、能效比低。为了提高GCN算法的计算性能并保持软件灵活性,提出一种基于RSIC-V SoC的定制GCN加速器,在蜂鸟E203的SoC平台中通过点积运算扩展指令和硬件加速器软硬件协同的方法实现了针对GCN的加速,通过神经网络参数分析确定了从浮点数到32位定点数的硬件量化方案。实验结果表明,在Cora数据集上运行GCN算法时,该加速器没有精度损失,速度最高提高了6.88倍。 

    多面体模型下的循环置换与自动调优
    彭畅, 刘青枝, 陈长波,
    2023, 45(12): 2121-2134. doi:
    摘要 ( 211 )   PDF (1940KB) ( 356 )     
    针对常用多面体编译器Pluto默认循环调度和分块大小性能欠佳的问题,提出了一种为其调度计算多种合法置换,根据置换和分块大小构成的配置空间为循环程序自动调优的方法。通过对定义循环融合的标量维度的处理,实现了非完美嵌套循环块间和块内的同时置换。构建了4种机器学习驱动的自动调优策略,为循环程序在指定问题规模下寻找优化的置换序和分块大小组合。默认分块大小下,扩展后的Pluto编译器并行环境下生成的最佳置换相较于Pluto的默认调度取得了最高4.02和几何平均2.12的加速比。通过进一步搜索更优的置换序和分块大小组合,最好的自动调优策略在并行环境下相较于Pluto的默认优化取得了最高5.48和几何平均2.86的加速比。此外,指定问题规模下,自动调优得到的最佳配置和学习模型应用于相似问题规模时,相较于Pluto的默认优化也取得了不同程度的性能提升。
    校级异地超算集群管理的关键技术研究与实践
    张天阳, 池成悦, 郭武, 高亦沁, 文敏华, 韦建文
    2023, 45(12): 2135-2145. doi:
    摘要 ( 161 )   PDF (1155KB) ( 266 )     
    随着高性能计算的业务增长和规模扩大,机房空间、供电能力等外部因素常常会成为集群扩容升级的制约因素,由此产生了异地超算集群的建设需求。异地超算能突破单个集群的地理限制,提供更多算力资源。基于上海交通大学“交我算”计算平台建设异地联合超算集群的实践,总结了基础设施与系统软件的统一管理方法,以及集群异地容灾的高可用设计,具体包括:适配Slurm作业调度系统、Open OnDemand可视化门户站点、扩展LDAP等基础服务的高可用能力,以及建设分层汇聚监控系统。最后,从数据传输、用户体验和平台可用性3个维度展示了异地超算集群方案的有效性。

    软件工程
    基于C语言程序分析验证技术的Verilog代码验证方法
    邓茜, 范广生, 陈立前, 李暾, 王戟
    2023, 45(12): 2146-2154. doi:
    摘要 ( 209 )   PDF (687KB) ( 362 )     
    传统的硬件验证方法将RTL设计综合成门级网表并使用SAT求解器进行验证,没有有效利用其字级结构,导致部分性质不能验证。近年来,软件分析验证技术和SMT求解技术取得了长足的发展,为将最新的软件分析验证技术迁移到硬件验证上来,提出一种基于C语言程序分析验证技术的Verilog代码验证方法。首先设计一个基于综合语义的Verilog到C的转换系统;然后使用当前软件分析验证领域典型的技术与工具对转换后的C语言程序进行分析验证,以判定原Verilog代码是否满足性质断言。实验结果表明了将C语言程序分析验证技术迁移到Verilog代码验证上的可行性和有效性。

    基于领域知识的语音识别鲁棒性增强技术研究
    王斐斐, 贲可荣, 张献
    2023, 45(12): 2155-2164. doi:
    摘要 ( 153 )   PDF (863KB) ( 341 )     
    针对语音识别软件在有噪声干扰时识别准确率降低的问题,为确保使用语音控制操作的安全性,提出一种基于领域知识的语音识别鲁棒性增强方法。以舰艇操控为应用背景,建立舰艇操控领域知识图谱;从航海图书资料和经典海战影视资料中提取舰艇操控指令,构建舰艇操控指令中文语音数据集;提出一种嵌入领域知识的解码方法,通过计算识别结果与领域知识图谱的匹配度对输出控制指令进行修正。实验结果表明,相较于目前流行的连接时序分类解码方法和基于注意力机制的解码方法,所提解码方法在识别信噪比为10 dB和20 dB的带噪语音时字错误率分别下降了4.0%和1.5%,指令识别准确率分别提升了10.3%和6.3%,提高了语音识别模型识别中文指令的鲁棒性。 

    ShadowDB:基于SQL引擎的全链路压力测试分流系统
    姜俊, 李文慧, 张亮, 王善民, 李瑞远
    2023, 45(12): 2165-2174. doi:
    摘要 ( 188 )   PDF (941KB) ( 841 )     
    全链路压力测试作为一种新兴的软件测试技术,直接在生产系统中做压力测试,旨在准确评估线上环境的性能。基于影子库的数据分流技术能够保证全链路压力测试过程中生产数据不受测试污染。基于SQL引擎技术设计并实现了一套完整的针对全链路压力测试的开源数据分流系统ShadowDB,其基本思想是通过SQL解析、SQL路由对用户请求正确分流。ShadowDB目前支持6种关系型数据库系统中所有SQL语句的数据分流;提出了2种数据分流算法:基于列的影子算法和基于Hint的影子算法;实现了所有JDBC的接口,允许线上应用程序无需修改代码即可使用ShadowDB;ShadowDB嵌入应用程序中,无需网络转发请求,对请求效率影响很小,保证了全链路压力测试结果的可靠性。使用2个通用的性能测试工具进行了大量的实验,结果表明ShadowDB的性能远远高于对比方案的。

    图形与图像
    基于双解码器结构的多尺度注意力特征融合网络的视网膜血管分割#br#
    张文豪, 瞿绍军
    2023, 45(12): 2175-2185. doi:
    摘要 ( 204 )   PDF (1305KB) ( 331 )     
    针对眼底视网膜图像中血管形态不规则、难以分割的问题,提出一种基于双解码器结构的多尺度注意力特征融合网络模型,可以实现视网膜血管精确分割。双解码器分支网络结构能减少信息丢失,编码器中设计多尺度注意力特征融合模块来提取丰富的多尺度特征,结合空间注意力模块加强空间上下文信息提取,提高血管识别能力。利用挤压与激励模块对融合特征进行优化,抑制不相关特征通道,提高模型综合分割能力。在DRIVE和CHASEDB1数据集上的实验结果显示,召回率分别达到0.841 1和0.855 1,相较目前一些先进网络取得了较大进步,最大提升分别达到6.6%和8.25%。

    耦合单词与句子级文本特征的图像对抗级联生成
    白志远, 杨智翔, 栾鸿康, 孙玉宝,
    2023, 45(12): 2186-2196. doi:
    摘要 ( 124 )   PDF (1527KB) ( 262 )     
    文本生成图像旨在根据自然语言描述生成逼真的图像,是一个涉及文本与图像的跨模态分析任务。鉴于生成对抗网络具有生成图像逼真、效率高等优势,已经成为文本生成图像任务的主流模型。然而,当前方法往往将文本特征分为单词级和句子级单独训练,文本信息利用不充分,容易导致生成的图像与文本不匹配的问题。针对该问题,提出了一种耦合单词级与句子级文本特征的图像对抗级联生成模型(Union-GAN),在每个图像生成阶段引入了文本图像联合感知模块(Union-Block),使用通道仿射变换和跨模态注意力相结合的方式,充分利用了文本的单词级语义与整体语义信息,促使生成的图像既符合文本语义描述又能够保持清晰结构。同时联合优化鉴别器,将空间注意力加入到对应的鉴别器中,使来自文本的监督信号促使生成器生成更加相关的图像。在CUB-200-2011数据集上将其与AttnGAN等多个当前的代表性模型进行了对比,实验结果表明,Union-GAN的FID分数达到了13.67,与AttnGAN相比,提高了42.9%,IS分数达到了4.52,提高了0.16。

    LPD-YOLO:轻量级遮挡行人检测模型
    梁秀满, 周佳润, 杨若兰
    2023, 45(12): 2197-2205. doi:
    摘要 ( 339 )   PDF (1190KB) ( 384 )     
    在驾驶场景中,针对行人间的遮挡和尺度多变现象导致的检测精度较低、模型参数量过大和难以部署到移动端等问题,提出了一种基于YOLOv5s模型的轻量级实时行人检测模型LPD-YOLO。首先,在特征提取部分采用MES Net替换原主干网络,并在主干网络中嵌入注意力模块SA,增强网络特征提取能力;其次,在特征融合部分采用DS-ASFF结构改进原PANet,使其充分融合不同尺寸的特征图;然后,采用GS卷积代替特征融合网络中的部分标准卷积,在不影响精度的条件下,进一步减少模型参数量和计算量;最后,在预测部分使用OTA标签分配策略结合α-IOU改进原损失函数,加速模型收敛。实验结果表明,该模型相较于YOLOv5s,参数量减少了81.2%,浮点运算量降低了46.3%,模型大小减小了75.8%,检测精度提高了3.3%。单幅图像检测速度达到了13.2 ms,更好地满足了驾驶场景下密集行人的实时检测要求。

    基于改进EfficientNet的轻量型白细胞图像识别模型
    刘欢, 吴亮红, 陈亮, 周博文
    2023, 45(12): 2206-2215. doi:
    摘要 ( 146 )   PDF (1058KB) ( 284 )     
    针对白细胞识别模型的部署受到参数数量和计算的限制,导致白细胞识别准确率较低和模型泛化能力较差等问题,提出了一种基于改进EfficientNet的轻量高效的白细胞图像识别模型。首先,减少主要模块堆叠减少模型参数量,同时添加特征层间的跳跃连接保证信息的传递;其次,用改进的有效通道注意力和DropBlock2D对主要模块进行调整,使模型捕获更多通道和细节的特征信息,以提升模型的准确率和泛化能力;最后,使用带有标签平滑的交叉熵损失函数对模型进行训练,加快模型的收敛,以进一步提高模型的泛化能力。实验结果表明,改进后模型的参数量为2.49 M,较改进前减少了1.11 M,降低了模型复杂度,在混合数据集上达到了99.67%的准确率,较改进前提高了0.37%,在公共数据集BCCD2上达到了100%的准确率,高于现有的白细胞识别模型的准确率,验证了该模型在保持轻量级计算的基础上,具有较高的准确率和良好的泛化能力。

    人工智能与数据挖掘
    一种多策略融合的人工蜂鸟算法
    刘琰, 张姣, 姜胜腾, 潘筱茜, 赵海涛, 魏急波
    2023, 45(12): 2216-2225. doi:
    摘要 ( 179 )   PDF (856KB) ( 410 )     
    为提升基本人工蜂鸟算法的收敛速度和求解精度,提出了一种多策略融合的人工蜂鸟算法。首先,利用混沌反向交流策略初始化蜂鸟位置,提高初始种群的多样性;然后,通过概率动态调节函数控制蜂鸟的引导觅食和区域觅食行为,并且引入自适应螺旋改进迁移觅食行为,协调全局探索与局部搜索能力;最后,利用柯西高斯变异策略对最优蜂鸟的位置进行扰动,提高算法跳出局部最优的能力。利用9个基准测试函数进行仿真实验,并与其他5种最新的优化算法进行对比。仿真结果表明,所提算法的收敛速度更快、求解精度更高、稳定性更强。

    基于卷积注意力机制的双模态音乐流派分类模型MGTN
    焦佳辉, 马思远, 宋玉, 宋伟
    2023, 45(12): 2226-2236. doi:
    摘要 ( 189 )   PDF (1185KB) ( 343 )     
    在音乐信息检索(MIR)领域,根据音乐流派进行分类是一项具有挑战性的任务。传统的音频特征工程方法需要手动地选择并提取音乐信号特征进行处理,导致特征提取过程复杂,模型性能不稳定,泛化性差。深度学习与频谱图相结合的方法也有着部分数据不适合模型和全局特征提取困难等问题。提出了一种基于卷积注意力机制的音乐流派分类模型MGTN。MGTN融合了输入频谱图与提取音频信号特征构建音频时序数据2种音乐流派分类方法,使得模型提取特征的能力与泛化性大大提升,提供了音乐流派分类的新思路。在GTZAN与Ballroom数据集上的实验结果表明,MGTN模型能够有效地融合2种不同模态的输入数据。在与数十种基准模型进行的对比中,MGTN模型具备较强的优势。

    基于信息启发的目标导向Bi-RRT机器人路径规划
    李中华, 袁杰, 郭振宇
    2023, 45(12): 2237-2245. doi:
    摘要 ( 130 )   PDF (2768KB) ( 313 )     
    针对双向快速搜索随机树(Bi-RRT)算法节点扩展的随机性和盲目性导致路径规划效率低、路径粗糙的问题,提出一种基于信息启发的目标导向Bi-RRT算法。首先,为降低节点扩展的随机性和盲目性,优化了树节点的扩展方式,采用回归分析生成的节点信息优化扩展节点评价函数,以强化节点生长的目标趋向性,并由节点与环境代价约束扩展方向。然后,采用分支定界思想剔除初始路径中的冗余节点,得到满足最大转向角约束的路径,并运用B样条曲线进行路径平滑,提高路径的平滑性和连续性。最后,基于MATLAB仿真平台对本文算法和经典路径规划算法在不同环境中进行了实验对比,实验结果验证了本文算法的有效性及可执行性。

    面向多方面的双通道知识增强图卷积网络模型
    陈景景, 韩虎, 徐学锋
    2023, 45(12): 2246-2255. doi:
    摘要 ( 137 )   PDF (943KB) ( 280 )     
    基于方面的情感分析是一项细粒度的情感分析任务,旨在将方面与相应的情感词对齐,以进行特定于方面的情感极性推理。近年来,借助句法依赖信息的图神经网络情感分类方法成为该领域的一个研究热点,但是由于评论语句在内容表达和句法结构上的灵活性,仅利用句法依赖信息的建模方法仍然存在一定的不足。为了发挥情感知识与结构语义信息对评论语句的增强作用,提出一种双通道知识增强图卷积网络模型DualSyn-GCN。一方面根据方面与方面、方面与上下文之间的隐含关系进行句法依赖邻接矩阵的增强,另一方面从外部情感知识对方面的情感依赖进行学习,随后对2种不同增强表示进行融合,从而实现不同表示间的共享与互补。实验结果表明,相较于经典的基于特定方面的图卷积网络模型(ASGCN),该模型在LAP14数据集上的准确率和MF1值分别提升了2.34%和3.26%。

    基于子句活跃度和复杂度的多元动态演绎算法及应用
    林玲瑜, 曹锋, 易见兵, 方旺盛, 李俊, 吴贯锋
    2023, 45(12): 2256-2264. doi:
    摘要 ( 140 )   PDF (540KB) ( 248 )     
    一阶逻辑自动定理证明是知识表示与自动推理领域重要的研究内容,如何有效选取子句参与演绎是提升自动推理能力和效率的研究热点。基于多元动态演绎良好的演绎特性,通过分析子句的变元项性质和函数项结构,提出了一种子句活跃度和复杂度的度量与计算方法,能很好地对不同项结构的子句进行有效评估;基于该子句评估方法,提出了一种子句充分协同演绎的多元动态演绎算法,能有效优化多元演绎搜索路径。将该多元动态演绎算法应用于国际顶尖证明器Eprover 2.6中,以2021年国际自动推理FOF组竞赛例为测试对象,在标准的300 s测试时间内,加入了多元动态演绎算法的Eprover 2.6相比原始Eprover 2.6多证明定理4个,在证明定理总数相同的条件下,平均证明时间减少了1.12 s;能证明Eprover 2.6未证明定理16个,占未证明定理总数的15.1%。实验结果表明,该多元动态演绎算法是一种有效的推理方法,能在一定程度上提升自动定理的证明能力和时间效率。

    多尺度深度特征融合的个人信用风险预测
    陈巩, 李占利, 朱莉
    2023, 45(12): 2265-2273. doi:
    摘要 ( 193 )   PDF (721KB) ( 433 )     
    随着中国信贷业务的发展,贷款的违约风险评估已成为一项至关重要的任务。由于金融信用数据特征较多,而不同的特征之间可能存在复杂的内在联系。传统机器学习方法与集成学习方法的有效性依赖于特征的选择,忽略了数据的内在联系,而且特征选择也会造成信息丢失。针对以上问题,提出了一种多尺度深度特征融合的特征提取器。首先,对一维数据进行多尺度卷积,充分地提取特征之间的内在联系,并进行注意力融合,以获取更为关键的特征。然后,利用集成学习XGBoost分类器对深层次抽象特征进行分类,最终获得预测结果。在真实数据集上进行评估的实验结果表明,多尺度深度特征融合方式能够更好地预测个人信用风险,与传统机器学习方法和XGBoost模型相比,其AUC与KS值均有所提高。

    基于元学习和图滤波器的节点分类研究
    王英, 陈文祺, 韩耀郴
    2023, 45(12): 2274-2280. doi:
    摘要 ( 129 )   PDF (532KB) ( 255 )     
    (1.College of Computer Science and Technology,Jilin University,Changchun 130012;
    2.Key Laboratory of Symbol Computation and Knowledge Engineering of 
    Ministry of Education,Jilin University,Changchun 130012,China)