DeepFlame：基于深度学习和高性能计算的反应流模拟开源平台

计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (11): 1901-1907.

DeepFlame：基于深度学习和高性能计算的反应流模拟开源平台

毛润泽1,吴子恒1,徐嘉阳2,章严3,陈帜1,2

(1.北京大学工学院，北京 100871；2.北京科学智能研究院，北京 100083；
3.中物院高性能数值模拟软件中心，北京 100088)

收稿日期:2024-03-10 修回日期:2024-05-16 接受日期:2024-11-25 出版日期:2024-11-25 发布日期:2024-11-20
基金资助:
国家自然科学基金(52276096,92270203,523B2062);光合基金C (202302032372)

DeepFlame: An open-source platform for reacting flow simulations empowered by deep learning and high-performance computing

MAO Run-ze1,WU Zi-heng1,XU Jia-yang2,ZHANG Yan3,CHEN Zhi1,2

(1.College of Engineering,Peking University,Beijing 100871；2.AI for Science Institute,Beijing 100083；
3.CAEP Software Center for High Performance Numerical Simulation,Beijing 100088，China)

Received:2024-03-10 Revised:2024-05-16 Accepted:2024-11-25 Online:2024-11-25 Published:2024-11-20

摘要/Abstract

摘要： 近年来，深度学习被广泛认为是加速反应流模拟的一种可靠方法。近期开发了一个名为DeepFlame的开源平台，可以在模拟反应流过程中实现对机器学习库和算法的支持。基于DeepFlame，成功地采用深度神经网络来计算化学反应源项，并对DeepFlame平台进行了高性能优化。首先，为了充分发挥深度神经网络（DNN）的加速潜力，研究实现了DeepFlame对DNN多卡并行推理的支持，开发了节点内分割算法和主从通信结构，并完成了DeepFlame向图形处理单元（GPU）和深度计算单元（DCU）的移植。其次，还基于Nvidia AmgX库在GPU上实现了偏微分方程求解和离散稀疏矩阵构造。最后，对CPU-GPU/DCU异构架构上的新版本DeepFlame的计算性能进行了评估。结果表明，仅利用单个GPU卡，在模拟具有反应性的泰勒格林涡（TGV）时可以实现的最大加速比达到15。

关键词: 计算流体力学, 反应流动, 深度神经网络, GPU, 偏微分方程

Abstract: In recent years, deep learning has been widely recognized as a reliable approach to accele- rate reacting flow simulations. In recent work, this paper has developed an open-source platform named DeepFlame, which supports machine learning libraries and algorithms during the simulation of reacting flows. Leveraging DeepFlame, this paper has successfully employed deep neural networks (DNNs) to compute chemical reaction source terms. This paper focus on optimizing the platform for high-performance. Firstly, to fully harness the acceleration potential of DNNs this paper implements support for multi-GPU parallel inference in DeepFlame, developing intra-node partitioning algorithms and a master-slave communication structure, and complete the migration to Graphics Processing Units (GPUs) and Deep Computing Units (DCUs). Furthermore, this paper implements the solution of partial differential equations and the construction of discrete sparse matrices on GPUs based on the Nvidia AmgX library. Finally, this paper evaluates the computational performance of the updated DeepFlame on a CPU-GPU/DCU heterogeneous architecture. The results indicate that using a single GPU card alone can achieve a maximum speedup of up to 15 times when simulating a reactive Taylor Green Vortex (TGV).

Key words: computational fluid dynamics, reacting flows, deep neural network, graphics computing unit, partial differential equations

毛润泽, 吴子恒, 徐嘉阳, 章严, 陈帜, . DeepFlame：基于深度学习和高性能计算的反应流模拟开源平台[J]. 计算机工程与科学, 2024, 46(11): 1901-1907.

MAO Run-ze, WU Zi-heng, XU Jia-yang, ZHANG Yan, CHEN Zhi, . DeepFlame: An open-source platform for reacting flow simulations empowered by deep learning and high-performance computing[J]. Computer Engineering & Science, 2024, 46(11): 1901-1907.

编辑推荐

Metrics

阅读次数

全文

298

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	298

来源	本网站	其他网站

次数	225	73
比例	76%	24%

摘要

277

最新录用	在线预览	正式出版

0	0	277

	来源	本网站

	次数	277
	比例	100%

[1]	罗婧, 叶志晟, 杨泽华, 傅天豪, 魏雄, 汪小林, 罗英伟, . 研发类GPU集群任务数据集的构建及分析[J]. 计算机工程与科学, 2024, 46(12): 2128-2137.
[2]	王鹏, 张嘉诚, 范毓洋, . 适应于硬件部署的神经网络剪枝量化算法[J]. 计算机工程与科学, 2024, 46(09): 1547-1553.
[3]	李猛, 刘姿邑, 宋宇航. 基于双重自表达与最大熵原理的深度子空间聚类算法[J]. 计算机工程与科学, 2024, 46(09): 1685-1692.
[4]	辛高枫, 刘玉潇, 张青龙, 韩锐, 刘驰. 边缘侧神经网络块粒度领域自适应技术研究[J]. 计算机工程与科学, 2024, 46(08): 1361-1371.
[5]	姜晶菲, 何源宏, 许金伟, 许诗瑶, 钱希福. NM-SpMM：面向国产异构向量处理器的半结构化稀疏矩阵乘算法[J]. 计算机工程与科学, 2024, 46(07): 1141-1150.
[6]	吴瑕, 郑洪英, 肖迪. 一种基于认证文件的双方验证模型水印方案[J]. 计算机工程与科学, 2024, 46(04): 647-656.
[7]	王宇华, 何俊飞, 张宇琪, 徐悦竹, 崔环宇. DRM:基于迭代归并策略的GPU并行SpMV存储格式[J]. 计算机工程与科学, 2024, 46(03): 381-394.
[8]	曹健, 陈怡梅, 李海生, 蔡强, . 基于图神经网络的行人轨迹预测研究综述[J]. 计算机工程与科学, 2023, 45(06): 1040-1053.
[9]	马铭苑, 李虎, 王梓斌, 况晓辉. 深度神经网络模型后门植入与检测技术研究综述[J]. 计算机工程与科学, 2022, 44(11): 1959-1968.
[10]	张勇, 张曦, 万云博, 何先耀, 赵钟, 卢宇彤. 非结构有限体积CFD计算的网格重排序优化[J]. 计算机工程与科学, 2022, 44(10): 1721-1729.
[11]	文敏华, 陈江, 胡广超, 韦建文, 王一超, 林新华. 面向CFD应用的Intel持久内存性能评估[J]. 计算机工程与科学, 2022, 44(09): 1550-1556.
[12]	张开生, 赵小芬. 复杂环境下基于自适应深度神经网络的鲁棒语音识别[J]. 计算机工程与科学, 2022, 44(06): 1105-1113.
[13]	翦杰, 罗章, 赖明澈, 肖立权, 徐炜遐. 基于深度神经网络的高速信道自适应均衡器[J]. 计算机工程与科学, 2022, 44(04): 605-610.
[14]	朱浩, 周博洋, 卢雪山, 杜溢墨. OpenCL计算软件栈评估[J]. 计算机工程与科学, 2021, 43(12): 2105-2114.
[15]	杜鹏, 李超, 石剑平, 姜麟. 基于阿当姆斯捷径连接的深度神经网络模型压缩方法[J]. 计算机工程与科学, 2021, 43(11): 2043-2048.