计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (4): 706-717.
朱小杰1,2,程振京1,王华进1,杨刚1,田尧1,樊东卫3,米琳莹3,梁兆基1,2
ZHU Xiaojie1,2,CHENG Zhenjing1,WANG Huajin1,YANG Gang1,TIAN Yao1,FAN Dongwei3,MI Linying3,LIANG Zhaoji1,2
摘要: 大数据技术与科学数据的融合催生了诸多科学研究的新范式,也带来了对科学数据进行跨中心协同分析的广泛需求。科学数据跨中心协同分析面临跨中心数据流转不畅、跨框架异构计算困难和跨中心作业调度效率不高等技术挑战,同时要确保分析过程的可信性。为应对这些技术挑战,研制了科学数据跨中心协同分析服务系统BigFlow,该系统采用跨中心分布式架构,配备跨框架工作流执行引擎,实现了工作流跨域的可信执行。基于大规模天文星表交叉证认及黄河流域淤地坝位置识别等应用场景,对系统的跨中心协同分析能力进行了测试与验证。