计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (11): 2019-2028.
李贺,陈品同,余荣,谭北海
LI He,CHEN Pintong,YU Rong,TAN Beihai
摘要: 感知系统作为自动驾驶的关键组成部分,直接影响车辆对周围环境的理解,是实现安全可靠自动驾驶的基础。相比传统2D图像检测感知技术提供的有限信息,3D感知可以提供更丰富的感知数据,但也存在空间信息融合不充分与时序信息利用不足的关键问题。提出一种融合时空信息的多视角3D感知网络,该网络包括多视角环视3D感知网络与时空融合网络MVSPNet。多视角环视感知网络可以通过精确的空间视角转换,高效地融合多相机图像数据,以构建统一鸟瞰图空间表征,实现多个相机数据的空间对齐和融合。相较于当前先进的单目基准模型FCOS3D,所提出网络的全类平均精度mAP达到了0.343,相对提升了14.7%。时空融合网络MVSPNet可以实现时序上多视角的图像融合,融合多帧数据,进一步显著提升了网络性能,融合2帧时序数据,mAP进一步提升了10.2%。实验结果充分证明了所设计的网络在有效融合多视角空间信息与时序信息方面的先进性,为提升自动驾驶系统在动态复杂场景下的3D感知提供了有效的解决方案,对推动安全、可靠的自动驾驶技术发展具有重要意义。