朱虎明,程新跃,舒德龙,蒋翔宇
ZHU Huming,CHENG Xinyue,SHU Delong,JIANG Xiangyu
摘要: 针对复杂场景下三维目标检测存在的误检漏检率高和单卡模型训练时间长等问题,本文提出基于多编码特征融合的两阶段算法 (3D object detection based on Multi-encoding Feature Fusion,MFF)。MFF利用三维稀疏卷积体素编码器与多尺度支柱编码器分层提取点云特征,并通过 Transformer 注意力机制捕获全局语义依赖关系。在 nuScenes 数据集上,MFF 实现了 64.7% mAP 与 69.7% NDS,检测精度显著优于同类算法。针对训练效率瓶颈,MFF 采用分布式数据并行(DDP)框架,结合 Ring-Allreduce 通信策略与 Warmup 学习率优化策略,在 64 卡并行训练场景下,相较于 8 卡训练获得了 6.89 倍加速比,训练时间大幅缩短,有效克服了大规模模型训练的资源限制。实验充分验证了 MFF 在检测精度与训练效率上的双重突破性提升,为自动驾驶环境感知提供了高性能与高效率并重的解决方案。