计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (10): 1822-1829.
韩慧妍1,2,3,王文俊1,2,3,韩燮1,2,3,况立群1,2,3,薛红新1,2,3
HAN Hui-yan1,2,3,WANG Wen-jun1,2,3,HAN Xie1,2,3,KUANG Li-qun1,2,3,XUE Hong-xin1,2,3
摘要: 针对抓取任务中难以区分多个紧邻物体及高维位姿学习准确率差的问题,提出一种融合语义实例重建的抓取位姿估计方法。增加语义实例重建分支对前景完成隐式三维重建,并以投票方式预测每个前景点所属实例的中心坐标,以区分紧邻物体;提出一种高维位姿的降维学习方法,使用2个正交单位向量分解三维旋转矩阵,提升位姿学习准确率;搭建融合语义实例重建的抓取检测网络SIRGN,并在VGN仿真抓取数据集上完成训练。实验结果表明,SIRGN在拥挤(Packed)和堆叠(Pile)场景的抓取成功率分别达到了89.5%和78.1%,且在真实环境具有良好的适用性。