您当前的位置: 首页 >  ar

暂无认证

  • 0浏览

    0关注

    95907博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

STD:Sparse-to-Dense 3D Object Detector for Point Cloud(腾讯&香港大学)

发布时间:2020-03-02 08:00:00 ,浏览量:0

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

原文地址:https://arxiv.org/abs/1907.10471

主要思想

本文提出了一种新的两阶段3D目标检测框架,称之为稀疏到稠密三维目标检测框架(STD)。第一个阶段是自下而上的proposal生成网络,该网络使用原始点云作为输入,通过为每个点播种新的球形anchor来生成准确的proposal。与以前的工作相比,该算法具有较高的计算量和较少的计算量。然后,PointsPool将proposal特征的内部点特征从稀疏表达式转换为紧凑表示来生成proposal features,这样可以节省更多的计算时间。在第二阶段的box预测中,本文实现了一个并行交并(IoU)分支,以提高定位精度,从而进一步提高性能。在KITTI数据集上进行了实验,并从三维物体和鸟瞰图(BEV)检测两个方面对STD进行了评价。本文的方法在很大程度上优于其他技术,特别是在硬件上,推理速度超过了10 FPS。

创新点

本文的创新点主要有以下四点:

1. 提出了一种基于点的球形anchor点云目标检测方案生成模型,它是通用的,以实现高召回率。

2. PointsPool层集成了基于点和体素的方法的优点,实现了高效和有效的预测。

3. 新的3D IoU预测分支有助于分类score和定位之间的对齐,从而带来显著的改进。

4. 在KITTI数据集上的实验结果表明, STD框架处理了许多具有高遮挡和拥挤度的挑战性案例,性能达到了SOTA。此外,STD在10 FPS的速度下可以获得良好的性能。

网络结构

现有的3D物体检测方法主要是将点云投影到不同的视图中,或者将它们分割成体素。相反,本文设计了一个通用的策略来独立地基于每个点播种anchor。

然后利用每个锚的内部点的特征来生成proposal,通过这种结构,保留了足够的上下文信息,即使只有少量的proposal,也能实现较好的召回。

如上图所示,STD主要包括特征提取模块、Proposal Generation Moudle、PointsPool模块以及分类回归模块,网络的输入为整幅点云。

针对特征提取模块:论文采用PointNet++网络来对点云特征进行处理,输出Points Score Mask和Points Feature部分。

针对PGM部分: 独立地基于每个点来播种球形anchor,球形anchor的数量与预定义的参考框方向的数量不成正比,导致anchor的数量减少约50%。在计算量大大减少的情况下,与传统anchor相比,球形anchor具有更高的召回率。紧接着,利用每个anchor的内点特征生成proposal。

针对PointsPool模块:PointsPool层由三个步骤组成,第一步随机为每个proposal选择N个内点,以它们的标准坐标和语义特征作为初始特征。对于每个proposal,通过减去其中心(X;Y;Z)值并将其旋转到proposal预测的方向来获得点规范位置。这些规范化的坐标使模型在几何变换下具有鲁棒性,并且能够意识到内部点的相对位置,从而比仅使用语义特征获得更好的性能。

针对分类回归模块: 主要包括IoU估计和类别位置的预测。IoU分支用来预测box和相应的Ground Truth之间的3D IoU。然后,将每个box的分类分数与其3D IoU相乘作为新的排序标准。该设计消除了定位精度与经典核之间的差异,有效地提高了系统的性能。后期对分类回归的box进行NMS处理,完成最终的检测。

实验结果

本文的实验数据共有7481幅训练图像/点云和7518幅测试图像/点云,分为汽车、行人和自行车三类。使用平均精度(AP)度量来比较不同的方法。在评估过程中,遵循官方的KITTI评估协议。也就是说,针对汽车,IoU阈值为0.7;针对行人和自行车IoU阈值为0.5。

KITTI数据集下多模型性能对比:

上述内容,如有侵犯版权,请联系作者,会自行删文。

推荐阅读:

吐血整理|3D视觉系统化学习路线

那些精贵的3D视觉系统学习资源总结(附书籍、网址与视频教程)

超全的3D视觉数据集汇总

大盘点|6D姿态估计算法汇总(上)

大盘点|6D姿态估计算法汇总(下)

机器人抓取汇总|涉及目标检测、分割、姿态识别、抓取点检测、路径规划

汇总|3D点云目标检测算法

汇总|3D人脸重建算法

那些年,我们一起刷过的计算机视觉比赛

总结|深度学习实现缺陷检测

深度学习在3-D环境重建中的应用

汇总|医学图像分析领域论文

大盘点|OCR算法汇总

重磅!3DCVer-知识星球和学术交流群已成立

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导,550+的星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

欢迎加入我们公众号读者群一起和同行交流,目前有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加群或投稿

关注
打赏
1655516835
查看更多评论
立即登录/注册

微信扫码登录

0.0481s