转载自丨我爱计算机视觉
文章分享 CVPR 2022 Oral 论文『Surface Representation for Point Clouds』,波士顿东北大学联合腾讯优图提出 RepSurf 的两个变体,Triangular 和 Umbrella RepSurf,用来探索点云上的表面表示。
关注并回复220915,获取论文及代码地址
01 摘要
大多数先前的工作通过坐标表示点云的形状。然而,直接利用坐标描述局部几何是不充分的。在本文中,我们提出了 RepSurf(representative surface),这是一种新颖的点云表示,显式的描述了非常局部的点云结构。
我们探索了 RepSurf 的两种变体,Triangular RepSurf 和 Umbrella RepSurf,其灵感来自计算机图形学中的三角形网格和伞形曲率。我们在表面重建后通过预定义的几何先验计算 RepSurf 的表征。RepSurf 可以成为绝大多数点云模型的即插即用模块,这要归功于它与无规则点集的自由协作。
基于 PointNet++(SSG 版本)的简单基线,Umbrella RepSurf 在各种基准上的分类、分割和检测在性能和效率方面都大大超过了之前的 state-of-the-art。在只有0.008M参数数量、0.04G FLOPs 和 1.12ms推理时间的增的情况下,我们的方法在分类数据集 ModelNet40 上达到 94.7% (+0.5%),在 ScanObjectNN 上达到 84.6% (+1.8%) ;而在分割任务的 S3DIS 6-fold 上达到74.3%(+0.8%) mIoU,在ScanNet 上达到70.0% (+1.6%) mIoU 。
对于检测任务,我们的 RepSurf 应用于最先进的检测器,并在 ScanNetV2 上达到71.2% (+2.1%) mAP25、54.8% (+2.0%) mAP50 和在 SUN RGB-D数据集上64.9% (+1.9%) mAP25、47.7% (+ 2.5%) mAP50的性能。我们的轻量级Triangular RepSurf 在这些基准测试中同样表现出色。
02 介绍
对原始点云表征(Point Cloud Representation)的处理因其在自动驾驶、增强现实和机器人技术等各种应用中的优势而引起了相当大的关注。但是,点云局部表征的不稳定性使得这个任务非常有难度。
局部形状对于点云的学习至关重要。为了从局部结构信息中学习,一些先前的工作从Grid(例如PointCNN)、Relation(例如RS-CNN)或Graph(例如DGCNN)中学习。
然而,这些方法通过加入更多成分(如欧几里得距离、注意力机制)或应用各种变换(如图形构造、体素化)隐式地从点云shape中提取局部特征。这些可能导致复杂的预处理或大量计算。我们认为这可能会导致在预定义成分时遗漏信息,或在转换过程中损失几何形状。因此,本文探索了更稳定的显式点云局部表征。
03 动机
我们首先受到泰勒级数的启发。泰勒级数用导数表示局部曲线。为了简化它,我们只考虑到二阶导数。因此,我们可以通过其对应的切线粗略地表示局部曲线,或者我们称之为 3D 点云中的“surface”。
04 方法
为了将2D Curve扩展到3D Surface,我们引入了两种RepSurf变体(Triangular RepSurf和Umbrella RepSurf)来近似的描述点云局部特征:
两种RepSurf的实现也非常简洁:
05 实验
RepSurf分别在3D分类(ModelNet40,ScanObjectNN)、分割(S3DIS,ScanNet)、检测(ScanNetV2,SUN RGBD)上达到了不俗的效果:
06 结论
我们希望我们的工作能够激发3D社区并唤起对点云的显示表征的重新思考。我们认为 RepSurf 值得在不同领域(例如自动驾驶)或更大规模的点云上进行进一步探索,因为 RepSurf 有能力去处理真实场景中的大量背景点。RepSurf 还可以通过其对几何敏感度的能力对点云采样带来帮助。
本文仅做学术分享,如有侵权,请联系删文。
干货下载与学习
后台回复:巴塞罗那自治大学课件,即可下载国外大学沉淀数年3D Vison精品课件
后台回复:计算机视觉书籍,即可下载3D视觉领域经典书籍pdf
后台回复:3D视觉课程,即可学习3D视觉领域精品课程
3D视觉工坊精品课程官网:3dcver.com
1.面向自动驾驶领域的多传感器数据融合技术
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码) 3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进 4.国内首个面向工业级实战的点云处理课程 5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解 6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦 7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化 8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
9.从零搭建一套结构光3D重建系统[理论+源码+实践]
10.单目深度估计方法:算法梳理与代码实现
11.自动驾驶中的深度学习模型部署实战
12.相机模型与标定(单目+双目+鱼眼)
13.重磅!四旋翼飞行器:算法与实战
14.ROS2从入门到精通:理论与实战
15.国内首个3D缺陷检测教程:理论、源码与实战
16.基于Open3D的点云处理入门与实战教程
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿,加微信:dddvision
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~