南加大提出NeROIC：还有什么不能渲染的？重建效果太强悍了

发布时间：2022-01-13 07:00:00 ，浏览量：2

点击上方“3D视觉工坊”，选择“星标”
干货第一时间送达


作者丨AI_stduy
来源丨 AI算法与图像处理

大家好，我是阿潘，今天给大家分享一篇最新的成果NeROIC，号称可以从在线图像集合获取对象表示的新方法，从具有不同相机、照明和背景的照片中捕获任意对象的高质量几何和材料属性！

太牛了吧，不得不说今年的NeRF相关的工作特别多，效果非常的惊艳！元宇宙又加一分！

论文标题：

NeROIC: Neural Object Capture and Rendering from Online Image Collections

论文和主页链接（代码链接未公布）：

https://arxiv.org/abs/2201.02533

https://formyfamily.github.io/NeROIC/

效果：

借助材质属性，我们能够使用新的光照环境重新渲染对象，结果如图 8 所示。

即使我们的输入图像是在完全不同的环境中捕获的，我们的模型也能处理这项具有挑战性的任务，产生高质量和合理的合成结果。

摘要

我们提出了一种从在线图像集合中获取对象表示的新方法，从具有不同相机、照明和背景的照片中捕获任意对象的高质量几何和材料属性。这使得各种以对象为中心的渲染应用程序成为可能，例如从具有挑战性的野外输入中获得新颖视图合成、重新照明和协调背景合成。使用扩展神经辐射场的多阶段方法，我们首先推断表面几何形状并细化粗略估计的初始相机参数，同时利用粗略的前景对象掩码来提高训练效率和几何质量。我们还引入了一种稳健的法线估计技术，该技术消除了几何噪声的影响，同时保留了关键细节。最后，我们提取表面材料属性和环境照明，以球谐函数表示，并带有处理瞬态元素的扩展，例如锐利的阴影。这些组件的结合产生了一个高度模块化和高效的对象获取框架。广泛的评估和比较证明了我们的方法在捕获对渲染应用程序有用的高质量几何和外观属性方面的优势。

整体思路

框架图：

给定一组粗略校准的图像和相应的前景蒙版，我们的几何网络计算具有静态和瞬态分量的神经辐射场，并细化相机参数 (a)。然后，我们基于网格的法线提取层从学习的密度场 (b) 中估计表面法线。最后，我们修复了物体的几何形状，并在渲染网络中使用估计的法线作为监督，在其中我们推断照明条件（表示为球谐系数）、表面材料属性（使用 Phong 渲染模型）和高质量表面法线 (c)。

具体来说：

这里的两阶段模型将来自不同条件的对象图像作为输入。利用其他 state-of-the-art 方法获取的图像的相机位姿和对象前景蒙版，我们首先通过训练基于 NeRF 的网络优化扫描对象的几何形状并细化相机位姿；然后我们使用我们的法线提取层从几何体（由密度函数表示）计算表面法线；最后，我们的第二阶段模型分解了物体的材料属性，并解决了每个图像的光照条件。

本文仅做学术分享，如有侵权，请联系删文。

3D视觉精品课程推荐：

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线！(单模态+多模态/数据+代码) 3.彻底搞透视觉三维重建：原理剖析、代码讲解、及优化改进 4.国内首个面向工业级实战的点云处理课程 5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解 6.彻底搞懂视觉-惯性SLAM：基于VINS-Fusion正式开课啦 7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化 8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法：算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼）

13.重磅！四旋翼飞行器：算法与实战

重磅！3DCVer-学术论文写作投稿交流群已成立

扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注：研究方向+学校/公司+昵称，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近4000星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用，麻烦给个赞和在看~

关注

打赏

1655516835

查看更多评论

南加大提出NeROIC：还有什么不能渲染的？重建效果太强悍了

最近更新

热门博客

[ 申请 ]友情链接：