Home Review Ideas

X3D & Spatial Computingtech-infovideo

#ICLR2026

Chuanxia Zheng·@ChuanxiaZ·Mar 7, 2026

개요 ICLR 2026에서 발표된 NOVA3R은 기존 Amodal3R의 장면 단위(scene-level) 확장 버전으로, 이미지에서 보이지 않는 가려진(occluded) 영역의 3D 형상까지 추론하여 복원하는 기술이다. 물리적으로 타당한 3D 구조를 생성하면서 중복 구조물 문제를 크게 줄인 것이 핵심이다.

핵심 내용 기존 3D 재구성 기술은 카메라에 보이는 표면만 복원하기 때문에, 가구 뒤편이나 겹쳐진 물체의 뒷면 같은 가려진 부분은 빈 공간이나 왜곡된 형태로 남는 문제가 있었다. NOVA3R은 Amodal Reasoning(비모달 추론)을 도입하여 관찰되지 않은 영역의 기하학적 구조를 학습 기반으로 예측한다. 이를 통해 단일 또는 소수의 뷰에서도 완전한 장면 구조를 재구성할 수 있다. 또한 기존 방법들에서 흔히 발생하던 동일 구조가 여러 번 중복 생성되는 아티팩트를 억제하여 물리적으로 더 그럴듯한 결과물을 만들어낸다.

기존 대비 차별점 이전 버전인 Amodal3R이 개별 객체 단위의 비모달 복원에 집중했다면, NOVA3R은 이를 장면 전체로 확장했다. 복수의 객체가 서로 가리는 복잡한 실내·실외 장면에서도 일관된 3D 모델을 생성하며, 중복 구조물 생성 비율이 기존 대비 크게 감소했다. ICLR 2026 수록 논문으로 학술적 검증을 거친 점도 신뢰성을 더한다.

활용 가능성 로보틱스에서 가려진 물체의 위치·형태를 추정하는 데 활용할 수 있고, AR/VR 환경 구축 시 불완전한 스캔 데이터를 보완하는 데도 유용하다. 자율주행 시나리오에서 차량이나 보행자 뒤에 가려진 장애물 예측, 건축·문화재 복원에서 손상된 부분의 원형 추정 등 다양한 영역에 적용 가능하다.

참고 자료 - 원본 트윗 - 프로젝트 페이지 - 논문 (arXiv) ===

#amodal-reasoning#scene-reconstruction#iclr#occluded-geometry

Links

https:// wrchen530.github.io/nova3r/https:// arxiv.org/pdf/2603.04179

원본 보기 ↗

Related in 3D & Spatial Computing

A client hands you a single, cluttered photo of their living room and asks what it would look like r

@wildmindai

LEGO-SLAM: Language-Embedded Gaussian Optimization SLAM

@rsasaki0109

엔비디아 연구진이 텍스트와 물리적 제약 조건을 통해 고품질 3D 모션을 생성하는 모션 디퓨전 모델 'Kimodo'를 공개했습니다.

@choi.openai

DepthViz 2.0 출시

@orcawalk