GitHub3D & Spatial Computingtech-infocode

Junyi42/LoGeR

Junyi42·@Junyi42·Mar 12, 2026

개요 LoGeR(Long-Context Geometric Reconstruction with Hybrid Memory)는 긴 시퀀스의 이미지로부터 3D 기하학적 재구성을 수행하는 모델의 재구현 프로젝트다. 하이브리드 메모리 구조를 활용하여 수백 장 이상의 프레임에서도 일관된 3D 복원을 가능하게 한다. GitHub에서 453개의 스타를 받으며 커뮤니티의 관심을 끌고 있다.

핵심 내용 기존 3D 재구성 파이프라인은 입력 프레임 수가 많아질수록 메모리와 연산량이 급격히 증가하는 문제를 갖고 있었다. LoGeR는 이를 해결하기 위해 하이브리드 메모리 메커니즘을 도입한다. 단기 메모리(short-term memory)로 인접 프레임 간의 정밀한 대응 관계를 유지하면서, 장기 메모리(long-term memory)로 전체 시퀀스의 글로벌 일관성을 확보한다. Python으로 구현되어 있으며, 긴 비디오 시퀀스에서의 카메라 포즈 추정과 밀집 포인트 클라우드 생성을 동시에 처리할 수 있다.

기존 대비 차별점 DUSt3R이나 MASt3R 같은 기존 접근법은 프레임 쌍 단위로 동작하거나 윈도우 크기에 제한이 있었다. LoGeR는 하이브리드 메모리 아키텍처를 통해 이론적으로 무제한에 가까운 프레임을 처리할 수 있으며, 메모리 효율성과 재구성 품질 사이의 균형을 동적으로 조절한다. 장문맥(long-context)이라는 LLM 분야의 개념을 3D 비전에 성공적으로 적용한 점이 흥미롭다.

활용 가능성 대규모 실내외 환경의 3D 스캔, 드론 영상 기반 지형 모델링, 자율주행 차량의 장거리 맵 구축 등에 활용할 수 있다. 특히 Gaussian Splatting 파이프라인의 전처리 단계에서 카메라 포즈와 초기 포인트 클라우드를 생성하는 용도로 통합 가능하다.

참고 자료 - GitHub 저장소 ===

Python453
#geometric-reconstruction#long-context#hybrid-memory#python

Related in 3D & Spatial Computing