[논문 리뷰] Zero-1-to-3: Zero-shot One Image to 3D Object | Single-view object reconstruction
·
🏛 Research/Generative AI
1. 연구 주제와 주요 기여 Zero-1-to-3는 단 하나의 RGB 이미지로부터 새로운 카메라 시점에서의 이미지를 생성하고, 나아가 3D 복원까지 수행할 수 있는 zero-shot 프레임워크이다. 기존에는 멀티 뷰 또는 3D 정보가 필요했던 문제를, Stable Diffusion과 같은 대규모 사전학습 모델을 활용해 제약 없이 학습하지 않은 데이터에서도 일반화 성능을 확보한다는 점이 주요 차별점이다. ✅ 주요 기여Stable Diffusion을 활용하여 camera viewpoint control이 가능한 조건부 image-to-image 변환 학습Zero-shot 3D reconstruction을 위한 viewpoint-conditioned diffusion 모델 제안Objaverse 기반 학습 후에..
[3D Vision] 3D 데이터 구조(Mesh, Point Cloud)와 포맷(OBJ, PLY, PCD)
·
📖 Fundamentals/3D vision & Graphics
Computer Vision 업무를 하다보면 3D 데이터도 자주 다루게 된다. 현실 세계를 디지털 공간에 재현하려면 3D 데이터를 저장하고 활용하는 방식에 대한 이해가 필수적이다. 최근에는 자율주행, 로보틱스, AR/VR, 3D 재구성, 의료 등 다양한 분야에서 3D 데이터가 활용되고 있다. 3D 데이터는 저장 방식에 따라 Mesh, Point Cloud, Voxel 등으로 나눌 수 있고, 각 데이터 구조를 저장하기 위해 PLY, PCD, OBJ 같은 다양한 파일 포맷이 존재한다. 각각의 포맷은 특정한 용도와 장점이 있기 때문에, 프로젝트의 목표에 따라 적절한 데이터를 선택하는 것이 중요하다. 이 글에서는 3D 데이터의 주요 구조와 포맷을 정리해 보고자 한다.📌 3D 데이터 구조1. Mesh📍 특징3..