
[Object Detection] DETR 모델 이해하기! | End-to-end 객체 검출 모델
·
🏛 Research/Detection & Segmentation
객체 검출(Object Detection)은 이미지나 영상에서 어떤 객체가 어디에 있는지를 식별하는 컴퓨터 비전의 핵심 과제 중 하나다. 최근까지도 객체 검출 모델은 R-CNN 계열이나 YOLO 계열처럼 복잡한 구조와 후처리 단계를 포함한 방식이 주를 이뤘지만, DETR(Detection Transformer)은 이 흐름에 큰 전환점을 만들어냈다.DETR은 Transformer 구조를 기반으로 앵커 박스 없이, 후처리 없이, 객체 검출을 End-to-End로 학습하고 예측할 수 있도록 만든 모델이다.1. DETR 핵심 아이디어 기존의 객체 검출 모델들은 수많은 앵커 박스를 기반으로 후보 바운딩 박스를 만들고, 그 중에서 높은 확률을 가진 것만 남기는 후처리 과정(NMS)이 필요하다. 이러한 과정은 복잡할..