[객체 검출] 앵커 박스(Anchor Box)란 무엇인가? | 객체 검출 모델에서의 역할과 한계
·
📖 Fundamentals/Computer Vision
객체 검출(Object Detection) 모델에서는 이미지 속 객체의 위치와 크기를 예측해야 한다. 이때 사용되는 중요한 개념 중 하나가 앵커 박스(Anchor Box)이다. 1. 앵커 박스란? 앵커 박스는 이미지의 각 위치에 미리 정의된 여러 크기와 비율의 바운딩 박스를 의미한다. 모델은 이 앵커 박스를 기준으로 실제 객체의 위치와 클래스 정보를 예측한다. 다양한 크기의 객체를 효과적으로 탐지하기 위해 여러 개의 앵커 박스를 각 위치마다 배치하는 방식이다. 2. 앵커 박스의 원리와 사용 방식객체 검출 모델은 각 앵커 박스에 대해 두 가지를 예측한다.해당 박스에 어떤 클래스가 존재하는지해당 박스를 어떻게 조정해야 실제 객체의 위치와 맞출 수 있는지이때, 예측된 바운딩 박스가 실제 객체의 바운딩 박스와 ..
[Object Detection] DETR 모델 이해하기! | End-to-end 객체 검출 모델
·
🏛 Research/Detection & Segmentation
객체 검출(Object Detection)은 이미지나 영상에서 어떤 객체가 어디에 있는지를 식별하는 컴퓨터 비전의 핵심 과제 중 하나다. 최근까지도 객체 검출 모델은 R-CNN 계열이나 YOLO 계열처럼 복잡한 구조와 후처리 단계를 포함한 방식이 주를 이뤘지만, DETR(Detection Transformer)은 이 흐름에 큰 전환점을 만들어냈다.DETR은 Transformer 구조를 기반으로 앵커 박스 없이, 후처리 없이, 객체 검출을 End-to-End로 학습하고 예측할 수 있도록 만든 모델이다.1. DETR 핵심 아이디어 기존의 객체 검출 모델들은 수많은 앵커 박스를 기반으로 후보 바운딩 박스를 만들고, 그 중에서 높은 확률을 가진 것만 남기는 후처리 과정(NMS)이 필요하다. 이러한 과정은 복잡할..
[객체 검출] NMS가 무엇일까? | 객체 검출에서 겹치는 bbox를 제거하는 방법 | Non-Maximum Suppression 설명
·
📖 Fundamentals/Computer Vision
Non-Maximum Suppression(NMS)은 객체 감지 모델에서 겹치는 Bounding Box를 제거하여 최종 결과를 정리하는 기술이다. 이를 통해 모델의 출력을 간결하게 하고 중복된 결과를 제거함으로써 정확한 객체 감지를 할 수 있게 된다.  NMS의 원리는 여러 후보 bbox 중에서 겹치는 상자들을 필터링하는 것인데, 겹치는 상자들 중에서 가장 확률이 높은 상자를 선택하고 그와 겹치는 상자들을 제거하는 방식이라고 보면 된다. 이러한 NMS는 모델의 출력을 정리하고 중복된 결과를 제거하여 더 정확한 결과를 얻을 수 있도록 하며 특히, 한 객체에 대해 여러 개의 겹치는 경계 상자가 생성된 경우 이를 정리하는 데 사용된다. Object Detection 모델 중 Faster R-CNN, YOLO..
[OpenCV] Image Contour 추출 | 이미지 컨투어 | 객체 윤곽선 추출 | 기초적인 segmentation 방법
·
💻 Programming/Computer Vision
Image Contour (이미지 윤곽선) 이미지 윤곽선(contour)은 이미지에서 객체(object)의 외곽 경계를 나타내는 곡선이다. 이러한 윤곽선은 객체의 형태, 크기, 방향 등의 정보를 추출하는 데 유용하게 사용된다. 예를 들어, 이미지에서 객체의 위치나 크기를 검출하고, 개체의 외곽을 추출하거나, 개체를 분할(segmentation)하기 위해 윤곽선을 추출한다. 윤곽선을 추출하기 위해서는 대개 이미지의 이진화(binary) 과정이 필요하다. 이진화된 이미지에서는 흰색 픽셀은 개체를, 검은색 픽셀은 배경을 나타냅니다. 이진화된 이미지에서 윤곽선을 추출하는 방법은 여러 가지가 있지만 가장 간단한 방법은 cv2.findContours 함수를 사용하는 것이다. 이 함수는 바이너리 이미지에서 윤곽선을 ..
[Object Detection] 누구나 쉽게 따라할 수 있는 YOLOv5 모델 학습하기 | 커스텀 데이터 | YOLOv5 예제 코드
·
💻 Programming/Computer Vision
안녕하세요! AI & Computer Vision Engineer 뭅즤입니다 👋 본 포스팅은 YOLOv5를 커스텀 데이터셋으로 학습 및 테스트해 보는 예제 코드를 설명하는 글인데요.처음 글을 작성했을 때보다 훨씬 더 쉽게 실습할 수 있도록 수정했으니, 참고 부탁드려요! 🤗📌 Object Detection  Object Detection(객체 검출)은 이미지나 동영상 속에 있는 여러 객체의 유형과 위치를 알아내는 기술이에요. 이 기술 덕분에 자율주행 자동차가 주변의 사람이나 차량을 인식하고, 보안 카메라가 의심스러운 물체를 감지하거나, 스마트폰 카메라가 사진 속의 특정 물체에 초점을 맞출 수 있는 거라고 볼 수 있죠! 객체 검출하면 많은 분들이 떠올리는 대표적인 모델이 바로 YOLO 모델일 거예요. ..