'💻 Programming' 카테고리의 글 목록 (11 Page)

Multi-GPU Training Multi-GPU Training (다중 GPU 학습)은 여러 개의 GPU를 사용하여 딥러닝 모델을 학습하는 방법이다. 딥러닝 모델은 점점 커지고 데이터셋의 크기 또한 방대하기 때문에 다중 GPU를 사용하여 딥러닝 모델을 학습하는 것은 사실상 필수적인 기술이라 볼 수 있다. Pytorch에서는 multi-gpu 학습을 위한 몇 가지 방법을 제공한다. Data Prarallel (DP) # DataParallel 모듈로 모델 감싸기 model = nn.DataParallel(model) torch.nn.DataParallel 모듈을 사용하는 방법으로, 굉장히 간단하게 동작하지만 몇 가지 치명적인 단점이 존재하는 방법이다. 장점 아주 간단하다 (딥러닝 모델을 해당 함수로 감..

Feature Detection & Matching 컴퓨터비전 분야에서의 feature matching은 두 개 이상의 이미지에서 공통적으로 나타나는 특징을 찾아내는 기술이다. 이를 통해 이미지 간의 대응점을 찾거나, 이미지 간의 변화를 추적하는 등 다양한 분야에 활용할 수 있다. 이러한 Feature matching의 과정은 크게 두 가지 단계로 나뉜다. 먼저 각 이미지에서 특징을 검출하고, 이를 이용하여 각 특징들이 어떻게 매칭되는지 찾아내는 것이다. 1. Feature Detection (특징 검출) 이미지에서 특징을 검출하기 위해서는 이미지 내의 특이한 패턴이나 구조를 찾아내는 것이 중요하다. 이를 위해 SIFT, SURF, ORB 등의 알고리즘을 사용하는데 이 알고리즘들은 이미지에서 특징점을 검..

Template Matching 이미지 템플릿 매칭은 대상 이미지에서 작은 이미지(템플릿)를 찾는 기술로, 컴퓨터 비전 분야에서 많이 사용되는 기술 중 하나이다. OpenCV에서는 cv2.matchTemplate() 함수를 사용하여 이미지 템플릿 매칭을 수행할 수 있는데, 이 함수는 입력 이미지와 템플릿 이미지를 입력으로 받아서, 입력 이미지에서 템플릿과 가장 유사한 부분을 찾아 반환한다. 딥러닝을 사용한 방법처럼 객체의 deformation이 있는 경우에도 잘 매칭되는 알고리즘은 아니지만 템플릿 이미지와 아주 유사한 부분이 입력 이미지에 있는 경우에는 사용하기 좋은 알고리즘이다. 가장 큰 단점은 opencv의 템플릿 매칭은 템플릿 이미지로 대상 이미지를 슬라이딩 하는데, 이때 슬라이딩 윈도우 사이즈를 ..

Image Contour (이미지 윤곽선) 이미지 윤곽선(contour)은 이미지에서 객체(object)의 외곽 경계를 나타내는 곡선이다. 이러한 윤곽선은 객체의 형태, 크기, 방향 등의 정보를 추출하는 데 유용하게 사용된다. 예를 들어, 이미지에서 객체의 위치나 크기를 검출하고, 개체의 외곽을 추출하거나, 개체를 분할(segmentation)하기 위해 윤곽선을 추출한다. 윤곽선을 추출하기 위해서는 대개 이미지의 이진화(binary) 과정이 필요하다. 이진화된 이미지에서는 흰색 픽셀은 개체를, 검은색 픽셀은 배경을 나타냅니다. 이진화된 이미지에서 윤곽선을 추출하는 방법은 여러 가지가 있지만 가장 간단한 방법은 cv2.findContours 함수를 사용하는 것이다. 이 함수는 바이너리 이미지에서 윤곽선을 ..

Morphological Operations (모폴로지 연산) 모폴로지 연산은 이미지 내 객체의 형태, 크기, 구조 등을 분석하거나 변형하는 데 사용되는 기술이다. 주로 바이너리 이미지(흑백 이미지)에서 사용되며, 객체의 형태를 분석하여 이미지 내의 구멍을 채우거나, 객체의 크기를 조절하거나, 객체 간의 거리를 조절하는 등의 작업을 수행할 수 있다. 이러한 모폴로지 연산은 기본적으로 구조 요소(structuring element)를 사용하여 수행되는데 구조 요소는 이미지 내에서 객체의 형태를 결정하는 기준이 된다. 일반적으로 구조 요소는 사각형, 원, 십자가 등의 형태를 가지며, 모양과 크기는 작업에 따라 다르게 선택된다. 모폴로지 연산에는 다양한 종류가 있지만, 대표적으로 팽창(dilation), 침식..

Geometric Transformation 영상은 기하학적 변환을 통해 다양한 형태로 변환될 수 있는데 자유도에 따라 translation, eclidean,similarity, affine, perspective(projective) 변환으로 나뉜다. 이 중에서 perspective transformation의 자유도가 가장 크다. 다시 말해 가장 많은 변형을 줄 수 있는 변환이라는 뜻이다. 다양한 컴퓨터 비전 프로젝트에서 카메라의 각도에 따라 왜곡되는 객체나 텍스트 들을 정면으로 바라보는 view로 변환하기 위해 affine 또는 perspective transformation이 사용된다. Perspective Transformation 그 중에서 가장 큰 자유도를 가지는 perspective tr..

티스토리툴바