본문 바로가기
728x90

딥러닝8

[DL] CNN에서 Convolutional layer의 개념과 의미 | 컨볼루션 신경망 | 합성곱 신경망 딥러닝에서 CNN (Convolutional Neural Network) 은 주로 이미지를 분석하는 데 가장 일반적으로 사용하는 ANN (Artificial Neural Network) 이다. 물론 요즘은 트랜스포머 기반의 네트워크를 많이 사용하지만 CNN 또한 여전히 많이 사용되고 트랜스포머와 CNN의 조합의 네트워크 또한 심심치 않게 볼 수 있다. 이번 포스팅에서는 CNN의 핵심 layer인 convolutional layer의 개념과 의미에 대해 설명하고자 한다. * CNN (Convolutional Neural Network) CNN은 입력 데이터에 대해 계층적으로 학습하며 입력 데이터의 특징을 추출하기 위해 Convolution, Pooling, Non-linear activation funct.. 2023. 3. 23.
[연구 소개] 문서 이미지 그림자제거 / 문서 OCR 결과를 향상시키기 위해 요즘은 문서를 사진으로 찍어서 회사나 공공 기관에 제출하는 경우가 많다. 이 때 회사는 받은 문서에서 OCR 기술을 사용해서 텍스트를 디지털화시켜서 저장하게 된다. 그런데 휴대폰으로 문서 사진을 찍는 경우 그림자가 많이 생겨서 이미지의 퀄리티가 떨어지는 경우가 많고 이는 텍스트 인식 오류를 발생하게 한다. 그런데... 이미지에서 그림자를 제거하는 연구가 존재한다고 한다. 역시 세상 사람들은 참 똑똑하고 없는 게 잘 없다... Paper : BEDSR-Net A Deep Shadow Removal Network from a Single Document Image / CVPR 2020 github : https://github.com/IsHYuhi/BEDSR-Net_A_Deep_Shadow_Removal_.. 2022. 12. 20.
[Object Detection] 누구나 쉽게 따라할 수 있는 YOLOv5 모델 학습하기 (커스텀 데이터) Object Detection Object Detection(객체 검출)이란 이미지에서 검출하고 싶은 객체의 위치(바운딩 박스)를 찾고 객체의 카테고리를 분류하는 작업을 의미한다. 객체 검출하면 역시 많은 분들이 YOLO 모델을 떠올리는 것 같아서, YOLO 모델을 학습하고 테스트하는 튜토리얼을 준비해 봤다. 요즘은 컴공과나 AI 관련 공부를 하시는 학생이 아니더라도 본인의 학업에 객체 검출 기술을 적용시켜보려 하는 사람들이 많다. 하지만 코딩을 할 줄 모르면 간단한 코드일지라도 따라하다보면 에러가 나고 어떻게 해결해야할지 모르겠는 상황이 많이 연출된다. 때문에 코딩을 할 줄 모르는 사람도 쉽게 따라할 수 있는 YOLO 학습 튜토리얼을 준비했으니 필요한 분들께 도움이 되었으면 좋겠다. - 학습 코드 레퍼.. 2022. 12. 17.
컴퓨터 비전 & AI 개발자 면접 질문 컴퓨터 비전 & 딥러닝 직무로 채용 과정 중 과제 및 면접을 보면서 받은 질문들과 물어볼만한 질문들을 섞어서 정리합니다. 질문 내용을 그대로 적으면 문제가 될 수도 있기에 실제로 받은 질문에 비해 다소 심플하게 카테고리만 적겠습니다. 그리고 여러 면접에서 중복되게 물어보는 부분은 굵게 표시했습니다. 회사마다 각 분야마다 다르지만 굉장히 기본적인 것 위주로 물어보는 곳도 있고, 아주 딥하고 어려운 질문(정답이 없는)을 하거나 당해에 발표된 논문과 그 논문의 주요 contribution을 물어보는 곳도 많습니다. 질문과 관련된 논문을 안봤으면... 첨 들어봅니다.. 만 반복해야 합니다 ㅠ. 사실 많은 질문들이 외워간다고 해결이 안되는 경우가 많습니다 ㅠ + 사실 석사 이상은 개인 연구에 대한 질문이 제일 많.. 2022. 5. 15.
[DL] 딥러닝에서의 Regularization : Weight Decay, Batch Normalization, Early Stopping 딥러닝에서 Regularization은 모델의 overfitting을 방지하기 위해 특정한 것에 규제를 하는 방법들을 총칭하고, 대표적으로 아래와 같은 방법들이 있다. *Overfitting : 기계 학습 모델에서 자주 발생하는 문제 중 하나로, 모델이 학습 데이터셋에 과도하게 fit되어 일반화 성능이 떨어지는 현상. Weight Decay - L1, L2 Batch Normalization Early Stopping Weight Decay Neural network의 특정 weight가 너무 커지는 것은 모델의 일반화 성능을 떨어뜨려 overfitting 되게 하므로, weight에 규제를 걸어주는 것이 필요. L1 regularization, L2 regularization 모두 기존 Loss fun.. 2022. 3. 23.
[논문 리뷰] Non-local Neural Networks / Vision Transformer의 시초 Non-local network 정리... CNN 은 얕은 layer에서는 spatial domain에서의 local한 영역의 correlation을, 깊은 layer에서는 상대적으로 global한 영역까지의 correlation을 추출하는 local operator 로 볼 수 있습니다. 또한 layer가 깊어지더라도 한번의 연산에서 전체 영역의 correlation을 추출하는 non-local 연산과는 차이가 있습니다. 때문에 CNN은 spatial domain 또는 temporal domain 상에서 거리가 먼 feature 들간의 correlation이 추출되기 힘든 구조입니다. 본 논문은 이를 개선하기 위한 Non-local operation을 제안합니다. 아래 그림은 non-local block.. 2021. 12. 12.
728x90