본문 바로가기
728x90

Image Classification4

[튜토리얼] 이미지 분류 예제 코드 소개 | Image Classification | Pytorch Image Classification(이미지 분류)은 컴퓨터비전과 딥러닝 분야에서 가장 간단한 예제 중 하나로, 흔히 MNIST 데이터셋을 이용한 숫자 분류기나 Cifar-10 같은 소규모 데이터셋을 학습하는 예제가 많이 공개되어 있다. 이미지 분류의 경우 아주 복잡한 작업이 아닌 경우 ResNet 정도로만 학습해도 꽤 준수한 성능을 낼 수 있기에 학습 & 평가 코드를 구축해두고 데이터셋과 모델만 변경해가며 사용하는 것이 편리하다. *복잡한 task의 경우 본인이 사용중인 학습&평가 코드에 새로운 모델을 이식하는 것이 쉽지 않다. 대부분 이런 경우에는 해당 논문(연구)의 저자가 제공하는 공식 레포지토리를 그대로 사용하는 것이 편하다. 이미지 분류 학습 및 평가 코드에 작성에 참고할 만한 사이트와 레포지토.. 2023. 8. 11.
[HuggingFace] Swin Transformer 이미지 분류 모델 학습 튜토리얼 최근에 트랜스포머 모델을 사용할 일이 생겨 딥러닝 프레임워크인 HuggingFace 를 사용해봤다. HuggingFace의 transformers는 다양한 트랜스포머 모델을 제공하고 자체 학습/평가 API를 제공한다. 또한 허깅페이스 모델은 Pytorch, Tensorflow 학습/평가 코드에도 그대로 적용할 수 있을만큼 호환성이 좋다고 알려져 있다. 그래서 pytorch 학습 코드에 모델만 허깅페이스의 트랜스포머로 바꿔서 학습시키면 되니까 간단하겠구나 생각했지만... 생각보다 고려해야할 점들이 있어서 튜토리얼로 정리해 본다. HuggingFace Vision Model 사용 방법 데이터셋 준비 Vision Transformer(ViT) 기반의 이미지 트랜스포머 모델들은 입력 이미지를 위와 같이 패치로 .. 2023. 1. 11.
[논문 리뷰] Bag of Tricks for Image Classification with Convolutional Neural Networks / 이미지 분류 분석 논문 CVPR 2019 에 공개된 논문으로, image classification 등의 vision 분야에서 참고하면 좋을 여러 training 방법론을 정리 및 실험한 논문입니다. Introduction Image classification task에서 성능을 높이기 위해서는 더 좋은 더 큰 network 를 쓰면 되지만, network를 변경하는 것 이외에도 성능을 좌지우지하는 많은 요소들이 존재합니다. 본 논문에서는 ResNet50을 기준으로 network architecture는 크게 변경하지 않고 여러 Trick 들을 실험한 결과를 제공합니다. 결과적으로, 여러 trick들을 적용하면 적용 이전보다 ImageNet Top-1 accuracy가 4% 가량이나 증가한다는 것을 보여줍니다(위의 Table .. 2022. 2. 21.
[논문 리뷰] SHAPE-TEXTURE DEBIASED NEURAL NETWORK TRAINING / 뉴럴 네트워크에서 shape과 texture의 관계 ICLR 2021에 개제된 논문이며 object와 shape, texture와의 관계, 그리고 object recognition 등의 vision task에서 shape과 texture 정보를 모두 이용하여 학습하여 성능을 향상시킨 shape-texture debiased neural network를 제안합니다. Introduction Shape과 texture는 모두 object를 인식할 때 중요한 단서들입니다. 이미 이전의 object recognition 연구에서 shape과 texture를 적절하게 결합하면 인식 성능을 높일 수 있음이 밝혀졌습니다. ‘IMAGENET-TRAINED CNNS ARE BIASED TOWARDS TEXTURE; INCREASING SHAPE BIAS IMPROVES A.. 2021. 12. 4.
728x90