728x90 Image Classification3 [HuggingFace] Swin Transformer 이미지 분류 모델 학습 튜토리얼 최근에 트랜스포머 모델을 사용할 일이 생겨 딥러닝 프레임워크인 HuggingFace 를 사용해봤다. HuggingFace의 transformers는 다양한 트랜스포머 모델을 제공하고 자체 학습/평가 API를 제공한다. 또한 허깅페이스 모델은 Pytorch, Tensorflow 학습/평가 코드에도 그대로 적용할 수 있을만큼 호환성이 좋다고 알려져 있다. 그래서 pytorch 학습 코드에 모델만 허깅페이스의 트랜스포머로 바꿔서 학습시키면 되니까 간단하겠구나 생각했지만... 생각보다 고려해야할 점들이 있어서 튜토리얼로 정리해 본다. HuggingFace Vision Model 사용 방법 데이터셋 준비 Vision Transformer(ViT) 기반의 이미지 트랜스포머 모델들은 입력 이미지를 위와 같이 패치로 .. 2023. 1. 11. [논문 리뷰] Bag of Tricks for Image Classification with Convolutional Neural Networks / 이미지 분류 분석 논문 CVPR 2019 에 공개된 논문으로, image classification 등의 vision 분야에서 참고하면 좋을 여러 training 방법론을 정리 및 실험한 논문입니다. Introduction Image classification task에서 성능을 높이기 위해서는 더 좋은 더 큰 network 를 쓰면 되지만, network를 변경하는 것 이외에도 성능을 좌지우지하는 많은 요소들이 존재합니다. 본 논문에서는 ResNet50을 기준으로 network architecture는 크게 변경하지 않고 여러 Trick 들을 실험한 결과를 제공합니다. 결과적으로, 여러 trick들을 적용하면 적용 이전보다 ImageNet Top-1 accuracy가 4% 가량이나 증가한다는 것을 보여줍니다(위의 Table .. 2022. 2. 21. [논문 리뷰] SHAPE-TEXTURE DEBIASED NEURAL NETWORK TRAINING / 뉴럴 네트워크에서 shape과 texture의 관계 ICLR 2021에 개제된 논문이며 object와 shape, texture와의 관계, 그리고 object recognition 등의 vision task에서 shape과 texture 정보를 모두 이용하여 학습하여 성능을 향상시킨 shape-texture debiased neural network를 제안합니다. Introduction Shape과 texture는 모두 object를 인식할 때 중요한 단서들입니다. 이미 이전의 object recognition 연구에서 shape과 texture를 적절하게 결합하면 인식 성능을 높일 수 있음이 밝혀졌습니다. ‘IMAGENET-TRAINED CNNS ARE BIASED TOWARDS TEXTURE; INCREASING SHAPE BIAS IMPROVES A.. 2021. 12. 4. 이전 1 다음 728x90