'Image Classification' 태그의 글 목록

최근에 트랜스포머 모델을 사용할 일이 생겨 딥러닝 프레임워크인 HuggingFace 를 사용해봤다. HuggingFace의 transformers는 다양한 트랜스포머 모델을 제공하고 자체 학습/평가 API를 제공한다. 또한 허깅페이스 모델은 Pytorch, Tensorflow 학습/평가 코드에도 그대로 적용할 수 있을만큼 호환성이 좋다고 알려져 있다. 그래서 pytorch 학습 코드에 모델만 허깅페이스의 트랜스포머로 바꿔서 학습시키면 되니까 간단하겠구나 생각했지만... 생각보다 고려해야할 점들이 있어서 튜토리얼로 정리해 본다. HuggingFace Vision Model 사용 방법 데이터셋 준비 Vision Transformer(ViT) 기반의 이미지 트랜스포머 모델들은 입력 이미지를 위와 같이 패치로 ..

CVPR 2019 에 공개된 논문으로, image classification 등의 vision 분야에서 참고하면 좋을 여러 training 방법론을 정리 및 실험한 논문입니다. Introduction Image classification task에서 성능을 높이기 위해서는 더 좋은 더 큰 network 를 쓰면 되지만, network를 변경하는 것 이외에도 성능을 좌지우지하는 많은 요소들이 존재합니다. 본 논문에서는 ResNet50을 기준으로 network architecture는 크게 변경하지 않고 여러 Trick 들을 실험한 결과를 제공합니다. 결과적으로, 여러 trick들을 적용하면 적용 이전보다 ImageNet Top-1 accuracy가 4% 가량이나 증가한다는 것을 보여줍니다(위의 Table ..

ICLR 2021에 개제된 논문이며 object와 shape, texture와의 관계, 그리고 object recognition 등의 vision task에서 shape과 texture 정보를 모두 이용하여 학습하여 성능을 향상시킨 shape-texture debiased neural network를 제안합니다. Introduction Shape과 texture는 모두 object를 인식할 때 중요한 단서들입니다. 이미 이전의 object recognition 연구에서 shape과 texture를 적절하게 결합하면 인식 성능을 높일 수 있음이 밝혀졌습니다. ‘IMAGENET-TRAINED CNNS ARE BIASED TOWARDS TEXTURE; INCREASING SHAPE BIAS IMPROVES A..

티스토리툴바