[논문 리뷰] Non-local Neural Networks / Vision Transformer의 시초
·
🏛 Research/Deep Learning
Non-local network 정리... CNN 은 얕은 layer에서는 spatial domain에서의 local한 영역의 correlation을, 깊은 layer에서는 상대적으로 global한 영역까지의 correlation을 추출하는 local operator 로 볼 수 있습니다. 또한 layer가 깊어지더라도 한번의 연산에서 전체 영역의 correlation을 추출하는 non-local 연산과는 차이가 있습니다. 때문에 CNN은 spatial domain 또는 temporal domain 상에서 거리가 먼 feature 들간의 correlation이 추출되기 힘든 구조입니다. 본 논문은 이를 개선하기 위한 Non-local operation을 제안합니다. 아래 그림은 non-local block..