본문 바로가기
728x90

분류 전체보기205

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision / CLIP / Multi-modal network Open AI에서 게재한(ICML2021) Contrastive Language-Image Pre-training(CLIP)를 제안한 논문을 소개합니다. Introduction & Motivation 딥러닝이 computer vision의 거의 모든 분야에서 굉장히 잘 활용되지만 현재 접근 방식에는 몇가지 문제가 있습니다. 기존의 vision model들은 학습된 task에는 성능이 우수하지만 새로운 task에 적용시키기 위해서는 새로 학습을 시키야 하는(그러면 새로운 데이터셋과 추가 레이블링이 필요..) 번거로움(?) 이 있습니다. 벤치마크에서 잘 수행되는 몇몇 model들은 stress test에서 좋지 않은 결과를 보여주기도 합니다. 대안으로 raw text와 image를 pair로 학습시키는 방법.. 2022. 2. 26.
[논문 리뷰] Bag of Tricks for Image Classification with Convolutional Neural Networks / 이미지 분류 분석 논문 CVPR 2019 에 공개된 논문으로, image classification 등의 vision 분야에서 참고하면 좋을 여러 training 방법론을 정리 및 실험한 논문입니다. Introduction Image classification task에서 성능을 높이기 위해서는 더 좋은 더 큰 network 를 쓰면 되지만, network를 변경하는 것 이외에도 성능을 좌지우지하는 많은 요소들이 존재합니다. 본 논문에서는 ResNet50을 기준으로 network architecture는 크게 변경하지 않고 여러 Trick 들을 실험한 결과를 제공합니다. 결과적으로, 여러 trick들을 적용하면 적용 이전보다 ImageNet Top-1 accuracy가 4% 가량이나 증가한다는 것을 보여줍니다(위의 Table .. 2022. 2. 21.
[python] 프로그래머스_카카오21_메뉴 리뉴얼 (완전탐색, combinations) 문제 풀이 itertools 에서 combinations 을 import 해서 문자열의 조합을 이용한다. combinations 를 사용하면 아래처럼 각 튜플에 하나의 조합이 각 원소별로 쪼개져서 출력되므로, 필요에 따라 후처리가 필요하다. a = 'abcd' b = list(combinations(a,2)) print(b) for i in range(len(b)): b[i] = ''.join(b[i]) print(b) 문제는 order 문자열을 순회하면서 각 주문별로 모든 조합의 개수를 foodMap으로 카운트하고, 세트의 메뉴 개수별 max값을 카운트해둔다. 그리고 마지막에 course를 순회하면서 foodMap에서 value값이 maxCnt와 동일한 key만 answer에 append하고 마지막에 .. 2022. 2. 21.
[논문 리뷰] Deep Encoding Pooling Network (DEP), Texture-Encoded Angular Network (TEAN) 본 포스팅에서는 Deep Texture Encoding Network(DeepTEN)의 업그레이드 버전인 Deep Encoding Pooling Network(DEP-Net)과, DEP-Net과 Differential Angular Imaging Network(DAIN) 구조를 융합한 Texture-Encoded Angular Network(TEAN) 를 소개합니다. A. Deep Texture Manifold for Ground Terrain Recognition / CVPR 2018 B. Differential Viewpoints for Ground Terrain Material Recognition / TPAMI 2020 A. Deep Texture Manifold for Ground Terrain.. 2022. 2. 20.
[논문 리뷰] Deep TEN: Texture Encoding Network CVPR 2017에 게재된 본 논문은 classic한 computer vision approach인 dictionary learning 방법을 CNN 구조와 통합하여 end-to-end 로 material, texture 이미지의 orderless representation을 학습하는 DeepTEN 을 제안합니다. Abstract 본 논문에서는 dictionary learning 및 encoding 파이프라인을 single model로 포팅하는 encoding layer가 있는 Deep Texture Encoding Network(Deep TEN)을 제안합니다. 이전 method에서는 SIFT descriptor 또는 material recognition으로 pre-trained CNN feature와 .. 2022. 2. 17.
[python] 백준3190_뱀 (구현) 문제 풀이 이차원 리스트상의 맵에서 뱀이 이동하도록 리스트의 특정 위치에서 동,남,서,북의 위치로 이동하는 기능을 구현해야 한다. 또한, 뱀의 머리가 뱀의 몸에 닿는 순간 종료해야 하므로, 매 시점마다 뱀이 존재하는 위치를 항상 이차원 리스트에 기록해야 한다. n = int(input()) k = int(input()) data= [[0]*(n+1) for _ in range(n+1)] info = [] for _ in range(k): a,b = map(int,input().split()) data[a][b] = 1 l = int(input()) for _ in range(l): x,c = input().split() info.append((int(x),c)) # 동,남,서,북 dx = [0,1,0,-.. 2022. 2. 15.
728x90