2023년 컴퓨터비전 분야 트렌드 with CVPR 2023 | Diffusion model, NeRF, Multi-modal
·
🌟 AI & ML Tech/AI & ML 인사이트
CVPR 2023에 accpet된 논문들을 기준으로 컴퓨터비전 분야의 트렌드에 대해 살펴 보려 한다. 내가 분석한 것은 아니고 아래 페이지를 참고해서 쓴 글이니 더 자세한 내용을 원문을 참고하길 바란다. - https://voxel51.com/blog/cvpr-2023-and-the-state-of-computer-vision/ CVPR 2023 분석 요약 - 9155건의 제출물 중 2359건의 논문 채택 - 평균 합격 논문 저자의 수는 5.4명 - 63%의 제목에 두문자어(acronyms) 사용 (단어 앞글자 따서 만든 줄임말) - Diffusion Model이 573% 상승 - Multi-modal과 Cross-modal 이 미래 - CNN은 68% 감소 - Mask는 어디에나 사용 - 포인트클라우드..
Computer Vision (컴퓨터 비전) 이 무엇일까 !?
·
📖 Fundamentals/Computer Vision
Computer Vision (컴퓨터 비전) 컴퓨터 비전(Computer Vision)은 말 그대로 컴퓨터가 '시각'을 가지게 하는 기술이에요. 쉽게 말해, 우리가 눈으로 세상을 보는 것처럼, 컴퓨터가 이미지나 동영상을 통해 주변 환경을 인식하고 이해할 수 있도록 만드는 기술이죠. 예전에는 단순히 카메라로 찍은 사진이나 영상을 저장하고 보는 것에 그쳤다면, 이제는 컴퓨터가 그 이미지에서 정보를 추출해 내고, 분석하고, 판단까지 할 수 있게 되었어요. 아, 이제는 컴퓨터가 이미지를 생성하기도 하죠! 이러한 컴퓨터 비전은 결론적으로 컴퓨터가 인간의 시각적 지각 능력을 모방하고 인간을 뛰어넘는 시각적 지능을 갖는 것을 지향하며 자율 주행, 의료 영상, 이미지 검색, 얼굴 인식 등 다양한 분야에서 활용되고 있어..
[기술 소개] 3D Object Scanning | MVS | 객체 스캐닝 | 실시간 3D 객체 복원
·
🏛 Research/3D Vision
3D Object Scanning 3D Object Scanning은 multi-view stereo (MVS) 기술을 활용하여 객체의 3D shape을 복원하는 기술이다. 아래 영상을 보면 Niantic이라는 기업에서 Unity SDK에 빠른 non-lidar 스캔 툴을 추가하여 사용자가 객체를 실시간으로 스캔할 수 있게 한다. 스마트폰으로 객체를 다양한 각도에서 촬영하고 객체를 복원하는데 품질이 꽤 좋아보인다. 또한 RealityScan과 같은 앱을 사용하면 스마트폰으로 간단하게 3D 스캔을 경험해 볼 수도 있다. Niantic 기업의 Object Scanning 예시 RealityScan - 3D Scanning App의 결과 예시 출처 : https://sketchfab.com/3d-models..