728x90 ๐ Research58 [์คํ์์ค] OpenMMLab ์ปดํจํฐ๋น์ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ | ๋ค์ํ ์ปดํจํฐ๋น์ ์ฐ๊ตฌ ์ฃผ์ OpenMMLab OpenMMLab์ ํ์ ์ฐ๊ตฌ ๋ฐ ์ฐ์ ์์ฉ์ ์ํ ๋ค์ํ ์ปดํจํฐ๋น์ ์คํ์์ค ํ๋ก์ ํธ๋ค์ ์ ๊ณตํ๋ค. OpenMMLab์์๋ ์๋์ ๊ฐ์ ์ฅ์ ์ ๊ฐ์ง๊ณ ์๋ค๊ณ ์ค๋ช ํ๋๋ฐ, ๊ต์ฅํ ๋ง์ ํ๋ก์ ํธ์ ํด์ด ์๊ธฐ ๋๋ฌธ์ ๋ด๊ฐ ์จ๋ณธ ๊ฒ์ ๊ทนํ ์ผ๋ถ์ด์ง๋ง ํ์ํ ๊ธฐ๋ฅ๋ค์ ํธ๋ฆฌํ๊ฒ ์ ๊ตฌํํ๋ค๋ ๋๋์ ๋ฐ์์๋ค. ์๊ณ ๋ฆฌ์ฆ ์ฌ๊ตฌํ์ ์ด๋ ค์์ ์ค์ด๊ธฐ ์ํ ๊ณ ํ์ง ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ๊ณต ๋ค์ํ ๋ฐฑ์๋ ๋ฐ ์ฅ์น๋ฅผ ๋์์ผ๋ก ํ๋ ํจ์จ์ ์ธ ๋ฐฐํฌ ๋๊ตฌ ์ ๊ณต ์ปดํจํฐ๋น์ ์ฐ๊ตฌ ๋ฐ ๊ฐ๋ฐ์ ์ํ ๊ฒฌ๊ณ ํ ๊ธฐ๋ฐ ๊ตฌ์ถ ํ์คํ ํด์ฒด์ธ์ผ๋ก ํ์ ์ฐ๊ตฌ์ ์ฐ์ ์์ฉ ํ๋ก๊ทธ๋จ ๊ฐ์ ๊ฒฉ์ฐจ ํด์ ๊ฐ์ธ์ ์ผ๋ก๋ Pytorch ๊ธฐ๋ฐ์ด๋ผ ์ข์๋ค... OpenMMLab์ ๊ต์ฅํ ๋ค์ํ ์ปดํจํฐ๋น์ ์ฐ๊ตฌ ์ฃผ์ ์์ ์ต์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๊ณผ ๊ณ ์ฑ๋ฅ ์ฝ๋๋ฅผ ์ ๊ณตํ๊ธฐ.. 2023. 4. 16. [๊ธฐ์ ์๊ฐ] 3D Object Scanning | MVS | ๊ฐ์ฒด ์ค์บ๋ | ์ค์๊ฐ 3D ๊ฐ์ฒด ๋ณต์ 3D Object Scanning 3D Object Scanning์ multi-view stereo (MVS) ๊ธฐ์ ์ ํ์ฉํ์ฌ ๊ฐ์ฒด์ 3D shape์ ๋ณต์ํ๋ ๊ธฐ์ ์ด๋ค. ์๋ ์์์ ๋ณด๋ฉด Niantic์ด๋ผ๋ ๊ธฐ์ ์์ Unity SDK์ ๋น ๋ฅธ non-lidar ์ค์บ ํด์ ์ถ๊ฐํ์ฌ ์ฌ์ฉ์๊ฐ ๊ฐ์ฒด๋ฅผ ์ค์๊ฐ์ผ๋ก ์ค์บํ ์ ์๊ฒ ํ๋ค. ์ค๋งํธํฐ์ผ๋ก ๊ฐ์ฒด๋ฅผ ๋ค์ํ ๊ฐ๋์์ ์ดฌ์ํ๊ณ ๊ฐ์ฒด๋ฅผ ๋ณต์ํ๋๋ฐ ํ์ง์ด ๊ฝค ์ข์๋ณด์ธ๋ค. ๋ํ RealityScan๊ณผ ๊ฐ์ ์ฑ์ ์ฌ์ฉํ๋ฉด ์ค๋งํธํฐ์ผ๋ก ๊ฐ๋จํ๊ฒ 3D ์ค์บ์ ๊ฒฝํํด ๋ณผ ์๋ ์๋ค. Niantic ๊ธฐ์ ์ Object Scanning ์์ RealityScan - 3D Scanning App์ ๊ฒฐ๊ณผ ์์ ์ถ์ฒ : https://sketchfab.com/3d-models.. 2023. 4. 7. [๊ธฐ์ ์๊ฐ] Text-to-Image Generation | ์ด๋ฏธ์ง ์์ฑ AI | DALL-E | GPT | dVAE Text to Image Generation Text to Image generation์ ํ ์คํธ ์ ๋ณด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์์ ํด๋น ํ ์คํธ์ ํด๋นํ๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋ ๊ธฐ์ ์ด๋ค. ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ๋ฐ์ ์ผ๋ก ์ธํด 2010๋ ๋ ์ค๋ฐ๋ถํฐ ๊ฐ๋ฐ๋๊ธฐ ์์ํด 2022๋ ์๋ OpenAI์ DALL-E 2 , Google Brain์ Imagen , StabilityAI์ Stable Diffusion ๊ณผ ๊ฐ์ ์ต์ฒจ๋จ ํ ์คํธ-์ด๋ฏธ์ง ๋ชจ๋ธ์ ์ถ๋ ฅ๋ฌผ์ด ์ค์ ์ฌ์ง๊ณผ ์ฌ๋์ด ๊ทธ๋ฆฐ ์์ ํ์ ํ์ง์ ์ ๊ทผํ๊ธฐ ์์ํ๋ค. Text to Image generation์์๋ ์ผ๋ฐ์ ์ผ๋ก ์ด๋ฌํ GAN(Generative Adversarial Networks) ๋ชจ๋ธ์ ํ ์คํธ์ ์ด๋ฏธ์ง๋ฅผ ์์ผ๋ก ์ด๋ฃจ๋ ๋ฐ์ดํฐ์ ์ ํ์ต์์ผ์ ๊ตฌํํ๋ค. ์๋ฅผ ๋ค์ด, ".. 2023. 4. 6. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Character Region Awareness for Text Detection / CRAFT / ํ ์คํธ ๊ฒ์ถ ๋ณธ ๋ ผ๋ฌธ์ Naver Clova์์ CVPR 2019 ์ ๋ฐํํ Text Detection ๋ ผ๋ฌธ์ผ๋ก, CRAFT ๋ผ๋ ๋ชจ๋ธ์ ์ ์ํ๋ค. Text Detection ๋ถ์ผ์์ ์๋ ์ ๋ช ๋ ๋ ผ๋ฌธ์ด๊ณ ๊ฐ์ธ์ ์ผ๋ก ํ ์คํธ ๊ฒ์ถ์ ์ํด ํ ์คํธ์ ํน์ฑ๊ณผ ๋ฅ๋ฌ๋์ ํ์ต ํน์ฑ์ ์์ฃผ ํจ์จ์ ์ผ๋ก ์ด์ฉํ ๋งค๋ ฅ์ ์ธ ์ฐ๊ตฌ๋ผ ์๊ฐํ๋ค. ์์ธํ ์ค๋ช ์ ๋ค๋ฅธ ๋ธ๋ก๊ทธ์์๋ ์ ๋์์์ผ๋ ๋๋ ๋ชจ๋ธ ํ์ต์ ์ํ ํต์ฌ์ ์ธ ๋ถ๋ถ๋ง ์ ๋ฆฌํ๋ ค ํ๋ค. CRAFT ๋ชจ๋ธ์ ํต์ฌ CRAFT ๋ชจ๋ธ์ ํ ์คํธ ๊ฒ์ถ์ ์ํด ๋จ์ด bbox๋ฅผ ๋ฐ๋ก ์์ธกํ๋ ๊ฒ์ด ์๋๋ผ, ๋ฌธ์์ ์์น๋ฅผ ๋ํ๋ด๋ region score, ๋ฌธ์๊ฐ ๊ฑฐ๋ฆฌ๋ฅผ ๋ํ๋ด๋ affinity score๋ฅผ ์์ธก ์ด๋ฅผ ์ํด์๋ character-level annotation์ด ํ์ํ๋ฐ ๋ฌธ์ ํ๋ ํ๋.. 2023. 3. 13. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] What If We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels ๋ณธ ๋ ผ๋ฌธ์ CVPR 2021์์ ๋ฐํ๋ Text Recognition ๋ ผ๋ฌธ์ผ๋ก, TRBA ๋ชจ๋ธ ('What is wrong with scene text recognition model comparisons? dataset and model analysis')์ ์ ์ํ ๋ฐฑ์ ํ ๋์ ๋ ผ๋ฌธ์ด๊ธฐ๋ ํ๋ค. ๋ณธ๋ฌธ ๋ด์ฉ Scene Text Recognition (STR) ์ฐ๊ตฌ์์๋ ๋ฆฌ์ผ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ๊ธฐ ๋๋ฌธ์ ์ผ๋ฐ์ ์ผ๋ก ๋๊ท๋ชจ ํฉ์ฑ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ํ์ต์ ์งํํ๋ค. ๋๋ฌธ์ ์๋ฌต์ ์ผ๋ก ๋ฆฌ์ผ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ STR ๋ชจ๋ธ ํ์ต์ด ๊ฑฐ์ ๋ถ๊ฐ๋ฅํ๋ค๋ ์๋ฌต์ ์ธ ์์(?)์ด ์์๋ค๊ณ ํ๋ค. ํ์ง๋ง ๋ณธ ๋ ผ๋ฌธ์์๋ ์ด ์์์ด STR ์ฐ๊ตฌ๋ฅผ ๋ฐฉํดํ๋ค๊ณ ๋งํ๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ์ต๊ทผ์ ์ถ์ ๋ ๋ฆฌ์ผ ๋ฐ์ดํฐ์ ์ ํตํฉํ๊ณ ์ง์ ๋ ์ค์ ๋ฐ์ด.. 2023. 3. 12. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis ๋ณธ ๋ ผ๋ฌธ์ ICCV 2019์์ Naver Clova๊ฐ ๋ฐํํ Text Recognition ๋ ผ๋ฌธ์ด๋ค. (๊ณต์ ๋ ํผ์งํ ๋ฆฌ) ์ ์ํ๋ ๋ด์ฉ ๊ธฐ์กด์ ์ ๋ฆฌ๋์ด ์์ง ์๋ STR(Scene Text Recognition) dataset์ ์ ๋ฆฌํ๊ณ STR ์ 4๋จ๊ณ๋ก ๋๋์ด ์ ๋ฆฝํ๋ค. ๋ ผ๋ฌธ์์ ์ ์ํ STR 4๋จ๊ณ๋ ์๋์ ๊ฐ๊ณ , ๊ฐ ๋จ๊ณ์ ๋ชจ๋๋ณ ๊ธฐ์ฌ๋๋ฅผ ์คํ์ ํตํด ์ ๊ณตํ๊ณ ์๋ค. Transformation Stage : TPS(Thin-Plate Spline)์ด๋ผ๋ STN(Spatial Transformation Network)์ ์ ์ฌํ ๋ฐฉ๋ฒ์ผ๋ก ์ด๋ฏธ์ง ๋ ธ๋ฉ๋ผ์ด์ฆ (์๊ณก๋์ด ์๋ ํ ์คํธ๋ฅผ ์ธ์ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ธ์ํ๊ธฐ ์ฌ์ด ํํ๋ก ๋ณํ) Feature Extraction Stage : ์ผ๋ฐ์ ์ธ CNN ์ํคํ ์ฒ... 2023. 3. 12. ์ด์ 1 2 3 4 5 6 7 ยทยทยท 10 ๋ค์ 728x90