728x90 ๐ Research/OCR8 [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Character Region Awareness for Text Detection / CRAFT / ํ ์คํธ ๊ฒ์ถ ๋ณธ ๋ ผ๋ฌธ์ Naver Clova์์ CVPR 2019 ์ ๋ฐํํ Text Detection ๋ ผ๋ฌธ์ผ๋ก, CRAFT ๋ผ๋ ๋ชจ๋ธ์ ์ ์ํ๋ค. Text Detection ๋ถ์ผ์์ ์๋ ์ ๋ช ๋ ๋ ผ๋ฌธ์ด๊ณ ๊ฐ์ธ์ ์ผ๋ก ํ ์คํธ ๊ฒ์ถ์ ์ํด ํ ์คํธ์ ํน์ฑ๊ณผ ๋ฅ๋ฌ๋์ ํ์ต ํน์ฑ์ ์์ฃผ ํจ์จ์ ์ผ๋ก ์ด์ฉํ ๋งค๋ ฅ์ ์ธ ์ฐ๊ตฌ๋ผ ์๊ฐํ๋ค. ์์ธํ ์ค๋ช ์ ๋ค๋ฅธ ๋ธ๋ก๊ทธ์์๋ ์ ๋์์์ผ๋ ๋๋ ๋ชจ๋ธ ํ์ต์ ์ํ ํต์ฌ์ ์ธ ๋ถ๋ถ๋ง ์ ๋ฆฌํ๋ ค ํ๋ค. CRAFT ๋ชจ๋ธ์ ํต์ฌ CRAFT ๋ชจ๋ธ์ ํ ์คํธ ๊ฒ์ถ์ ์ํด ๋จ์ด bbox๋ฅผ ๋ฐ๋ก ์์ธกํ๋ ๊ฒ์ด ์๋๋ผ, ๋ฌธ์์ ์์น๋ฅผ ๋ํ๋ด๋ region score, ๋ฌธ์๊ฐ ๊ฑฐ๋ฆฌ๋ฅผ ๋ํ๋ด๋ affinity score๋ฅผ ์์ธก ์ด๋ฅผ ์ํด์๋ character-level annotation์ด ํ์ํ๋ฐ ๋ฌธ์ ํ๋ ํ๋.. 2023. 3. 13. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] What If We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels ๋ณธ ๋ ผ๋ฌธ์ CVPR 2021์์ ๋ฐํ๋ Text Recognition ๋ ผ๋ฌธ์ผ๋ก, TRBA ๋ชจ๋ธ ('What is wrong with scene text recognition model comparisons? dataset and model analysis')์ ์ ์ํ ๋ฐฑ์ ํ ๋์ ๋ ผ๋ฌธ์ด๊ธฐ๋ ํ๋ค. ๋ณธ๋ฌธ ๋ด์ฉ Scene Text Recognition (STR) ์ฐ๊ตฌ์์๋ ๋ฆฌ์ผ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ๊ธฐ ๋๋ฌธ์ ์ผ๋ฐ์ ์ผ๋ก ๋๊ท๋ชจ ํฉ์ฑ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ํ์ต์ ์งํํ๋ค. ๋๋ฌธ์ ์๋ฌต์ ์ผ๋ก ๋ฆฌ์ผ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ STR ๋ชจ๋ธ ํ์ต์ด ๊ฑฐ์ ๋ถ๊ฐ๋ฅํ๋ค๋ ์๋ฌต์ ์ธ ์์(?)์ด ์์๋ค๊ณ ํ๋ค. ํ์ง๋ง ๋ณธ ๋ ผ๋ฌธ์์๋ ์ด ์์์ด STR ์ฐ๊ตฌ๋ฅผ ๋ฐฉํดํ๋ค๊ณ ๋งํ๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ์ต๊ทผ์ ์ถ์ ๋ ๋ฆฌ์ผ ๋ฐ์ดํฐ์ ์ ํตํฉํ๊ณ ์ง์ ๋ ์ค์ ๋ฐ์ด.. 2023. 3. 12. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis ๋ณธ ๋ ผ๋ฌธ์ ICCV 2019์์ Naver Clova๊ฐ ๋ฐํํ Text Recognition ๋ ผ๋ฌธ์ด๋ค. (๊ณต์ ๋ ํผ์งํ ๋ฆฌ) ์ ์ํ๋ ๋ด์ฉ ๊ธฐ์กด์ ์ ๋ฆฌ๋์ด ์์ง ์๋ STR(Scene Text Recognition) dataset์ ์ ๋ฆฌํ๊ณ STR ์ 4๋จ๊ณ๋ก ๋๋์ด ์ ๋ฆฝํ๋ค. ๋ ผ๋ฌธ์์ ์ ์ํ STR 4๋จ๊ณ๋ ์๋์ ๊ฐ๊ณ , ๊ฐ ๋จ๊ณ์ ๋ชจ๋๋ณ ๊ธฐ์ฌ๋๋ฅผ ์คํ์ ํตํด ์ ๊ณตํ๊ณ ์๋ค. Transformation Stage : TPS(Thin-Plate Spline)์ด๋ผ๋ STN(Spatial Transformation Network)์ ์ ์ฌํ ๋ฐฉ๋ฒ์ผ๋ก ์ด๋ฏธ์ง ๋ ธ๋ฉ๋ผ์ด์ฆ (์๊ณก๋์ด ์๋ ํ ์คํธ๋ฅผ ์ธ์ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ธ์ํ๊ธฐ ์ฌ์ด ํํ๋ก ๋ณํ) Feature Extraction Stage : ์ผ๋ฐ์ ์ธ CNN ์ํคํ ์ฒ... 2023. 3. 12. [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Data Augmentation for Scene Text Recognition ํ ์คํธ ์ธ์์ ํฌ์ปค์ค๊ฐ ๋ง์ถฐ์ง augmentation์ด ์์๊น ์ถ์ด ๋ ผ๋ฌธ์ ์ฐพ๋์ค ICCV 2021 ํํ์์ ๋ฐํ๋ STR์์์ Data augmentation ๋ ผ๋ฌธ์ด ์์ด์ ์ ๋ฆฌํ๋ ค ํ๋ค. Abstract ์ผ๋ถ Scene Text Recognition(STR) ๋ชจ๋ธ์ ์ค์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด์ ํ๊ฐํ๊ธฐ ๋๋ฌธ์ ํ์ต ๋ฐ์ดํฐ์ ํ ์คํธ ๋ฐ์ดํฐ ๋ถํฌ ๊ฐ์ ๋ถ์ผ์น๋ ์ฃผ๋ก nosie, artifacts, geometry, structure ๋ฑ์ ์ํฅ์ ๋ฐ์์ ์ฑ๋ฅ ์ ํ๋ก ์ด์ด์ง๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ์ด๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํด 36๊ฐ์ image augmenation function์ผ๋ก ๊ตฌ์ฑ๋ STRAug๋ฅผ ์๊ฐํ๋ค. ๊ฐ ํจ์๋ ์์ฐ ์ฅ๋ฉด์์ ์ฐพ์ ์ ์๊ฑฐ๋ ์นด๋ฉ๋ผ ์ผ์์ ์ํด ๋ฐ์ํ๊ฑฐ๋ ์ ํธ ์ฒ๋ฆฌ ์์ ์ค ๋ฐ์ํ๋ ์ด๋ฏธ์ง ์์ฑ.. 2023. 3. 11. [์น ๋ฐ๋ชจ] ๋ค์ด๋ฒ ํด๋ก๋ฐ OCR ๋ฐ๋ชจ OCR์ ์ด๋ฏธ์ง ์์์ ํ ์คํธ๋ฅผ ์ฐพ๊ณ ์ฝ์ด๋ด๋ ๊ธฐ์ ๋ก ์ต๊ทผ์๋ ์ํ๋ ํ ์คํธ ์ ๋ณด๋ง์ ์ถ์ถํ๋ ์์ค๊น์ง ๋๋ฌํ๊ณ , ์ด ๋ถ์ผ์์๋ ๋ค์ด๋ฒ๊ฐ ์ ๊ณ ์ต๊ณ ์์ค์ ๊ธฐ์ ๋ ฅ์ ๊ฐ์ง๊ณ ์๋ค. ๋ค์ด๋ฒ๋ CVPR 2019์์ ๋ฐํํ Text detection ๋ชจ๋ธ์ธ CRAFT, 21๋ ์ ๋ฐํํ end-to-end document understanding ๋ชจ๋ธ์ธ Donut ๊ทธ๋ฆฌ๊ณ ๊ฐ์ฅ ์ต๊ทผ์ธ 22๋ ์ ๋ฐํํ DEER ๋ชจ๋ธ๊น์ง OCR ๋ถ๋ถ์์ ๋ง์ ๋ ผ๋ฌธ์ ๋ด๊ณ ์๋ค. ๋ ผ๋ฌธ์์์ ์์น์ ์ ์ฑ๋ฅ์ด ์ฐ์ํ ๊ฒ์ ์๊ฒ ๋๋ฐ, ์ค์ ๋ก ์ผ๋ง๋ ์ ๋์ํ๋ ๋ชจ๋ธ์ผ๊น? ๋ค์ด๋ฒ ํด๋ก๋ฐ๋ OCR ์น ๋ฐ๋ชจ๋ฅผ ์ ๊ณตํ๊ณ ์์ด ๋๊ตฌ๋ ์ฌ์ฉํด ๋ณผ ์ ์๋ค. (๋งํฌ) ๋ค์ด๋ฒ ํด๋ก๋ฐ OCR ์น ๋ฐ๋ชจ ํ์ด์ง์์ General OCR, ์์์ฆ, ์ ์ฉ์นด๋ ๋ฑ .. 2023. 3. 1. [์ฐ๊ตฌ ์๊ฐ] ๋ฌธ์ ์ด๋ฏธ์ง ๊ทธ๋ฆผ์์ ๊ฑฐ / ๋ฌธ์ OCR ๊ฒฐ๊ณผ๋ฅผ ํฅ์์ํค๊ธฐ ์ํด ์์ฆ์ ๋ฌธ์๋ฅผ ์ฌ์ง์ผ๋ก ์ฐ์ด์ ํ์ฌ๋ ๊ณต๊ณต ๊ธฐ๊ด์ ์ ์ถํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ์ด ๋ ํ์ฌ๋ ๋ฐ์ ๋ฌธ์์์ OCR ๊ธฐ์ ์ ์ฌ์ฉํด์ ํ ์คํธ๋ฅผ ๋์งํธํ์์ผ์ ์ ์ฅํ๊ฒ ๋๋ค. ๊ทธ๋ฐ๋ฐ ํด๋ํฐ์ผ๋ก ๋ฌธ์ ์ฌ์ง์ ์ฐ๋ ๊ฒฝ์ฐ ๊ทธ๋ฆผ์๊ฐ ๋ง์ด ์๊ฒจ์ ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ๊ฐ ๋จ์ด์ง๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ณ ์ด๋ ํ ์คํธ ์ธ์ ์ค๋ฅ๋ฅผ ๋ฐ์ํ๊ฒ ํ๋ค. ๊ทธ๋ฐ๋ฐ... ์ด๋ฏธ์ง์์ ๊ทธ๋ฆผ์๋ฅผ ์ ๊ฑฐํ๋ ์ฐ๊ตฌ๊ฐ ์กด์ฌํ๋ค๊ณ ํ๋ค. ์ญ์ ์ธ์ ์ฌ๋๋ค์ ์ฐธ ๋๋ํ๊ณ ์๋ ๊ฒ ์ ์๋ค... Paper : BEDSR-Net A Deep Shadow Removal Network from a Single Document Image / CVPR 2020 github : https://github.com/IsHYuhi/BEDSR-Net_A_Deep_Shadow_Removal_.. 2022. 12. 20. ์ด์ 1 2 ๋ค์ 728x90