728x90 ๐ Research58 [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Data Augmentation for Scene Text Recognition ํ ์คํธ ์ธ์์ ํฌ์ปค์ค๊ฐ ๋ง์ถฐ์ง augmentation์ด ์์๊น ์ถ์ด ๋ ผ๋ฌธ์ ์ฐพ๋์ค ICCV 2021 ํํ์์ ๋ฐํ๋ STR์์์ Data augmentation ๋ ผ๋ฌธ์ด ์์ด์ ์ ๋ฆฌํ๋ ค ํ๋ค. Abstract ์ผ๋ถ Scene Text Recognition(STR) ๋ชจ๋ธ์ ์ค์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด์ ํ๊ฐํ๊ธฐ ๋๋ฌธ์ ํ์ต ๋ฐ์ดํฐ์ ํ ์คํธ ๋ฐ์ดํฐ ๋ถํฌ ๊ฐ์ ๋ถ์ผ์น๋ ์ฃผ๋ก nosie, artifacts, geometry, structure ๋ฑ์ ์ํฅ์ ๋ฐ์์ ์ฑ๋ฅ ์ ํ๋ก ์ด์ด์ง๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ์ด๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํด 36๊ฐ์ image augmenation function์ผ๋ก ๊ตฌ์ฑ๋ STRAug๋ฅผ ์๊ฐํ๋ค. ๊ฐ ํจ์๋ ์์ฐ ์ฅ๋ฉด์์ ์ฐพ์ ์ ์๊ฑฐ๋ ์นด๋ฉ๋ผ ์ผ์์ ์ํด ๋ฐ์ํ๊ฑฐ๋ ์ ํธ ์ฒ๋ฆฌ ์์ ์ค ๋ฐ์ํ๋ ์ด๋ฏธ์ง ์์ฑ.. 2023. 3. 11. [์น ๋ฐ๋ชจ] ๋ค์ด๋ฒ ํด๋ก๋ฐ OCR ๋ฐ๋ชจ OCR์ ์ด๋ฏธ์ง ์์์ ํ ์คํธ๋ฅผ ์ฐพ๊ณ ์ฝ์ด๋ด๋ ๊ธฐ์ ๋ก ์ต๊ทผ์๋ ์ํ๋ ํ ์คํธ ์ ๋ณด๋ง์ ์ถ์ถํ๋ ์์ค๊น์ง ๋๋ฌํ๊ณ , ์ด ๋ถ์ผ์์๋ ๋ค์ด๋ฒ๊ฐ ์ ๊ณ ์ต๊ณ ์์ค์ ๊ธฐ์ ๋ ฅ์ ๊ฐ์ง๊ณ ์๋ค. ๋ค์ด๋ฒ๋ CVPR 2019์์ ๋ฐํํ Text detection ๋ชจ๋ธ์ธ CRAFT, 21๋ ์ ๋ฐํํ end-to-end document understanding ๋ชจ๋ธ์ธ Donut ๊ทธ๋ฆฌ๊ณ ๊ฐ์ฅ ์ต๊ทผ์ธ 22๋ ์ ๋ฐํํ DEER ๋ชจ๋ธ๊น์ง OCR ๋ถ๋ถ์์ ๋ง์ ๋ ผ๋ฌธ์ ๋ด๊ณ ์๋ค. ๋ ผ๋ฌธ์์์ ์์น์ ์ ์ฑ๋ฅ์ด ์ฐ์ํ ๊ฒ์ ์๊ฒ ๋๋ฐ, ์ค์ ๋ก ์ผ๋ง๋ ์ ๋์ํ๋ ๋ชจ๋ธ์ผ๊น? ๋ค์ด๋ฒ ํด๋ก๋ฐ๋ OCR ์น ๋ฐ๋ชจ๋ฅผ ์ ๊ณตํ๊ณ ์์ด ๋๊ตฌ๋ ์ฌ์ฉํด ๋ณผ ์ ์๋ค. (๋งํฌ) ๋ค์ด๋ฒ ํด๋ก๋ฐ OCR ์น ๋ฐ๋ชจ ํ์ด์ง์์ General OCR, ์์์ฆ, ์ ์ฉ์นด๋ ๋ฑ .. 2023. 3. 1. [์ฐ๊ตฌ ์๊ฐ] ๋ฌธ์ ์ด๋ฏธ์ง ๊ทธ๋ฆผ์์ ๊ฑฐ / ๋ฌธ์ OCR ๊ฒฐ๊ณผ๋ฅผ ํฅ์์ํค๊ธฐ ์ํด ์์ฆ์ ๋ฌธ์๋ฅผ ์ฌ์ง์ผ๋ก ์ฐ์ด์ ํ์ฌ๋ ๊ณต๊ณต ๊ธฐ๊ด์ ์ ์ถํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ์ด ๋ ํ์ฌ๋ ๋ฐ์ ๋ฌธ์์์ OCR ๊ธฐ์ ์ ์ฌ์ฉํด์ ํ ์คํธ๋ฅผ ๋์งํธํ์์ผ์ ์ ์ฅํ๊ฒ ๋๋ค. ๊ทธ๋ฐ๋ฐ ํด๋ํฐ์ผ๋ก ๋ฌธ์ ์ฌ์ง์ ์ฐ๋ ๊ฒฝ์ฐ ๊ทธ๋ฆผ์๊ฐ ๋ง์ด ์๊ฒจ์ ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ๊ฐ ๋จ์ด์ง๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ณ ์ด๋ ํ ์คํธ ์ธ์ ์ค๋ฅ๋ฅผ ๋ฐ์ํ๊ฒ ํ๋ค. ๊ทธ๋ฐ๋ฐ... ์ด๋ฏธ์ง์์ ๊ทธ๋ฆผ์๋ฅผ ์ ๊ฑฐํ๋ ์ฐ๊ตฌ๊ฐ ์กด์ฌํ๋ค๊ณ ํ๋ค. ์ญ์ ์ธ์ ์ฌ๋๋ค์ ์ฐธ ๋๋ํ๊ณ ์๋ ๊ฒ ์ ์๋ค... Paper : BEDSR-Net A Deep Shadow Removal Network from a Single Document Image / CVPR 2020 github : https://github.com/IsHYuhi/BEDSR-Net_A_Deep_Shadow_Removal_.. 2022. 12. 20. [์คํ ์์ค] EasyOCR ํ ์คํธ ๊ฒ์ถ/์ธ์ AI ๋ชจ๋ธ์ ๋ฌด๋ฃ๋ก ์ฝ๊ฒ ์ฌ์ฉํด๋ณด์ https://github.com/JaidedAI/EasyOCR GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chines Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ ... github.com OCR(Optical Character.. 2022. 12. 16. [์คํ ์์ค] BERT๋ฅผ ์ด์ฉํ ํ๊ตญ์ด ๊ฐ์ฒด๋ช ์ธ์ | NER (Named Entity Recognition) NER(Named Entity Recognition) Named Entity Recognition (NER)์ ์์ฐ์ด ์ฒ๋ฆฌ ๊ธฐ์ ์ค ํ๋๋ก, ๋ฌธ์ฅ ๋ด์์ ํน์ ํ ์ ํ์ ๋ช ์นญ(๊ฐ์ฒด)์ ์ธ์ํ๋ ์์ ์ด๋ค. ์๋ฅผ ๋ค์ด, "Steve Jobs๋ Apple์ ์ฐฝ์ ์์ ๋๋ค" ๋ผ๋ ๋ฌธ์ฅ์ด ์๋ค๋ฉด, "Steve Jobs"๋ ์ธ๋ฌผ(person), "Apple"์ ์กฐ์ง(organization)์ด๋ผ๋ ์ ํ์ ๊ฐ์ฒด๋ก ์ธ์๋๋ค. ์ด์ธ์๋ ์ฅ์, ์๊ฐ ๋ฑ ๋ค์ํ ๊ฐ์ฒด๋ฅผ ์ธ์ํ ์ ์๋ค. ์ด๋ฌํ NER์ ์ ๋ณด ์ถ์ถ, ์ง์ ์๋ต, ๋ฆฌ๋ทฐ ๋ถ์, ๊ธฐ๊ณ๋ฒ์ญ ๋ฑ ๋ค์ํ ๊ณณ์์ ํ์ฉ๋ ์ ์๋ค. ์ ํ ์๊ฐํ์ง ๋ชปํ๋ ํ์ฉ์ฒ๋ ๊ธฐ๊ณ๋ฒ์ญ ๋ถ์ผ์ด๋ค. ์์ด๋ฅผ ํ๊ตญ์ด๋ก ๋ฒ์ญํ ๋ ๊ธฐ์ ์ ์ง์นญํ๋ "Apple"์ "์ฌ๊ณผ"๊ฐ ์๋ "์ ํ"๋ก ๋ฒ์ญํด์ผ .. 2022. 12. 15. [์คํ ์์ค] ๋ฌธ์ ์ค์บ๋ / ๋ฌธ์ ์ ๋ฉด ๋ทฐ ๋ณํ / ๋ฌธ์ ์ด๋ฏธ์ง Perspective Transformation https://github.com/andrewdcampbell/OpenCV-Document-Scanner GitHub - andrewdcampbell/OpenCV-Document-Scanner: An interactive document scanner built in Python using OpenCV featuring automat An interactive document scanner built in Python using OpenCV featuring automatic corner detection, image sharpening, and color thresholding. - GitHub - andrewdcampbell/OpenCV-Document-Scanner: An i... github.co.. 2022. 12. 15. ์ด์ 1 2 3 4 5 6 7 8 ยทยทยท 10 ๋ค์ 728x90