[오픈 소스] EasyOCR 텍스트 검출/인식 AI 모델을 무료로 쉽게 사용해보자

https://github.com/JaidedAI/EasyOCR

GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chines

Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc. - GitHub - JaidedAI/EasyOCR: Ready-to-use OCR with 80+ ...

github.com

OCR(Optical Character Recognition) 기술은 각종 문서나 이미지에서 텍스트를 읽어들여 아날로그 데이터를 디지털화하는 기술이다. 별거 아닌 것 같은 기술 같아 보이지만 학습 데이터를 구성하기 어렵고 나라별 언어가 다르고 같은 언어이더라도 글씨체가 다양해서 고도화시키기 어려운 AI기술 중 하나라 생각한다. 하지만 여러 자동화 작업에 필수적인 기술이라 굉장히 많은 기업에서 OCR 모델을 개발해서 사용하거나 외부 솔루션 업체의 API를 구매하여 사용하고 있는 추세이다.

이런 OCR 모델을 공짜로 제공하는 오픈 소스가 몇 가지 있는데 EasyOCR 이라는 오픈소스가 약 80개의 언어의 텍스트 검출 및 인식 기능을 제공한다. 레퍼지토리의 Readme 파일도 아주 쉽게 작성되어있고 테스트하기도 정말 간편하게 만들어져 있다.

게다가 라이센스는 Apache-2.0 이라 부담없이 사용할 수 있다.

EasyOCR 프레임워크

물론 EasyOCR의 프레임워크는 텍스트 검출 모델은 Naver Clova AI의 CRAFT 모델을, 인식 모델에는 CRNN 모델을 사용하여 비교적 옛날 모델을 사용하고있지만 직접 사용해본 결과 꽤 만족스러운 성능이 나온다.

물론 대부분의 공개된 AI 모델이 그렇듯 바로 상용 서비스에 적용하기엔 부족한 성능이긴 하지만 어느정도의 텍스트 검출 및 인식 성능을 원하는 분들껜 이보다 좋은 옵션은 없을 것 같다.

특히 전체 프레임워크 중간 중간에 OCR에 필요한 pre/mid/post processing 이 포함되어 있어 전체적인 OCR 프레임워크를 구성해야 하는 분들에게 도움이 될 것 같다.

EasyOCR 사용법

EasyOCR 패키지를 설치하고 인식하길 원하는 언어로 Reader 를 선언하고 이미지를 넣어주면 된다.

import easyocr

reader = easyocr.Reader(['kr','en']) # Korean, English
result = reader.readtext('text.jpg')

EasyOCR 커스텀 모델 학습

EasyOCR은 커스텀 모델 학습 기능도 제공한다. (trainer 폴더)

특히 CRAFT 모델의 경우 오피셜 레퍼지토리에서 학습 코드를 제공하지 않기 때문에 CRAFT 모델 학습을 위해서는 대부분 easyOCR을 활용하는 것 같다.

'🏛 Research > OCR' 카테고리의 다른 글

[논문 리뷰] What If We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels (0)	2023.03.12
[논문 리뷰] What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis (0)	2023.03.12
[논문 리뷰] Data Augmentation for Scene Text Recognition (0)	2023.03.11
[연구 소개] 문서 이미지 그림자제거 / 문서 OCR 결과를 향상시키기 위해 (0)	2022.12.20
[오픈 소스] 문서 스캐너 / 문서 정면 뷰 변환 / 문서 이미지 Perspective Transformation (0)	2022.12.15

'🏛 Research > OCR' 카테고리의 다른 글

티스토리툴바