OCR
#
Find similar titles
- 최초 작성자
- 최근 업데이트
Table of Contents
OCR (Optical Character Recognition; 광학문자인식) #
디지털화되지 않은 물리적인 글씨를 인식하여 텍스트(디지털 문자 데이터)로 인식하는 기술로, 책이나 보고서의 내용을 전산화하는 작업에 많이 활용된다. 실생활에서는 도로나 주차장에서 촬영기기를 통해 자동차 번호판의 번호를 자동 인식하는 목적으로 널리 활용되고 있다. 현재는 기존의 단순 OCR 기술을 넘어서 인공지능 기술로 확장되어 인공지능의 세부 기술인 컴퓨터 비전(Computer Vision)기술 분야로 발전하고 있다.
OCR 기술의 난제 #
사람마다 다른 필체 #
인쇄된 글씨나 자동차 번호판과 같이 규격화된 폰트로 표시된 대상은 인식하기가 상대적으로 수월하지만, 사람이 직접 쓴 필체의 경우 사람마다 필체가 다르고 같은 사람이라도 상황에 따라 동일 문자에 대한 필체가 다르게 쓰일 수 있어서 인식이 매우 까다롭다.
훼손된 글씨 #
규격화된 폰트로 표시된 경우라도 시간이 지나거나 원본이 손상되어 글씨가 훼손되었을 경우 본래의 글씨를 정확하게 인식하기 어려운 면이 있다. 또한 자동차 번호판 경우 기상 상황이나 카메라의 상태에 따라서 물리적인 영상 자체가 정확하지 않게 인식이 될 수 있다.
대표적인 OCR 기술 #
클로바 OCR (https://clova.ai/ocr) #
네이버의 OCR 기술로 한글에 있어서는 세계적인 수준의 인식률을 보여주고 있다.
ABBYY OCR #
ABBYY의 OCR 기술로 일반인들이 사용 가능한 OCR 프로그램 중 가장 성능이 좋은 것으로 알려져 있다.
OCR 기술의 활용 #
여러 IT 빅테크 기업에서. OCR 기술 서비스를 제공하고 있다.
구글의 구글 번역 #
구글 번역에서는 OCR 기술을 통한 문자인식과 이를 바로 번역해주는 서비스를 제공하고 있다.
네이버의 파파고 #
네이버의 번역 서비스인 파파고에서는 OCR 기술을 통한 문자인식과 함께 이렇게 인식한 문자를 편집하고 합성할 수 있는 서비스도 제공하고 있다.
기타 #
우체국에서도 OCR 기술을 이용하여 주소를 인식하는 것으로 알려져 있다.
OCR 기술의 필요성 #
디지털 기술과 인공지능 기술이 발전하면서 빅데이터에 대한 수집과 확보가 매우 중요해진 시점에서, 아직 디지털 문자로 전환되지 않은 과거의 많은 자료에 대한 문자 전환 작업의 중요성이 커지고 있다. 기존 기술로 다 포용하지 못했던 자료들과 전환했더라도 낮은 정확도로 전환이 된 경우에는 최신기술을 통해 문자인식 작업부터 새로 시작해야 할 필요가 있는 상황이라고 할 수 있다.]
OMR과 OCR 기술의 차이 #
OMR은 Optical Mark Recognition(광학마크인식)으로, OCR과 같이 물리적인 글씨를 문자로 인식하는 것이 아니라, 마킹한 위치를 바탕으로 전산화하는 기술이다.