728x90
반응형
OCR (Optical Character Recognition)
텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷을 변환하는 과정
사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것
이미지 스캔으로 얻을 수 있는 문서의 활자 영상을 컴퓨터가 편집 가능한 문자코드 등의 형식으로 변환하는 소프트웨어
OCR 작동 원리
이미지 획득
스캐너를 통해 문서를 읽어들여 이진 데이터로 변환
전처리
이미지를 정리하고 오류를 제거하여 읽을 수 있도록 준비
- 스캔된 문서를 조금씩 기울기 보정하거나 틸팅하여 스캔 중의 정렬 문제 해결
- 디지털 이미지의 얼룩을 제거하거나 텍스트 이미지의 가장자리를 부드럽게 만듦
- 이미지 내의 텍스트 상자 및 선을 정리
- 다국어 OCR 기술용 스크립트 인식
텍스트 인식
패턴 매칭
- 글리프(glyph)라고 하는 문자 이미지를 격리해서 유사하게 저장된 글리프와 비교하여 작동
- 저장된 글리프가 입력된 글리프와 비슷한 폰트 및 크기를 가진 경우에만 작동
- 잘 알려진 폰트로 입력된 문서의 스캔 이미지에서 잘 작동
특징 추출
글리프를 선, 닫힌 고리, 선 방향 및 선 교차와 같은 특징으로 나누거나 분해
이런 특징을 사용하여 다양하게 저장된 글리프 가운데 가장 정확히 일치하거나 근사치에 가까운 글리프를 찾음
후처리
분석이 끝나면 추출된 텍스트 데이터를 컴퓨터 파일로 변환
일부 OCR 시스템은 문서의 스캔 버전 전과 후를 모두 포함하는 주석이 달린 PDF 파일을 생성할 수 있다.
OCR 이점
검색 가능한 텍스트
기존 문서 및 새 문서를 모두 검색 가능한 정보 아카이브로 변환
운영 효율성
문서 워크플로 및 디지털 워크플로를 자동으로 통합하여 효율성 향상
인공지능 솔루션
인공지능 기술을 통해 기업들이 비용을 줄이고 고객 경험을 개선하는 마케팅 및 운영 결정을 잘 내릴 수 있도록 한다.
OCR 사용
뱅킹
대출 서류, 수표 입금 및 기타 금융 거래에 필요한 서류 작업을 처리하고 확인
이 확인 작업을 통해 사기를 예방하고 거래 보안을 향상
물류
패키지 라벨, 인보이스, 영수증 및 기타 문서를 보다 효율적으로 추적
의료
치료, 검사, 입원 기록 및 보험료 지불과 같은 환자 기록을 처리
워크플로를 간소화하고 병원의 수작업을 줄이면서 기록을 최신으로 유지
References
728x90
반응형
'NLP > NLP 시스템' 카테고리의 다른 글
[Text Annotation][Text Classification] Label Sleuth (0) | 2023.08.09 |
---|---|
Text Mining (텍스트 마이닝) (0) | 2023.06.20 |
[NLP] Information Extraction (0) | 2021.04.13 |
[NLP] NER(Named Entity Recognition) (0) | 2021.04.12 |