이미지 속에서 문자 인식해주는 OCR 전성시대
코로나바이러스(코로나19) 확산으로 비대면(언택트) 비즈니스가 활발해지고 있는 가운데, 기업시장을 노리는 국내기업들이 인공지능(AI)이 결합된 광학문자판독장치(OCR) 서비스를 속속 내놓고 있다. OCR은 인공지능(AI) 컴퓨터 비전 기술의 일종으로 이미지 속에서 문자를 자동으로 인식해 추출해주는 것을 말한다. 복잡한 업무용 서류를 다루는 민간기업부터 금융·공공기관까지 OCR 솔루션 도입에 속도를 내는 모습이다.
18일 관련업계에 따르면 삼성SDS는 최근 딥러닝 기반의 OCR 솔루션 삼성 넥스파이낸스 AICR(Nexfinance AICR)을 내놨다. AICR은 삼성SDS가 자체개발한 AI 기반 OCR 기술로 외부환경 요인 노이즈를 제거, 원본 영상의 문서 특징을 강화한 것이 특징이다. 쉽게 말해 저조도, 워터마크, 구겨진 이미지, 기울어짐 및 원근 등을 최적화해 정확하게 인식하는 서비스 상품이다.
사진 = 삼성SDS
삼성SDS는 딥러닝 학습을 통해 고객사 문서 상태 및 서식에 최적화 되도록 학습해 정확도를 개선했다. 이를 통해 문서 종류와 품질에 상관없이 높은 인식률을 유지해준다. 자동으로 데이터 캡처, 글자 단어화 등 사용자 관점의 편리한 기능을 더하고 PC에서 브라우저로 바로 사용할 수 있도록 접근성을 낮췄다. 당장 외환 수출입 심사 자동화, 기업 재무제표, 보험금 청구 자동화, 기업 소송자료 디지털 자산화 등 복잡한 업무처리에 활용될 전망이다.
네이버 클로바의 OCR 기술 또한 삼성SDS와 마찬가지로 기계가 쉽게 데이터를 읽어들이도록 개발됐다. 네이버비즈니스플랫폼은 최근 삼정KPMG에 네이버 클라우드 플랫폼 기반 OCR 서비스 공급 계약을 체결했다. 어느덧 10여개 파트너사가 네이버의 OCR 기술을 업무에 활용하고 있다. 네이버 OCR 기술의 핵심은 자체 AI 플랫폼 클로바에 있다. AI가 더해진 네이버 OCR 기술을 다양한 언어 지원은 물론, 문서별로 최적화된 모델을 제공해 정확한 결과를 도출해낸다. 특히 네이버의 AI 기술을 필요로하는 국내 금융권의 러브콜이 이어지고 있다.
네이버 관계자는 "네이버의 OCR 기술은 단어가 아닌 글자를 하나씩 인식한 후 이를 합치는 방식을 채택하고 특정 이미지의 글자 크기와 자간 등을 계산하는 기술을 개발함으로써 다른 기업의 OCR 서비스보다 약 15% 정확도가 높다"고 설명했다.
사진 = 네이버
신세계 SSG닷컴 또한 지난해 하반기부터 이미지 상품 검색 서비스인 '쓱렌즈'에 OCR 기술을 적용했다. 일일이 입력하기 까다로운 상품 모델번호나 브랜드명도 사진만 찍어두면 텍스트로 추출·검색이 가능하다.
OCR 기술은 상품설명에 게재된 이미지를 분석, 잘못된 정보를 기반으로 판매되는 상품도 걸러준다. 한국어에 서툰 외국인도 촬영사진으로 원하는 상품을 검색할 수 있어 고객 편의성이 높아졌다. 이외에도 한글과컴퓨터 또한 지난해 10월 '한컴오피스 2020'에 AI 기반 문서 이미지를 문서로 변환해주는 '한OCR'을 적용한 바 있다.
원문 바로가기=>
https://www.techm.kr/news/articleView.html?idxno=71739