이미지·PDF를 텍스트로 변환하기
이미지나 PDF 속 글자를 복사하고 싶은데 드래그가 되지 않을 때,
스캔한 PDF를 수정해야 하는데 편집할 수 있는 도구가 없을 때,
많은 분들이 결국 처음부터 다시 타이핑하기를 선택하시죠.
저도 공부나 블로그 자료 때문에 문서를 정리할 때
이런 작업 때문에 시간을 두 세배로 쓰곤 했습니다.
그런데 요즘은 이 과정을 자동으로 처리해주는
무료 OCR 프로그램들이 정말 잘 나와있습니다.
이 글에서는 실사용 경험을 바탕으로
이미지/PDF를 텍스트로 변환할 때 쓸 수 있는 무료 OCR 프로그램 TOP 5를
비교하고 정리해 드리려고 합니다.
이 글 하나로
어떤 무료 OCR 프로그램을 써야 할지
이미지/PDF를 텍스트로 변환하는 가장 효율적인 방법은 무엇인지
한 번에 정리하실 수 있도록 구성했습니다.
이미지·PDF 텍스트 변환의 핵심 기술
먼저 간단히 개념부터 짚고 넘어갈게요.
OCR(Optical Character Recognition), 한국어로는 '광학 문자 인식'이라고 부르는 기술입니다.
조금 더 쉽게 설명하자면,
이미지나 PDF 안에 있는 글자를 컴퓨터가 읽고
복사/편집 가능한 텍스트로 바꿔주는 기술
이라고 이해하시면 됩니다.
그래서 OCR 프로그램으로
스캔한 문서에서 텍스트 추출
책/교재/논문 페이지 캡쳐 후 텍스트 복사
이미지로 된 표, 메뉴판, 광고 문구 정리
외국어 이미지 텍스트 추출 후 번역
이런 작업들을 훨씬 빠르고 가볍게 처리할 수 있습니다.
이제부터는 본격적으로 무료 OCR 프로그램들을 소개하고
어떤 도구를 선택하면 좋을지 살펴보겠습니다.
먼저 전체 그림을 보기 쉽게,
TOP 5 무료 OCR 프로그램 목록과 특징을 표로 정리했습니다.
비교 기준은 다음과 같습니다.
한글 인식률
PDF 지원 여부
이미지 캡쳐 기반 OCR 지원 여부
무료 사용 한도
사용 난이도, 편의성
추천 사용 환경 (맥/윈도우/웹/모바일)
이제 각 프로그램을 하나씩 살펴보면서,
어떤 상황에 가장 잘 맞는지 함께 보겠습니다.
맥을 사용하신다면, 무료 OCR 프로그램 1순위는 Shottr라고 말씀드리고 싶습니다.
Shottr는 원래 '스크린샷 캡쳐 앱'으로 유명한데요,
여기에 포함된 OCR 가능의 정확도와 속도가 정말 뛰어납니다.
Shottr의 장점
단축키로 캡쳐하면, 바로 텍스트 인식 가능
한글 인식률 매우 높은 편
용량이 작고 가벼워서 상시 띄워두어도 부담 없음
Shottr의 아쉬운점
Mac 전용이라 윈도우에서는 사용 불가
PDF 자체를 바로 열어서 사용할 순 없고,
PDF를 화면에 띄운 뒤 필요한 부분을. 캡쳐해서 쓰는 방식
OCR 가이드
프로그램을 설치하고
캡쳐 영역을 드래그한 뒤
OCR 버튼을 누르면 텍스트가 자동으로 복사됩니다.
두 번째로 추천드릴 무료 OCR 프로그램은 Google Keep입니다.
많이들 메모 앱으로 알고 게시지만,
이미지를 첨부하면 '이미지에서 텍스트 추출' 기능을 바로 사용하실 수 있어요.
Google Keep 장점
별도 설치 없이 웹/모바일에서 바로 사용
구글 계정만 있으면 무료
인식된 텍스트를 Keep 메모/Google Docs로 자연스럽게 연결
영어/한글 등 주요 언어 인식률 양호
Google Keep 아쉬운 점
PDF 파일은 직접 OCR 불가
복잡한 표나 레이아웃이 있는 문서는 인식률이 떨어짐
OCR 가이드
Google Keep에 이미지 첨부 -> 우측 상단 메뉴에서 "이미지에서 텍스트 추출" 선택
-> 웹 버전 기준으로 캡쳐 추천
세 번째로 소개할 무료 OCR 프로그램은 i2OCR 입니다.
회원가입 필요 없고 + 광고도 거의 없는, 깔끔한 웹 OCR 도구입니다.
i2OCR의 장점
이미지, PDF 모두 지원
100개 이상의 언어 지원 (한글 포함)
인식 결과를 복사하거나 txt 파일로 저장 가능
설치/로그인 없이 웹에서 바로 사용 가능
i2OCR 아쉬운 점
인터페이스가 다소 투박하고 올드함
저해상도/흐린 문서에는 인식률이 떨어짐
한 번 사용하는 데 선택 사항이 많아서 번거로움
OCR 가이드
i2OCR 첫 화면에서 [파일 업로드], [언어], [출력 형식] 선택
텍스트 결과가 오른쪽에 표시됨
Convertio는 원래 파일 형식 변환 서비스로 유명하지만,
여기에 포함된 OCR 기능도 꽤 쓸만한 수준입니다.
Convertio의 장점
PDF, JPG, PNG 등 다양한 파일 포맷 지원
구글 드라이브, 드롭박스 연동 가능
변환 + OCR을 한 번에 처리 가능
별도 설치 없이 웹 브라우저에서 사용
Convertio의 아쉬운 점
무료 버전은 용량 제한 (10MB)
하루 사용 횟수도 제한 있음
(큰 용량 PDF를, 자주 다룬다면 유료 플랜 필요)
OCR 가이드
Convertio에서 "OCR" 기능을 선택 -> 문서 업로드
결과 다운로드 버튼 클릭
다섯 번째로 소개해드릴 도구는 바로 라이브위키 입니다.
라이브위키는 화면 캡쳐 기반 OCR은 지원하지 않지만,
PDF 파일 내 텍스트 인식/번역/요약/정리 기능이 매우 뛰어난 서비스입니다.
특히 긴 PDF에서 필요한 부분만 압축해 정리하거나, 빠르게 읽어야 할 때 크게 도움이 돼요.
PDF 안의 텍스트를 OCR로 손쉽게 활용할 수 있게 해주는 거죠.
라이브위키의 강점
PDF 업로드만 하면 텍스트 자동 분석
-> OCR로 텍스트를 뽑은 뒤 다시 요약해야 하는 번거로움 없음
긴 문서를 자동으로 정리/요약
-> 공부, 보고서 작성, 자료 조사 시 진짜 편함
중요 키워드, 핵심 문단 탐색이 탁월함
요약 내용 저장/아카이빙, 메모 가능
쉽고 간편하고 익숙한 UI
개인적인 의견으로는,
OCR로 텍스트만 뽑는 것을 넘어 정리 가능한 형태로 받아보고 싶은 사용자나
자료 조사와 동시에 아카이빙하고 싶은 경우에 강추합니다.
아쉬운 점
이미지(캡쳐, 사진)은 업로드 불가
OCR 가이드
(+) 버튼 눌러 업로드할 PDF 선택 후, > 버튼으로 업로드
[아티클], [페이지] 탭에서 결과 확인
* 추출된 텍스트와 원문 PDF를 나란히 보여줍니다.
* 외국어 자료라도 자동 번역해줍니다.
이제 '어떤 프로그램이 가장 잘 읽어주는지' 궁금하실텐데요,
실제 문서를 가지고 테스트했던 결과를 간단히 정리해보았습니다.
테스트에 사용한 문서는
선명한 텍스트 이미지
스캔본 PDF
표가 포함된 문서
이렇게 세 타임이었고,
저는 특히 한글 OCR 성능을 눈여겨봤습니다.
정리해보면,
맥에서 화면을 캡쳐하며 한글 텍스트를 추출해야 할 때는 Shottr가 가장 좋았고
PDF 파일을 그대로 올릴 수 있는 환경에서는 라이브위키가 좋았어요.
이제 "그래서 나는 뭘 쓰면 되지?"라는 질문으로 자연스럽게 이어질텐데요,
사용 환경별로 추천 조합을 정리해보겠습니다.
맥(Mac) 사용자라면 Shottr,
윈도우 사용자라면 Google Keep
PDF 문서를 바로 정리하고 싶다면 라이브위키
그냥 저냥 쓸만한 툴을 찾는다면 i2OCR이나 Convertio
공문서, 계약서, 중요한 보고서에 쓸 경우에는 유료 프로그램(ABBYY 등)이 더 안전합니다.
마지막으로, 어떤 OCR 프로그램을 쓰든
인식률과 작업 효율을 높일 수 있는 팁을 정리해 보았습니다.
흐릿한 사진, 기울어진 페이지는 인식률을 크게 떨어뜨려요.
촬영 시 밝고 평평한 곳에서, 그림자 없이 촬영해주세요.
가능하면 스캔 / 고해상도 캡쳐를 추천합니다.
표 전체를 한꺼번에 OCR 돌리기보다는
행/열을 기준으로 나눠 여러 번 인식시키면
수정해야 할 부분이 훨씬 줄어듭니다.
주기적으로 문서를 정리하고, 공부하고, 정리하는 사람이라면
OCR 프로그램 하나만 잘 골라도 작업 시간이 눈에 띄게 줄어듭니다.
이 글이
무료 OCR 프로그램을 찾고 계셨던 분들께는
선택 가이드가 되고,
이미 하나 쓰고 계셨던 분들께는
새로운 조합과 활용 팁을 드릴 수 있었으면 좋겠습니다.