brunch

You can make anything
by writing

C.S.Lewis

by IAmAI May 08. 2024

AI와 동거 4일 차: 내 글씨를 판독하는 AI

문자 인식 AI

시험기간이었다. 대학교 도서관에서 정신없이 공부하던 나는 잠시 화장실을 다녀오기 위해 자리를 비웠다. 돌아와서 보니 내 자리 책상 위에 음료수 하나가 놓여있었다. 그 옆에는 티슈 조각에 손글씨가 적혀 있었다.


"열심히 공부하는 모습 멋져요. 

시험 끝나고 연락 주세요. 

010-1234-5678"


웃음이 배시시 나오는 걸 멈출 수 없었다. 대체 누가 나 같은 놈에게 이런 쪽지를 남긴 걸까 너무나 궁금했다. 주변을 휘휘 둘러보았다. 심장이 뛰기 시작했다. 시험에 지쳐있던 몸에 엔도르핀이 돌고 설렘이 온몸을 휘감았다. 이게 진정한 대학 생활인가. 드디어 나에게도 봄이 오는가.

주변을 봐도 아는 사람이 없는 걸 보니 친구들의 장난 같지는 않았다. 그럴 리 없었다. 내 친구들은 이런 수고로운 장난을 칠 애들이 아니다. 어떤 멋진 분이 나에게 이런 적극적인 호의를 보인 건가 싶은 호기심과 기대감에 심장이 터질 것 같았다. 한편으로는 장난인가 싶은 의심이 가시지 않아 계속 두리번두리번 고개를 돌렸다. 내가 너무 산만하게 굴었는지 주변에서 날 이상하게 바라보기 시작해서 두근거리는 심장을 움켜쥐고 다시 쪽지 내용을 한 글자씩 마음속에 새기며 읽었다.

도서관에서 이런 쪽지를 받는 것은 인터넷에서나 볼 수 있는 이야기인 줄 알았다. 그런데 그런 로맨틱한 일이 나에게도 일어나다니 날아갈 듯 기뻐 표정을 감출 수가 없었다. 꿈인가 싶었다.


이건 가문의 영광이었다. 부모님께서 대학 시절 이야기를 자주 해주셨지만 이런 낭만적인 이야기는 들어본 적이 없었다. 스스로가 자랑스러웠다. 이 행복한 순간을 영원히 간직하고 싶어 스마트폰 카메라를 들었다. 조용히 찍는답시고 카메라의 모든 스피커 구멍을 막고 찰칵. 하려던 찰나. 내 모든 기대는 무너졌다.


"열심히 공부하는 모습 멋져요. 시험 끝나고 연락 주세요. 010-1234-5678. 친구 XX 김성준"



내 폰은 쪽지에 적힌 연락처와 문구를 인식했다. 손글씨를 알아보고 이를 복사할 수 있게 확대해 주었고, 전화번호로 바로 연락할 수 있도록 화면에 버튼을 띄워주었다. 이미 저장된 번호가 있다면 그 번호로 연락하도록 이름을 띄워주었다. 그렇게 나온 연락처가 친구 XX 김성준이었다.


그렇게 내 대학생활의 낭만은 와장창 무너졌다. 친구의 장난에 놀아난 것이다.



스마트폰으로 글씨 인식을 할 수 있다는 예시를 보여주기 위해 실화를 바탕으로 이야기를 더 꾸며보았다. 실제로는 대학 시절에 내가 이런 일을 당한 건 아니고, 오히려 장난을 치는 쪽이었다. 열심히 공부하는 친구를 응원하려고 음료수를 사주면서 친 장난이었지만, 당시를 회상하며 당하는 입장에서 글을 쓰다 보니 친구에게 미안해진다.




인공지능은 당신 삶 속의 글씨를 알아본다

인공지능의 발달 전부터 본래 OCR, 즉 광학 문자 인식(Optical Character Recognition) 기술은 이미지 속 글자를 인식하여 디지털 텍스트로 변환해 주는 기술로 여러 곳에서 쓰였다. 사진 속 글씨를 읽어주는 스마트폰 앱부터 서류를 스캔하여 문서로 변환해 주는 프로그램 등등 초창기에는 인식 성공률이 썩 만족스럽지 않았다. 직접 타이핑하기 번거로운 작업에 활용을 하고는 있었지만 스캔 후에 반드시 다시 확인해 보고 수정해야 하니 생각보다 시간이 절약되지 않는 기분이 들곤 했다. 

하지만 글자를 사진이나 영상으로부터 인식하는 기술은 인공지능의 발달과 함께 급격히 성능이 좋아졌다. 정확성이 올라가고 속도가 빨라지니 자연스레 다양한 스마트폰 앱에도 글자 인식 기능이 자주 쓰이게 되었다. 스마트폰 카메라로 명함을 스캔하면 연락처 정보를 추출하여 주소록에 자동 저장해 주는 앱을 사용해 본 적이 있는가? 명함을 받아서 잠깐 스캔만 하면 계속 가지고 다니지 않아도 되니 편리하다. 인식 성공률과 인식 속도가 급격히 좋아졌기 때문에 사람들이 일상적으로 활용하기에도 좋아진 것이다.

영수증을 찍어 가계부에 자동으로 적어주는 앱의 출시도 가능해졌다. 어떤 카페에서 어떤 음료를 먹었는지 간편하게 기록할 수 있다. 월말에 자신이 얼마나 사치스럽게 돈을 썼는지 손쉽게 되새겨보는 기회를 준다.

주머니에 있던 꾸깃한 영수증을 가계부에 등록

또, 시각장애인 분들을 위한 읽기 앱도 OCR 기술의 훌륭한 활용 사례다. 스마트폰 카메라로 책이나 문서를 비추면, 앱이 글자를 인식하여 음성으로 읽어줄 수도 있다. 이러한 기술 덕분에 더 많은 분들이 정보에 접근할 수 있게 되었다.

회사에서 사용하는 업무 시스템에서도 이 기술은 자주 쓰인다. 많은 기업에서 종이 서류를 디지털화하기 위해 OCR 기술을 활용하고 있다. 계약서, 신청서 등 수기로 작성된 문서를 스캔한 후 OCR 프로그램으로 처리하면, 자동으로 텍스트 데이터로 변환된다. 이렇게 되면 문서를 전자적으로 저장, 관리, 검색할 수 있게 된다. 여러 장의 스캔 파일을 다시 타이핑하지 않아도 되니 시간이나 비용을 아낄 수 있게 되는 것이다.

은행에서는 수표의 금액과 서명을 자동으로 인식하는 데에도 OCR 기술을 사용할 수 있다. 우체국에서는 편지 봉투나 엽서에 쓰인 주소를 읽어 자동으로 분류할 수 있다. 도서관에서는 책의 목차나 색인을 디지털화하여 검색 가능한 데이터베이스를 만드는 데에도 OCR이 활용되고 있다.

이 모든 곳에서 인공지능을 이용해 성능을 향상한 OCR 덕분에 많은 시간과 비용을 아낄 수 있게 된 것이다.




어린아이가 글씨를 배우듯

어린아이가 알파벳 카드를 보고 글자를 익히듯, OCR 시스템은 수많은 문자 이미지를 학습한다. 숫자 0과 9의 차이는 동그라미 오른쪽에 직선 형태의 선이 더 있다는 차이를 인식하듯이, 인공지능은 각 글자의 이미지 패턴을 익힌다. 즉, OCR의 기본 원리는 패턴 인식이다. 그리고 새로운 이미지를 입력받으면, 학습한 패턴과 비교하여 가장 유사한 글자를 찾아낸다. 수많은 패턴을 미리 학습시켜 두면, 새로운 글자를 입력했을 때 가장 일치할 확률이 높은 글자를 찾는 일이다. 


MNIST 예제

최근에는 딥러닝 기술의 발달로 OCR의 성능이 크게 향상되었다. 인공신경망을 활용한 딥러닝 알고리즘은 복잡한 글자 이미지에서도 높은 정확도로 문자를 인식해 낸다. 손글씨나 화질이 좋지 않은 이미지에서도 놀라운 인식 성능을 보여준다. 다양한 노이즈에도 유동적으로 대응이 가능해지니 정확도와 속도가 높아진 것이다.

일반적으로 OCR 기능은 다음과 같은 과정으로 이미지를 인식한다.

이미지 입력: 스캐너, 카메라 등을 통해 인식할 이미지를 입력

전처리: 이미지를 이진화하고 노이즈를 제거하는 등 인식에 용이하도록 처리

레이아웃 분석: 이미지 내 텍스트 영역을 찾아내고 문단, 라인 등의 구조를 파악

문자 분할: 개별 문자 단위 혹은 단어로 이미지를 분할

문자 인식: 분할된 문자 이미지를 딥러닝 모델 등을 활용해 인식

후처리: 인식 결과를 교정하고 텍스트 형태로 출력


간단히 말해 이미지를 입력받을 때 글자와 배경을 구분하고, 글자 하나하나 혹은 단어를 통째로 인식해 텍스트를 추출하는 것이다. 스스로 글자를 읽는 과정을 자세히 관찰해 보면 인공지능이 글자를 읽는 과정과 거의 비슷할 것이다. 인공지능이 무언가를 인식하는 과정은 사람이 겪는 과정과 흡사하다.




글자가 있는 곳이면 어디든 AI가 있다

OCR 기술은 우리 일상에 깊숙이 자리 잡고 있다. 우리 주변을 둘러보면 수많은 글자가 있다. 운전할 때 만나는 도로 표지판, 건물 벽면의 간판, 심지어 지나가는 버스의 행선지, 카페의 메뉴판까지 오히려 글자가 없는 곳을 찾아보기가 힘들 정도다. 이는 곧 글자가 있는 곳이라면 어디에나 OCR 기술로 인식하고 활용할 수 있는 정보가 있다는 뜻이다. OCR은 아날로그 정보를 디지털로 연결해 주는 다리 역할을 하면서 이제 우리 삶에 없어서는 안 될 중요한 기술로 자리 잡았다.

최근에는 인공지능의 발달로 OCR의 성능이 향상되면서 더욱 활용처가 많아졌다. 특히 OCR 기술이 스마트 시티, 자율주행차 등 미래 기술과도 활발히 접목되고 있다. 가로등, 신호등, 건물 번호판 등을 인식하여 도시 관리에 활용하기도 하고, 자율주행차가 도로 표지판을 읽고 올바른 경로를 판단하는 데에도 OCR이 핵심적인 역할을 한다.

인공지능의 활용처는 점점 다양해지고 있다. 기존에 있던 기술이지만 인공지능의 도움을 받아 성능이 좋아지면 훨씬 많은 응용이 가능해지는 것이다. 이 말은 인공지능의 활용으로 오히려 더 많은 일자리를 만들어낼 수도 있다는 뜻이리라. 인공지능을 얼마나 잘 활용하는지에 따라 미래 우리 사회의 모습이 달라질 수 있다는 점을 잊지 말자.

이전 04화 AI와 동거 3일 차: 내 말을 알아듣는 AI
brunch book
$magazine.title

현재 글은 이 브런치북에
소속되어 있습니다.

작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari