brunch

You can make anything
by writing

C.S.Lewis

by Min Jan 18. 2022

시인은 어떻게 딥러닝을 만날까

투자 아이디어 NVDA, TSLA

운 좋게 Tensorflow Certificate 시험을 합격하고 보니, 딥러닝에 대한 관심이 더 많이 생겨서 이것저것 재미있게 찾아 보고 있다. 첨엔 '이게 뭐야... 이거 가능한 거야?'라는 의문에서... 이제는 '와아 이게 되네...'라는 감탄사를 종종 내뱉게 된다. 


미학 개론 수업을 듣던 예술대 졸업생 입장에서ㅎ 0과 1로 구성된 디지털 세계의 언어는 꽤 생소하고 이질적이지만, 관심을 갖고 지켜보니, 뭐랄까 꽤 시적인 부분이 있다고 해야할까? 라이트 형제가 처음 동력 비행기 원리를 들고 나왔을 때, 사람들은 인간이 날 수 있다는 게 과학적이라기 보다는 시적이라고 생각하지 않았을까? 마찬가지로 딥러닝의 컴퓨터비전이나 자연어처리는 어찌 보면 시적인 부분이 있다는 생각이 든다. 


얼마 전 꽤 재미있게 읽은 책 '비트의 세계'에는 이런 표현이 등장한다.

이론상으로는 무엇이든 다 이진수로 표현할 수 있다. 책이든 음악이든 단세포 생물이든 항성계든 다 마찬가지이다.
<비트의 세계, 프로그래머의 눈으로 본 세상, 인간, 코드/ 데이비드 아우어바흐>


이 구절을 읽고 한참을 이런 저런 상상을 했다. 모든 것은 0과 1로 표현이 가능하다. 그래, 어쩌면 딥러닝의 출발이 여기 이 문장에 담겨 있을 수도 있겠구나... 컴퓨터의 눈으로 세상을 본다는 것은 어떤 의미일까? 0과 1로 모든 것이 표현 가능하다면, 딥러닝의 세계는 꽤 무궁무진 할 수도 있겠구나... 어쨌든, 뼈문과 출신 딥러닝 입문자는 이런 저런 상상의 나래를 펴다가... 텐서플로우 자격증 수업에서 들은 MNIST가 문득 떠올랐다. 


MNIST는 사람의 손글씨 이미지 데이터 셋이다. 0부터 9까지 다양한 손글씨 60,000개가 담겨 있는데, 물론 0부터 9까지라고 해도, 이미지 데이터기 때문에 픽셀(28pixelX28pixel)로 이루어져 있고, 모든 픽셀들은 0(흰색)과 1(검은색)의 구분을 통해 표현이 가능하다. 

MNIST 데이터셋

결국 컴퓨터는 무수한 데이터의 학습을 통해 0부터 9까지 각 숫자의 어떤 픽셀의 위치에 0또는 1이 많이 분포되어 있는지를 스스로 보고 숫자를 구분해 낸다. 내가 이해한 대략적인 MNIST의 원형은 이렇다. 물론 너무 간단하고 압축적인 설명이라 아무래도 세부적인 모델링과 데이터 처리는 좀 더 상세한 안내나 강의를 찾아보는 걸 추천한다. 


어쨌든, 신기하게도 MNIST를 딥러닝으로 학습 시키면 사람의 손글씨가 어떤 숫자인지를 95%이상 정확하게 분류해 낸다. 사람이 눈을 통해 사물을 본다는 건 어떻게 보면 당연하겠지만, 또 달리 보면 지극히 사람 중심의 생각이다. 컴퓨터의 입장에서보면 0과 1을 통해 사물을 보는 것도 지극히 당연한 일일 수 있다. 

컴퓨터 입장에서 사람처럼 보는 방식은 이해할 수 없다

그래서, 그렇게 컴퓨터가 사람의 손글씨를 분류해 내면 무슨 의미가 있냐고 물을 수 있지만, 실제 현실에선 벌써 많은 분야에서 점차 적용이 되고 있는 것 같다. 고객이 적어놓은 우편번호나 전화번호 등의 기록을 사진으로 촬영하고 자동으로 정보를 파악해 분류하는 등의 인공지능 시스템도 운송업체에서 사용 중인 걸로 알고 있다. 뭐, 테슬라의 자율주행도 넓게 보면 그러한 컴퓨터 비전의 한 종류로 생각이 된다.


컴퓨터가 볼 수 있다는 거... 꽤 시적인 구석이 있는 것 같다. 과거, 라이트형제의 비행 기술은 과학적이라기 보다 시적인 구석이 있었다. 그리고 결국 인류의 역사를 송두리째 바꿨다. 비행 기술이 없었다면 지금 세계화 된 인류는 없었을 것이다. 물론, 코로나도 이렇게까지 광범위하게 유행하지 않았겠지만...

작가의 이전글 오스템임플란트는 어떻게 탱크가 되었나
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari