brunch

You can make anything
by writing

C.S.Lewis

by 사만다 Jan 29. 2018

카카오브레인에서 글을 쓰는 5가지 이유

2017년 8월 9일. 교보문고 광화문점에 들러 구매한 '인공지능의 현대적 접근방식’이라는 책이다. AI, 머신러닝 그리고 딥러닝의 변천사라는 기사를 준비하면서 '인공지능 관련 기사를 쓴다는 녀석이 기본서조차 보지도 않고, 온라인에 떠돌아다니는 블로그나 봐서야 되겠어?'라고 큰맘 먹고 산 책이다. 하지만 밤새 책을 읽으면서도(정확히는 필요한 부분만 발췌해서 읽었다) 마음 깊숙이 의구심이 싹트기 시작했다.

인공지능을 아는 척하는 건 아닐까. 전공자도 아닌 내가 나름 공부한다면서 쓰는 글이 정말로, 정확하다고 할 수 있을까. 저명한 교수나 연구자들이 썼다던 보고서를 읽는 것으로 지식을 쌓고 있다고 자만하는 건 아닐까. 인공지능을 연구한다는 사람들이 펜대를 들기 시작한다면, 나 같은 사람들은 어떻게 돌파구를 찾아야 하나.

안녕하세요, 카카오브레인의 사만다입니다.라는 글에서도 밝혔듯이, 인공지능과 관련된 역사서도 살펴보고, 영화도 보고, 철학책도 보고, 연구자도 만나고, 기술논문만 종일 들여다보고 싶은 마음이 정말 컸다. 전문가들에게 내가 이해하는 게 맞는지, 그렇지 않다면 뭐가 틀린 것인지 하나씩 확인해가며 정확한 글을 쓰고 싶었다. 그렇게 인공지능 하나만 죽어라, 파다보면 콘텐츠 역사에 한 획을 그을 수 있겠다는 확신도 섰다.

그렇게 지난해 9월 인공지능을 연구하는 본진인 카카오브레인으로 이직했다. 오는 2월이면 멋진 사람들과 함께 하는 대항해에 참여한지 6개월 차가 된다. 이를 자축하는 기념으로 콘텐츠 크리에이터가 물리학 전공자, 수학 전공자, 통계학과 전공자, 컴퓨터공학 전공자들 사이에서 일하면 무엇이 좋은지 5가지로 정리해봤다. (대외적으로 공개된 것 이외의 진행 상황에 대해서는 구태여 언급하지 않지만, 사실 여기에 보이는 것 외에 정말 많은 일을 하고 있다!!)

1.언제든지 질문할 수 있다.

지난해 10월에는 카카오브레인의 천영재 연구원과 알파고 제로(ZERO) 논문에 관해 글 쓰는 일을 진행했다. 다행히 알파고와 이세돌 9단과의 대결을 취재했던 터라 알파고의 기본적인 스펙에 대해서는 어느 정도 숙지하고 있었다. 그래봤자 알고 있는 건 알파고의 스펙이나 정책망(policy network), 가치망(value network) 정도였다.

알파고는 끝났지만 내 고민은 시작됐다

58조 홍보효과 알파고 몸값이 고작 240억?

[인간 vs 인공지능] 제프 딘 수석연구원 "구글, 머신러닝 적용 비중 25%"

자체적으로 진행된 알파고 제로 논문 리뷰를 보며 경탄했다. 만일 해당 논문을 옆구리에 끼고 혼자 이해하려고 했다면 아무리 시간을 많이 들이더라도 100% 온전히 이해하는 건 어려웠을 것이다. 카카오브레인에서는 달랐다. 연구원이 해 준 브리핑 자료를 기반으로, 이해가 안 되는 부분만 골라 질의응답을 할 수 있었다. 온라인 메신저를 통해 하나하나 물어봐도 되고, 연구원 자리에 찾아가 물어봐도 되고, 라운지에서 즉석 질의응답 시간을 가질 수 있다.

당시 나는 천영재 연구원에게 "롤아웃이 뭐예요?" "신경망 합치면 어떤 효과를 얻는 거예요?" 등 내 머리로는 이해하지 못하거나 낯선 개념들에 대해 꼬치꼬치 캐물었다. 기자 생활을 하면서도 이렇게까지 집요하게 물어본 적은 거의 없는 것 같다. 취재 대상인 스타트업 또는 기업이 투자를 어떻게 받았던, 좋은 투자자를 어떻게 만났는지, 솔직히 그런 건 별로 궁금하지 않았다. 기자 일 했을 때도 기술 구현 방식이 항상 내 주요 관심사였다.

[카카오AI리포트]알파고 제로 vs 다른 알파고

다행인 건 아무도 내 질문에 귀찮다는 표정을 짓지 않는다는 것이다. “선생님 CNN 좀 설명해주세요”라고 하면 흔쾌히 시간 내서 설명해준다. 물론 눈치껏 알아서 요청한다. 점심시간 전후 등 연구원들이 한숨 돌린 시간을 공략해서 말이다. 잘 아는 사람이 역시, 설명도 잘한다. 심지어 딥알못(딥러닝을 잘 알지 못하는 사람)인 나를 위해 친히 칠판이나 아이패드 프로에 그래프나 그림까지 그려준다. 자신이 잘 아는 걸, 시간 내서 설명해주는 것에 대해 늘 감사할 따름이다.

2.대중적인 글쓰기에 집중할 수 있다.

앞서 언급햇듯이 백날 수백개의 논문(정확히 말하자면 초록과 도입부다)을 읽어봤자, 나 같은 딥알못은 기술을 온전히 이해하지 못한다. 기술을 직접 구현해보는 것도 아니면서 이론만 안다고 떠드는 게 오만하다는 것쯤은 안다. 그래서 새롭게 펼친 전략은 바로, 카카오브레인 연구원과 긴밀히 협업하는 것이다. 나는 좀 더 대중적으로 쓸 수 있는 방법론을 고민하고, 연구원들은 전문적인 기술적 인사이트를 제공하는 식이다.

기술을 어떻게 구현하는지 서술하는 것만큼이나 이런 기술이 실생활에 어떻게 쓰일지, 그리고 우리 삶을 어떻게 바꿀지 그 청사진을 보여주는 것 또한 중요하다. 나는 이걸 문학적 영감이라고 부른다. 우리가 당면한 과제가 무엇인지, 혹은 인간이 느끼는 헛헛함이 무엇인지를 올바르게 꿰뚫는 것을 의미한다. 아쉽게도 상상력이 부족한 나는 그 여느 때보다 더 많은 책과 영화를 보려고 노력한다. 이렇게 많이 봤었나 싶을 정도로 많이 본다. 개인적으로는 퇴근 후 SF영화나 드라마도 시간 내서 꼭 본다. 카카오브레인 연구원들이 자기 시간을 쪼개가며 연구하는 기술들이 앞으로의 인간 사회를 어떻게 바꾸어 나갈지, 그 발칙한 상상을 하면서 말이다.

그렇게 인공지능 콘텐츠를 마음이 절로 충만해짐을 느낀다. 뿌듯함, 성취감, 진취성, 생산성 뭐 그런 것들로 말이다. 인공지능 영화나 책을 하나라도 더 찾아보고, 기사나 보고서를 하나라도 더 읽고, 문장에 적합한 단어가 무엇인지 조금이라도 더 고민할 수 있어서다. 기사를 쓸 때와 비교하면 상대적으로 심적으로, 물리적으로 여유가 있어서 가능한 일이기도 하다.

물론 아무리 대중을 위한 글쓰기에 초집중하더라도 안 되는 일도 있다. 바로 용어를 한글화하는 일이다. 실제로 연구자들이 일상적으로 사용하는 말이 영어인지, 한국어인지조차 헷갈리기 시작한다.

나 : "data augmentation, 이거 한국어로 어떻게 해요?"
카카오브레인 연구원들 : "데이터 어그멘테이션?"
나 : "으엉...." "gradient explosion 이건요?"
카카오브레인 연구원들 : "그레디언트 익스플로젼?"
나 : "으어....."

뿐만 아니라. adversarial training이나 GAN(Generative adversarial Network)도 직관적인 번역이 불가능하다. 그래서 지금 대략적으로 내린 결론은 하나다. 어설프게 한글화하느니, 차라리 연구원들이 현업에서 실제로 사용하는 발음 그대로를 한글화하고, 설명을 곁들이는 것이다. 어차피 gradient explosion이나 그레디언트 익스플로젼이나 기울기 폭발이나, 전공자가 아니라면 이 용어가 무엇을 뜻하는지 알 리가 없다. 대략적으로라도 이해할 수 있도록, 연구자들의 입을 빌려 최대한 쉽게 설명하는 것까지가 글쟁이의 역할인 것 같다.

3.카카오브레인 연구원이 강의를 해준다.

카카오브레인에는 연구개발팀에 소속된 연구원이 많다. 하지만 모든 사람이 다 인공지능을 연구하지는 않는다. 나처럼 연구개발과는 직접 관련 없는 인력들도 있다. 그래도 나름 인공지능을 연구한다는 회사에 소속된 사람들인데 딥러닝인지 뭔지 정도는 알아야 하지 않을까 해서 시작된 딥알못(딥러닝을 잘 알지 못하는 사람)을 위한 내부 스터디가 정기적으로 열리고 있다.

그리고 첫 강의는 말해서 뭐하랴. 딥러닝의 역사와 용어에 대한 전반적인 설명을 들었다. 컴퓨터공학을 전공했지만 이미 글 쓰는 걸로 밥벌이한 게 올해로 6년 차인 내가 딥러닝을 이해해보겠다고 찾아본 문서만 수십 가지다. 그런데 오늘 강의에선 역전파니, 오류율이니 그런 수학적인 이야기가 하나도 나오지 않아서 정말로 놀랬다. 그런 이야기 없이도, 비전공자를 위해 딥러닝의 개요에 대해서 설명할 수 있다는 사실에 또다시 놀랬다.

2회차 딥알못 스터디에선 '딥러닝과 머신러닝' 세션이 이어졌다. 보통 학제적으로는 딥러닝⊆머신러닝⊆인공지능인데, 요즘 보면 딥러닝이 더 잘하는 분야, 머신러닝이 더 잘하는 분야로 점차 잘 구분돼 있다고도 한다. 나는 이렇게 전문가들이 열심히 쌓아온 지식을 습득해나간다.

“과거에 머신러닝으로 범용적인 문제를 해결하는, 진정한 의미의 인공지능을 구현할 수 있다고 했다가 실패해 투자가 끊긴 적이 있습니다. 그 이후 머신러닝은 주어진 태스크를 데이터로 해결하는 방법론에 집중하죠."

“그 와중에 딥러닝이 뜨면서 AGI(General Artificial Intelligence)를 구현할 수 있겠다는 장밋빛 전망이 나오고 있습니다. 실제로 딥러닝으로 바둑도 풀고 걷는 로봇을 만들고 있으니까요."

“다만 우리가 이 시점에서 머신러닝을 하든, 딥러닝을 하든 우리 인간이 ‘지능’을 이해하느냐에 관해 면밀히 생각해봐야 할 것입니다. 범용적인 인공지능을 만드는 건 또 먼 나라의 일이죠."

역시 난이도 조절을 할 수 있는 건, 해당 분야에 잘 아는 사람만이 할 수 있는 특권이라고 생각하니 서글픔은 없지않아 있지만. 내 역량이 발휘되는 건 그 다음부터다. 바로 콘텐츠 제작 부분이다. 인공지능 커뮤니티 주류에 있는 사람들에게는 너무나 당연하면서도 쉬운 이야기지만, 도대체 지금 기술 사회에서 어떤 이야기들이 오가는지 모르는 사람을 위한, 나 같은 사람들을 위한 콘텐츠를 만드는 건 오로지 내 몫이다. 이렇게 좋은 콘텐츠를 나만 홀라당 듣고 끝내는 건 아쉽다. 좋은 건 나누고, 공개하고 또 협력해야 한다. � (한편 카카오브레인 연구원들은 ppt도 잘만들고 설명도 잘한다. 똑똑한 사람들이 다재다능하기까지 하다)

그리고 딥알못 스터디가 아닌, 딥러닝 스터디도 열리는데 이건 정말 어렵다. 딥러닝 개발 및 연구에 필요한 수학적 이론들에 대한 이야기가 나온다. 처음 몇번은 멋모르고 들어갔다가 지금은 가지 않는다. (ㅠㅠ)

4.카카오브레인 연구원이 과제를 준다.

하지만 연구원들이 리뷰한 논문이나 연구원들이 진행하는 프로젝트에 관해 잘 정돈된 글을 쓰는 내 입장에서는 무작정 딥알못만을 위한 콘텐츠를 쓸 순 없다. 그들이 하는 내용을 맥락적으로 이해하기 위해선 따로 기술 블로그를 볼 수밖에 없다. 그런 점에서 가장 힘들 게 쓴 것을 굳이 손꼽으라면 나는 망설이지 않고 캡슐망을 선택할 수 있다.

제프리 힌튼의 캡슐망을 풀이하다

제프리 힌튼 교수 연구팀이 낸 캡슐망 논문 리뷰과 감수는 금융공학을 전공한 카카오브레인 연구원이 도와줬다. 벡터의 내적이 뭔지도 모르는데 이번에 가볍게 '이런 게 있고, 왜 쓰이는 구나' 정도를 이해할 수 있게 됐다. "기존 신경망에서는 각각의 뉴런이 독립적으로 동작한다. 반면, 캡슐망에서는 뉴런들의 그룹인 캡슐이 단위 요소다. 뉴런의 출력값이 스칼라(scalar)이지만, 여러 뉴런으로 이루어진 캡슐의 출력값은 벡터가 된다. 그리고 이 벡터의 크기는 어떤 개체가 존재할 확률을, 벡터의 방향은 그 개체의 성질을 표현한다. "

이 과정에서 카카오연구원이 좋은 자료를 공수(?)해 줬다. 시간이 나면 읽으라는 말이지만 은연중에 나는 자극이란 걸 받았다. 이렇게 나름 영재 코스를 밟아온 사람들조차 계속 공부를 하는데, 딥알못인 내가 주저앉아 남이 퍼주는 밥숟가락만 마냥 받아먹을 수는 없는 노릇이었다.

그래서 이렇게 모든 자료를 인쇄해 형광펜으로 줄을 그어가면서 공부했다. 딥알못인 내겐 딥러닝은 난해함 그 자체였다. 이때 이후로는 신경망 기술 자체를 다루는 글을 쓰지 않았는데, 한결 더 수월하다. 그만큼 어렵다는 소리다. 아무튼, 그 이외에도 연구원들은 자신이 갖춘 전문 분야에 관해 좋은 자료를 추천해달라고 하면 북마크에서 링크를 꺼내듯이 바로 자료를 추천해준다.

5.일상이 '인공지능’이다

카카오브레인에는 카페테리아 공간이 따로 있다. 연구실 내 책상이 답답하고 싫증날 땐 맥북 프로 들고 나와서 일할 수 잇는 곳이다. 때론 점심이나 커피, 간식을 먹으며 담화를 나누기도 한다. 시간을 가리지 않고 자신들이 연구하는 프로젝트에 관해 심도 있게 이야기를 나누려는 연구자들도 나와있다. 앞을 봐도 연구자, 뒤를 봐도 연구자, 옆을 봐도 연구자. 인공지능을 연구하고 공부하는 사람 천지인 이 곳이 천국이나 다름없다.

언제 한 번은 다같이 시사회로 보고온 영화 '블레이드 러너 2049’에 관해 이야기를 나눈 적도 있다. 영화 속 장치들이 무엇을 함의하는지, 그리고 인공지능이 미래 우리 삶을 어떻게 바꿀 것인가 등 여러가지 주제들에 대해 다양한 생각을 주고받을 수 있었다. 기술적인 관해 이야기할 줄 알았는데 전혀 아니었다. 되려 인문학적인 논쟁에 대한 니즈를 서로 느끼고 있음을 느끼는 순간이었다. 인간의 근원적인 욕구와 욕망은 어디로 점철되고 있는가에 대한 이야기를 하려면 결국엔 역시 철학적인 논의를 할 수밖에 없음을 깨달은 순간이었다.

"개발자는 왜 체크무늬 셔츠를 좋아하는가?"라는 재미있는 주제로 담소를 나누기도 하고, 임성빈 연구원과 '선형과 비선형’에 이야기하다가 비트겐슈타인의 명언인 "쓸모없는 문제에 관여하지 마라. 말할 수 없는 것에 관해서는 침묵해야 한다"으로 끝나는 10분 강의를 듣기도 한다. 하, 어떻게 카브라이프를 싫어할 수 있어.

카카오브레인은 나처럼 '인공지능' 관련해서 글 쓰는 사람을 위한 회사라고 해도 과언이 아니다. 물론 이런 나의 행보와는 별도로 카카오브레인 연구원들은 각자 전문 분야에 발을 걸터 놓고 열심히 연구를 수행하고 있다. 내 역할은 카카오브레인의 프로젝트가 성공할 수 있도록 기원하는 한편, 일반 대중들의 관심을 끌어들일 수 있도록 다각도로 연구하고, 공부하고, 쉽게 쓰는 것이다.

그리고 언제나처럼 마감 직후에는 책상이 이렇게 더럽다. 이번 주도 카카오 AI 리포트 막바지 작업이 한창이다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari