강남 어느 한 오피스텔에 사무실을 얻고 처음 출근해서 시작한 것은 수집할 수 있는 data의 범위를 정하는 것이었다. 우선 온라인 상의 data였다. 개인의 동의를 받는다는 전제 하에 수집할 수 있는 data는 넘치도록 많았다. 자주 가는 웹페이지나 SNS, 신용카드 사용 기록, 인터넷 사용 기록, 클라우드 서비스에 있는 사진들은 현대판 셜록 홈즈였다. 단순히 계정에 접근할 수 있는 권한만으로 그 사람에 대해서 대부분 파악할 수 있었다. 자주 가는 장소나 자주 만나는 사람, 좋아하는 음식, 그리고 취미까지. 여기에 메신저의 대화 내용을 분석하면 그 사람보다도 그 사람을 더 잘 알게 될 것이었다.
이른바 온라인 풋프린트에 실제 현실에서의 정보를 더하면 가장 이상적인 결과를 얻을 수 있었다. 병원에 저장된 의료 기록과 보험 기록, 그리고 직장이나 학교처럼 소속된 기관에서 보유하고 있는 개인에 대한 평가 기록들도 유용할 것이다. 아직 Data가 되지 않은 여러 정보들을 어떻게 효율적으로 Data로 옮길 것인가. 이미 온라인에 저장된 data에 대한 동의를 얻는 것과 더불어 이번 도전이 성공하기 위해서 가장 결정적으로 필요한 것이었다.
그다음으로 고민한 것은 산업 동향에 대한 정보였다. 처음 내가 목표로 한 것은 진로와 직장에 대한 결정을 도와주는 프로그램을 만드는 것이었기 때문이다. 개인이 가지고 있는 고유한 특징을 통해서 그 사람이 가장 잘할 수 있는 일을 찾아 주고자 했다. 창의적인 사고력을 가진 사람이 공무원 시험과 같은 인내의 영역에서 오랜 시간을 낭비하지 않도록 하는 것이 그 개인에게나 사회에게 도움이 될 것이라 판단했다. 또 이미 직장을 선택한 사람이라도, 이직에 대해서 조언을 해줄 수도 있는 것이었다.
우선은 산업 분야에 대한 data를 수집해야 했다. 이를 통해서 가입자를 늘리고, 그러면서 앞서 언급한 개인 정보들을 추가로 더 확보할 수 있을 것이었다. 주요 산업계의 동향과 전문가들의 미래 전망, 각종 산업지표의 예측을 통해 경영환경을 분석하고 주요 기업들의 경영지표를 이에 대입해서 유망직종에 대해 적극적으로 추천하고자 했다. 더 나아가 각 개인의 성향을 반영한 최적의 기업을 소개하는 것까지를 목표로 했다.
----
본격적으로 개발이 시작되었다. 그리고 생각보다 개발 기간은 길지 않았다. 내가 속한 회사에서 보유한 AI와 딥러닝 기술은 이미 충분히 고도화되어 있었다. 기본적인 뼈대가 완성되자 이윽고 프로그램이 스스로 학습을 시작했다. 가장 힘든 것은 두 가지였다. 하나는 더 나은 선택에 대한 정의였다. 어떤 사람들에게는 더 많은 돈을 가져다주는 것이 나은 선택이었지만 어떤 사람에겐 돈보다 행복과 같은 가치가 더 나은 선택일 수 있었기 때문이다. 나는 이것 마저도 그 사람의 data를 통해서 프로그램이 스스로 판단하도록 했다.
또 하나 중요한 것은 data였다. 사실 가장 중요한 것이라고 해도 무방했다. data, 그중에서도 개인 정보가 핵심이었다. 프로그램은 무섭게 data를 먹어치우는 하마 같았다. 처음엔 회사와 계열사의 직원들의 개인 정보를 모두 넣었다. 그것으로도 모자라 회사가 보유한 고객들의 개인 정보도 법적인 문제가 없는 범위에서 모두 넣었다. 고객들이 무심코 넘긴 약관은 나의 입장에서는 마법의 지팡이 같은 것이었다. 페이 서비스의 결제 내역이나 웹 사용 내역이 시스템 개선의 목적으로 방대하게 쌓여있었다.
회사에서 지원받은 예산도 대부분 새로운 data를 구입하는데 들어갔다. 이성을 매칭 해주는 어플은 보물과도 같았다. 저렴한 가격에 인수 가능한 반면, 어플 내에는 개인 정보가 넘쳤다. 재미난 설문조사를 가장한 홍보 사이트도 만들었다. SNS에서 화제가 되면 순식간에 몇 만 명의 답변이 모였다. 나는 사람들이 흥미를 가질만한 사이트를 만들어 사람들이 스스로 개인 정보를 집어넣도록 했다. 시간이 지나자 프로그램은 어떻게 하면 개인정보를 더욱 많이 확보할 수 있을 지에 대해서도 방법을 찾아내기 시작했다.
프로그램이 가장 먼저 개발한 어플은 키보드 어플이었다. 온라인 상의 방대한 텍스트 정보를 읽어 내고 사람들이 주로 쓰는 단어들의 연관성을 바탕으로 획기적으로 타이핑 시간을 줄여주는 키보드를 만들어 냈다. 이를 회사가 출시하는 스마트폰에 탑재하여 배포하였고, 이윽고 엄청난 양의 data가 쌓이기 시작했다. 그 외에도 여러 가지 필터를 탑재한 어플이 가장 인기가 좋았는데, 이를 통해서 프로그램은 상상할 수 없을 정도의 얼굴 사진을 모을 수 있었다. 이를 자사가 보유한 사진 클라우드 서버와 매칭 시켜서 개인 정보들을 확장시켜 나갔다.
그다음은 SNS에 있는 정보를 활용하는 일이었다. 이 정보는 이미 웹상에 등록된 것으로 별도의 동의가 없어도 얻을 수 있는 것들이었다. 주요 SNS의 게시물들을 분석해서 기존에 프로그램이 가지고 있던 정보들과 매치시켜 일치하는 사람들을 찾아내기 시작했다. 이름을 알 수 없는 사람들은 고유한 key 값으로 정의가 되었으나 이미 프로그램에서 이름을 알고 있는 개인들과 쉽게 연결되었다. 그들은 단 한 번도 자신들의 이름을 프로그램에 밝히는 것에 동의하지 않았지만, 프로그램은 얼마 지나지 않아서 그들의 이름과 신상정보를 확보하게 되었다. 다만 대외적으로는 끝까지 key값을 사용하였다. 물론 그들이 프로그램에 가입하는 순간 그 key값은 이미 알고 있던 이름으로 대체될 것이다.
어느 순간부터 내가 하는 일은 크게 없었다. 프로그램이 만들어 내는 어플들을 이쁘게 꾸미는 정도였다. 또한 개인정보의 활용을 위한 법적인 검토를 위해 법무법인과 협의하는 것도 내가 하는 일 중 하나였다. 생각보다 개인정보가 급속도로 쌓이면서 나는 이 프로그램의 역할을 진로를 결정하는 것으로 한정할 필요가 없음을 느꼈다. Data는 이미 넘쳐나고 있었던 것이다.
----
회사에서 제공한 CPU의 성능과 서버의 용량은 세계 최고 수준이었으나, 그마저도 조금씩 부족해지고 있었다. 서버의 용량도 마찬가지였다. 그럴 때마다 회사에서는 추가적인 지원을 아끼지 않았다. 프로그램이 점점 더 형체를 갖춰 가기 시작했기 때문이다. 초기에 약속한 100억의 투자금은 어느새 몇 배로 늘게 되었다. 기업의 입장에서 고객의 선택을 파악할 수 있다는 것은 혁명적인 일이었기 때문이었다. 투자가 계속될수록 프로그램은 점점 더 고도화되었다. 그리고 어느새 약속한 2년이 거의 지나게 되었다.
시간이 정신없이 흐른 어느 날. 나는 이제 때가 되었음을 직감했다. 넣을 수 있는 data는 모두 넣었다. 이제는 본격적으로 서비스를 시작해서 개인들이 직접 data를 넣어야 할 시점이 된 것이다. 사실 이미 프로그램은 꽤 정확한 편이었다. 수십만, 아니 수백만의 가입자를 추가로 유치해서 그들이 끝까지 숨겨둔 메신저나 사진첩, 인터넷 사용 기록을 모두 볼 수 있다면 프로그램은 보다 완벽해질 것이었다. 나는 프로그램의 출시를 결정했다. 이제 남은 것은 회사의 결정이었다.
회사의 이사회가 소집되었다. 회사는 전면에 서기는 원하지 않았다. 자칫 대중들에게 빅 브라더로 인식되고 싶어 하지 않았기 때문이다. 그들은 그저 이 프로그램의 그림자에서 이득을 취하기만 원했다. 나도 그 생각에 동의했다. 이 프로그램은 회사의 지원을 받아 제작된 것이긴 하지만, 오로지 회사의 이득을 위한 것이 아니었다. 보다 많은 사람들이 합리적인 선택을 내리는데 도움을 주기 위해 개발된 것이었다. 기업의 이득은 이 프로그램을 개발하고 운영하기 위해서 어쩔 수 없이 양보해야 하는 것이었다. 나는 보다 많은 사람들이 이 프로그램을 통해 도움을 받을 수 있다면, 그 정도는 비용으로 충분하다고 여겼다.
이사회는 끝이 났다. 프로그램은 세 달 후부터 정식으로 서비스되기로 했다. 프로그램의 운영은 내가 책임지는 것으로 했다. 다만 회사는 지분의 51%를 가지는 것과 프로그램이 입수하는 정보들을 활용할 수 있는 권리를 가졌다. 나는 이제 서비스 출시를 위해 정신없이 바쁜 시간을 보내야 했다.
"이제 더 나은 선택을 내릴 수 있게 되었어요!"
신규 프로그램 오델로는 그렇게 앱스토어 한 구석에서 조용히 서비스를 시작했다.