데이터를 배우기로 마음먹은 이들에게 가장 처음에 하면 좋은 것이 무엇일까요? 이해를 쉽게 하기 위해 질문을 바꿔보겠습니다. 생성형 AI를 드린다면 어떻게 하시겠습니까? 저는 종이와 펜을 준비합니다. 디지털의 정중앙을 관통하는 이 과정에 가장 아날로그에 가까운 물질이 등장하는 이유는 단순합니다. 챗GPT와 같은 생성형 AI를 대다수 사람은 ‘어떻게(HOW)’ 사용하는지를 궁금해합니다. 그리고 그 용도를 알고 나서는 자신과는 상관이 없는 도구로 치부합니다. 그래서 제가 하는 질문은 ‘무엇(WHAT)’을 묻는 질문입니다. 현재의 생성형 AI는 똑똑한 신입사원 정도로 생각하면 될 것 같습니다. 여러분에게 만약 신입이 한 명 더 배정되어서 제 업무의 효율을 높일 수 있다면 어떤 업무를 주시겠습니까? 내가 소속된 회사 일이 아니라도 좋습니다. 개인적으로 진행하는 취미나 사이드 프로젝트에도 공짜로 직원이 주어진다면 어떤 것을 도우면 좋을까요?
어쩌면 생성형 AI의 역량을 몰라서 어느 정도의 일이 가능할지 모릅니다. 하지만 상관없습니다. 생각보다 현재의 AI가 지원할 수 있는 일은 많습니다. 상상력을 동원할 일이며 정답은 없습니다. 이 과정을 통해서 자신의 애호(愛好)를 찾는 일도 있습니다. (웃음) 적다 보면 내 욕망이 투영되기도 하고, 생각보다 시간만 많다면 하고 싶은 일이 많다는 걸 깨닫기도 합니다. 손으로 무언가를 적는 일은 원래 예열이 필요하니, 충분한 시간을 가지고 적으시면 됩니다. 너무 많은 것은 별로 걱정이 안 되니 마음껏 적어 봅시다. 수많은 휘하를 거느린 왕이 된 것 같은 착각도 드는 즐거운 시간이길 희망합니다.
이제 그중에서 마음에 드는 하나를 골라봅니다. 그리고 이제 다시 생성형 AI의 활용법을 알려주는 책이나 영상을 접해보시면 다르게 보일 겁니다. 어쩌면 이미 내가 하려는 일과 연관된 생성형 AI만을 살펴보고 있을지도 모르겠군요. 현대인은 생각보다 방법론에 매몰되어 있습니다.
이번에는 데이터를 수집하고 관찰하는 측면의 이야기를 해보겠습니다. 인간은 자신의 모든 욕망을 데이터에 풀어놓지 않습니다. 우리(관찰자 혹은 수집가)는 데이터가 인간의 모든 것을 담기를 희망하지만, 사실 인간이 가진 심연의 깊은 욕망은 데이터에 드러나지 않습니다. 깊은 욕망에서 나오는 데이터는 형태나 채널이 다릅니다. 그럼에도 우리는 데이터에 개인의 모든 욕망이 매몰되길 희망하고 믿곤 합니다. (그래야 데이터로 모든 것을 읽을 수 있기 때문이죠) 그러나 이러한 편향은 큰 함정에 빠질 위험이 있습니다. 데이터를 선정할 때는 어떠한 데이터가 가치 있는 데이터인지 선별할 줄 아는 능력이 매우 중요합니다. 데이터가 세상을 만드는 것이 아니라 데이터 중 어떤 데이터를 어떻게 해석할지에 대한 문제의식이 더 중요합니다.
데이터를 보다보면 흔하게 걱정하는 것이 두 가지가 있습니다. 첫째는 데이터의 편향입니다. 데이터 속에선 극단적 성향의 목소리만 강조되고 부끄러움 많은 신중함은 묻히는 듯하지만, 사실은 특정한 시대 의식이 발동할 때 어떠한 위치에 있는 개인은 그 의식에 대한 억울함이 증폭되고 그로 인해 더 큰 목소리를 내기도 합니다. 억울함의 강도가 강하므로 목소리를 클 수 있으나 편향된 목소리는 결국 작용반작용의 법칙으로 균형을 찾게 됩니다. 순간을 두고 판단하면 편향되어 있지만 시간을 조금 더 길게 본다면 흔들리는 추가 균형을 잡게 되는 움직임과 같습니다. 오히려 이러한 추의 움직임에서 추의 중심이 어디로 이동하고 있는지를 찾아내는 것이 더 중요합니다. 둘째는 단기 트렌드에 집중하다 거시 트렌드를 놓치는 것에 대한 두려움입니다. 사실은 그 반대입니다. 같은 데이터를 긴 시간을 두고 보다보면 흐름을 얻을 수 있습니다. 동일 조건의 데이터에 시간이라는 변수만 적용되므로 거기에서 일어나는 흐름을 읽을 수 있는 겁니다. 확장하여 생각하면 데이터를 관찰할 때는 변수가 제한적일수록 얻는 통찰이 큽니다.
관찰자로서 우린 지속적인 정보에 노출되어 있습니다. 예를 들어 뉴스의 경우는 사람들의 시청률이 중요하므로 자극적인 사건·사고가 중요합니다. 그렇지만 실제 우리 주변에 그만큼 사건·사고가 많은 것이 아니라 내 생활반경보다 훨씬 범위가 넓은 곳의 사건·사고가 모인 것입니다. 인간은 이러한 뉴스를 보고 불안을 느끼고, 불안으로 뉴스에 더 집착하게 됩니다. 하지만 우리의 삶은 뉴스보다 훨씬 안녕합니다. 정보에 대해서 선별적 섭취 혹은 필터링이 필요합니다. 데이터를 대할 때 항상 객관적으로 바라보고 메타화시켜야 합니다. 현상의 본질을 읽고, 데이터의 의도를 읽을 줄 안다면, 우린 요란한 현상에 휘둘리지 않을 수 있습니다.