가속기 없이 암흑물질의 검출이 가능한가?
월성 발전소에서 한 주간의 작업을 끝내고 감포에서 포항까지 해변길을 탔다. 평소 같으면 감포 삼거리에서 경주 방향으로 틀어야 하지만 못 가본 동해안 길이 궁금했다. 어떤 풍경이 펼쳐질지? 어디에서 도로가 다시 만나게 될지? 덤으로 한적한 동해안 따라 운전하면서 빅데이터라는 주제를 사색할 수도 있겠다 싶었다.
정치가나 경영자가 최신 용어를 들먹일 때마다 나는 걱정이 앞선다. 이 기술을 위해 땀 흘린 자의 결실을 그들이 가로챈다는 피해의식도 있고, 최신 기술에 의해 후순위로 밀려날 과제를 생각하면 나는 슬프다. 그럼 과학기술자라고 순수한가? 영악한 기술자들은 시류에 편승하여 과제비를 챙기고 책임질 때쯤이면 빠져나갈 것이다.
빅데이터도 최신 기술에 속한다. 가트너 그룹이 빅데이터를 기술 생명 주기 그래프에 올릴 때 기술 한계를 직관적으로 느꼈고 더 이상 파고들지 않았다. 귀 엷은 기술자가 빅데이터 기법으로 발전소의 데이터를 새롭게 해석할 수 있다는 설명을 하기에 그냥 웃어넘겼다. 발전소 데이터를 제대로 해석하기 위해 과학법칙을 긴 시간 동안 어렵게 찾아내었는데 이를 무시한다고? 창고 매장이 유행할 때 멀쩡한 백화점을 뜯어 창고로 개조한다는 기사를 접하고 비슷한 반응을 보인 적이 있다.
모든 사색의 출발점은 인터넷 검색이다. 출장 저녁시간에 호텔에서 빅데이터를 찾아보니 거품이라는 비판글, 개인 맞춤 광고에 활용한다는 옹호글도 있다. 빅데이터는 3V(Volume, Variety, Velocity)를 특징으로 한다는 나름 정리한 글도 있다. 검색 결과를 종합하면 빅데이터 기술이 데이터의 양적 성장으로 탄생했으나 지식의 질적 전환을 유발하지는 못한 듯했다. 나의 초기 직관이 틀리지는 않은 모양이라 잠시 우쭐했지만 이내 아쉬움으로 바뀌었다. 빅데이터를 통해 암흑물질까지 밝혀 낼 수는 없겠지만 내일의 주식시세를 예측할 수 있지 않을까? 빅데이터 기술을 제약하는 요소는 무엇인가? 이것이 동해안 드라이브 동안 숙고할 주제였다.
발전소 후문의 양북면에는 문무대왕암이 있다. 수없이 지나갔지만 차를 내려 가까이 가본 적은 없다. 죽어서도 왜구를 물리치겠다는 문무왕의 충정을 느끼고자 다가갔지만, 살아서 부귀영화를 누리겠다는 굿판에 실망하여 나는 서둘러 자리를 떴다. 북소리와 향냄새로 정신이 어지러운데 굿판에서 음식 한 조작 얻어먹으려는 갈매기 군무마저 나를 심란하게 한다.
이 스마트폰의 기술시대에 굿판이라니 나는 우울했다. 건너편 언덕길로 도망치듯이 빠져나왔다. 전망 좋은 정자가 나타났다. 차를 멈췄다. 저 멀리 문무대왕암이 시야에 들어왔다. 향냄새도 북소리도 없었다. 다시 평정을 찾았다.
한반도 지형의 토끼 꼬리에 해당하는 구룡포를 도착지로 설정했다. 바다 풍경이 좋은 곳에는 어김없이 모텔, 펜션, 식당 들어서 있지만 몇 달째 인적이 없었는지 바람에 날린 비닐이 널브러져 있었다. 모퉁이를 돌 때마다 새로운 기대를 하지만 문 닫힌 식당과 말라버린 잡초로 우거진 밭만이 나를 맞이한다. 얼마 가지 않아 아름다운 마을을 보리라는 기대마저도 접는다. 구룡포도 집으로 가는 길에 있다는 자기 합리화를 한다. 확 트인 해수욕장이 간혹 나타나고, 양지바른 절개지에는 막 봉우리를 내민 진달래가 그나마 위안이 되었다.
구룡포에 도착할 쯤에야 인적을 느낄 수가 있었다. 곧장 항구로 갔다. 잠시 내려 정박된 어선들을 배경으로 표지 사진을 남기고 포항을 거쳐 대전으로 출발했다. 포항 진입 고개에서 갑자기 먹구름이 밀려오며 우박비가 차장을 때렸다. 내리막 고개 아래 포항 하늘은 여전히 밝게 빛나며 흑백의 장관을 연출한다. 너는 어두운 지방을 두고 밝은 도시로 가려느냐? 양심의 소리를 듣는다. 나는 베드로 같은 사명감이 없다. 갓길에 차를 세우고 신기한 사진만 남기고 결코 구룡포로 감포로 되돌아 갈 수는 없었다.
여기까지가 평범한 기행문인데 이를 통해 빅데이터 개념을 살펴보자. 동해안 드라이브를 통해 얻은 영상정보는 어마어마한 빅데이터이다. 블랙박스에 녹화된 USB는 잠시 제쳐두고 실시간 여행 풍경에 집중하자. 인간이나 동물은 망막을 거쳐 뇌에 맺힌 영상으로 차창에 스쳐가는 무수한 사물들을 바로바로 구별할 수 있다. 나는 빈 건물을 보았지만 함께 탄 개라면 숲에 숨어 있었던 고라니를 발견했을 수도 있다. 문무대왕이라면 왜구를 공격할 전략적 요충지를 발견했을 수도 있다. 뇌는 감각기관으로 입력된 빅데이터를 실시간으로 처리하도록 진화되어 왔다.
블랙박스의 USB는 먼 훗날 폐차하다가 정비원의 눈에 띈다. 인간은 굴러다니는 USB를 보면 관음증이 발동하여 기어이 읽어낸다. 연예인의 USB와 다르게 과학자의 USB는 일 분만에 정지될 운명이지만 사람들은 빅데이터를 시각적으로 재생하고 싶어 한다. 즉 저장장치에 기록된 빅데이터의 시각화 능력은 인간만의 특징이다. 동물은 결코 흉내 낼 수가 없다. 시각화 기술이 진보하여 3차원 영상으로 재생된다면 인간의 통찰 능력이 배가될 수도 있을 것이다. 빅데이터의 유형에 따라 시각화의 기법은 다양한다. 지도에 표시할 수도 있고 신체 모형에 표시할 수도 있다.
내가 지방의 황폐화를 끝까지 주장하면 도시 집중화에 너그러운 독자는 증거를 대라며 닦달할 것이다. 이를 입증하기 위해서는 쓰레기 더미에 던져버린 USB를 회수하여 처음부터 끝까지 봐야 한다. 2배속 4배속으로 재생하지만 시간이 걸리기는 마찬가지다. 한 시간짜리 동영상에서 등장하는 모든 사물을 순식간에 자동 인식하는 인공지능이 없을까? 그러면 지루한 과학자 영상을 보지 않아도 된다. 또 하나의 정리를 추가하면 빅데이터에서 단시간 자동 인식 능력은 핵심 기술이다.
최신 사물 인식 기술이며 동영상에 나오는 모든 사물을 밝혀 낼 수는 있다. 나무, 바다, 교통 표지판, 지나간 사람의 숫자까지도 가능하다. 오히려 사람보다 나을 수도 있다. 그렇다고 하더라도 인공지능이 황폐한 지방을 유추할 수 있을까? 불가능하다. 나는 평소에 아기 울음소리가 끊어진 지방 산부인과 기사를 접하기 때문에 빈 집으로부터 황폐한 지방을 연계할 수 있었다. 또 다른 예로 인공지능이 비탈에서 곧 떨어질 바위를 알려줄 수가 있을까? 불가능하다. 고전 역학을 알아야 하기 때문이다.
황폐화된 지방은 사회문제이며 비탈에서 떨어지는 바위는 과학 문제이다. 현재에는 인공지능으로 진단이 어려울 수가 있지만 미래에는 가능할 수도 있다. 사회문제별로 나타나는 특정 증상을 학습한다면 인공지능도 사회문제를 검출할 수 있을 것이다. 그러나 과학 문제는 생각만큼 단순하지는 않다. 인공지능이 학습한 데이터 외에 과학 원리를 배워야 한다. 알파고가 과거 기보를 학습하여 바둑을 잘 둔다고 생각하면 오산이다. 알파고는 바둑의 규칙을 알고 있기 때문에 인간을 능가했다. 과학 문제의 빅데이터 처리는 데이터보다 과학원리로 접근해야 하는 이유이다.
이제 동해안을 여행할 당시의 질문으로 되돌아 가자. 동영상을 보고 인공지능이 암흑물질의 흔적을 찾을 수가 있을까? 현대 과학에 따르면 암흑 물질은 다른 물질과 상호작용이 없다. 그래서 암흑물질을 알 수가 없고 내가 모르는 것은 인공지능도 알 수가 없다. 현재로는 그렇다. 그러나 미래에 인공지능이 최신 과학 원리를 습득한 후에는 암흑물질의 흔적을 검출할 가능성도 있다. 비싼 입자 가속기가 없어도 암흑물질의 존재를 알려줄지도 모른다.