알아도 어찌하리오 III

우물을 깊게 파려면 먼저 넓게 파야 한다

Dec 5. 2020

IT(Information Technology)와 DT(Data Technology)의 차이는 인간의 판단력이 중심이 되느냐, 인간의 판단력에 대한 과신을 내려놓고 데이터 안에서 메시지와 패턴을 찾느냐이다. 백만 개 데이터 전체를 빅데이터라고 하고, 빅데이터와 인공지능을 활용하여 분류, 분석하게 된다. 이렇게 빅데이터와 인공지능이 포함된 DT를 활용한 혁신이 '4차 산업혁명'이다(김명락, 2020)

어느 일본 저자가 쓴 책에서 IT 분야는 대략 7, 8년을 주기로 대표적인 기술 양상이 반복한다고 한다. AI(인공지능)라는 기술도 본래 지금처럼 하드웨어의 성능이 압도적이지 않은 1950년대 말에 LISP라는 언어로 AI와 관련된 연구가 이루어졌으나 말한 대로 하드웨어 수준이 뒷받침되지 못하여 시들해졌다고 한다. 1956년, 미국 다트머스 대학에 있던 존 매카시 교수가 개최한 다트머스 회의를 통해 처음으로 인공지능(AI)이라는 용어를 사용했으며, 당시 인공지능 연구의 핵심은 추론과 탐색이었다고 한다(nvidia korea, 2016). 현재는 대용량의 데이터를 수집해서 이것을 가상의 저장소에 저장하는 클라우드 기술까지 중앙집중식 시스템의 기술이 유행하고 있다. 곧, 블록체인이라는 데이터의 분산관리가 용이한 기술이 여러 분야에서 상용화되면 클라우드와 같이 보통 한 곳에 데이터를 모다 놓는 구조보다 정보보안 상의 이유로 블록체인이 더욱 상용화될 수도 있다. 그래서 이러한 기술 행태(중앙집중식과 분산식)가 반복해서 흐름을 타더라도 시스템의 본질을 정확히 꿰뚫고 있다면 IT든 DT든 먹고사는 데 지장 없는 엔지니어로 생존할 거라고 필자는 짐작한다. 그중, AI가 앞으로 그 생존 가능성을 높여줄 기술로 자리매김할 것이다.

머신러닝이니 딥러닝이니 이러한 AI 기술의 핵심은 위에서 존 매카시(Basic 언어도 만들었다.) 교수가 말한 대로 '추론'과 '탐색'이다. 그리고 빅데이터는 수집이 이루어지는 장소(Source)에서 정형적인 정보(수치와 같이 결과가 딱 떨어지는)와 비정형적(정성적이고 결과를 말하기 애매모호한)인 정보를 가리지 않고 모든 데이터(All Data)를 일컫는데, 이것이 1990년대에 주목받았었던 전문가 시스템을 통해 선별된 데이터와의 차이점이다.

1990년대부터 2000년대 초까지 인터넷 검색 포털 서비스의 전 세계 1위 업체는 야후였다. 아직까지 일본에서는 야후 재팬이라고 한국의 네이버처럼 일본의 대중적인 포털 사이트가 있으나 검색엔진 자체는 구글의 엔진으로 2010년에 갈아탔다. 구글의 검색 결과와 달리 야후의 검색 결과는 모든 데이터(All Data)에서 선별된 정보(Information, 검색 당사자에게 쓸모 있는 데이터)였다.

야후의 방식은 전문가에 의해 선별된 정보를 제공하는 것이었기 때문에 완성도가 높았다. 반면에 구글은 1996년부터 랭킹 시스템(ranking system)이라는 인공지능을 기반으로 검색 결과를 제공했다. 인터넷에 존재하는 전체 데이터 중에서 사람들이 많이 조회하고 랭킹이 높은 정보들을 검색 결과 페이지의 상단에 배치했다. 야후처럼 전문가에 의해서 걸러진 정보가 아니라 조회 수나 링크 수의 영향이 많았기 때문에 조악한 결과가 많았다. 하지만 시간이 지남에 따라 야후의 검색 결과는 더 이상 발전하지 못하고 제자리에 머물렀지만 구글의 검색 결과는 계속해서 발전했다. 구글에서 검색해서 결과가 나오지 않으면 인터넷에 그 자료는 아예 없는 수준까지 이르게 되자 야후는 구글과의 경쟁에서 패했던 것이다. 20년 전에 야후가 IT를 다루는 동안 구글은 DT를 다뤘던 것이다. 구글의 기술이 야후를 앞섰다기보다는 구글의 통찰력이 야후를 앞섰기 때문에 경쟁에서 살아남았다(김명락, 2020).

여기서 전체 자료에 해당하는 모든 데이터(All Data)는 앞서 인용한 책의 저자(김명락)가 말하는 '암묵지'에 해당한다. 그리고 야후가 검색을 전문가 시스템을 통해서 선별한 정보의 데이터는 '형식지'에 해당한다. 사람의 지식이 글 등의 수단으로 명확하게 표현할 수 있는 형식지와 그렇지 않은 암묵지로 나뉘듯이 토익학원을 다니면서 5 형식 등의 영문법을 익히는 것을 전문가 시스템이라고 한다면 아이들이 부모의 말을 무작정 따라 하면서 자연스럽게 모국어를 익히게 되는 것이 머신러닝이다. 연애하는 방법을 책으로 배우는 것이 전문가 시스템과 같은 방법이라면, 연애를 잘하는 주변 친구들의 행동 패턴을 따라 하면서 배우는 것은 일종의 딥러닝이다. 머신러닝은 위와 같이 당장에는 불필요한 정보까지 포함된 암묵지까지 흡수할 가능성이 전문가 시스템보다 높기 때문에 1990년에 들어서는 머신러닝이 전문가 시스템을 뛰어넘게 되었다(김명락, 2020).

인용은 여기까지 하고, 위에서 언급한 암묵지의 흡수에 대해 한국의 교육은 간과해왔다. 급격히 유입된 자본주의 문화로 인해 변화에 빨리 대응하려는 사회의 풍토가 한국인들의 속성을 끊임없는 실수와 여러 번의 번복을 거쳐서 최적의 결과를 도출하기보다는 단 몇 번의 시행착오 끝에 최고의 성패만을 성공의 공식으로 정의하게끔 만들었다. 한국에 자본주의가 들어온 지가 이제 약 1세기 정도 되었는데 단기적인 결과는 1인당 국민소득이 3만 달러대가 간당간당한 세계 9위의 경제규모다. 자본주의는 이미 15, 16세기에 나타난 중상주의 시대를 자본주의 사회라고 볼 수 있다. 흔히 15, 16세기의 중상주의 사회를 상업자본주의 시대라고 부르는 것은 이러한 자본주의 개념에 따른 것이니, 서양은 자본주의가 발달한 지가 어연 5세기가 넘었다. 일본을 제외한 서양과 비교해서 5분의 1의 단축된 시간으로 한국은 OECD 국가 중 열 번째안에 줄을 서게 된 것이다.

하지만 2020년이 지나가는 이 시점부터도 역시 같은 발전 속도에 그만한 성과를 유지할 수 있을까? 암묵지보다 형식지의 답습에만 거의 매진하다시피 한 대한민국 역시, 암묵지(근원 데이터)의 흡수를 배제한 채 전문가 시스템(형식지)으로 단기적인 성능에서 우세를 보인 야후의 시장 점유율(국가의 흥망성쇠)이 구글과의 경쟁에서 당한 참패와 같은 결말로 예상되지 않는가? 나는 99.99999999 퍼센트라고 장담한다. 단 AI(인공지능)를 아직도 아침에 일어나면 램프를 밝혀주면서 본인한테 날씨가 어떠며, 오늘의 뉴스를 알려주는 스마트 스피커 정도의 수준으로 간주하는 이들이 여전히 많다면 말이다.

참조(Reference)

1) 김명락. (2020). 이것이 인공지능이다 (pp. 186-188). n.p.: 슬로디미디어.

2) 인간처럼 생각하는 기계, 인공지능의 등장(출처 https://blogs.nvidia.co.kr/2016/03/13/history_of_ai/)

3) 한국민족문화대백과사전(자본주의(資本主義))[출처 https://encykorea.aks.ac.kr/Contents/Item/E0047928]

keyword

매거진의 이전글알아도 어찌하리오 IIAI의 학습 ←→ 인간의 사고 매거진의 다음글