주위를 둘러보라. 형광등, 인터넷, 스마트폰까지 모든 것이 전기로 움직이고 있다. 전기는 인간의 생존 필수품이다. 이제는 인공지능이 새로운 전기라고 한다. 매일 같이 들을 수 있는 단어이지만 헷갈리기만한 인공지능, 관련 용어들을 한마디로 설명해 보자.
인공지능(Artificail intelligence: AI)이란 말을 만들어 낸 사람은 존 매카시(McCarthy)다. 그는 1956년 AI를 '지능형 기계를 만드는 과학과 공학'이라고 정의하였다. 당시 활발한 연구가 진행되었지만 기술적 한계로 인해 발전 속도가 정체되었다. 그러나 무어의 법칙에 따라 컴퓨터의 연산 능력이 기하급수적으로 증가하고, 인터넷의 출현으로 방대한 데이터가 축적되면서 2010년대부터 AI 연구는 다시 활기를 띠게 되었다.
AI는 규칙 기반 시스템에서 추론하고 적응할 수 있는 지능형 기계로 적응해 왔으며, 매카시는 이러한 AI를 인간 지능을 모방한 것이라고 말하였다. 매카시는 컴퓨터과학자이면서 인지과학자였다. 자연적으로 발생하는 인간의 지능, 즉 '자연지능'과 대비되는 개념이 '인공지능'이다. 연구자들은 인간의 지능이 뇌 신경망에서 생기는 것으로 보고, 신경망을 모방한 기술을 통해 스스로 학습하고 지식을 습득하는 기계를 만들어내는 데 성공했다. 왕(Wang)은 기계 학습 및 신경망과 같은 기술 혁신을 통해서 학습하고 문제 해결 작업을 수행할 수 있는 것으로 AI의 정의를 확장하였다.
지식과 지능
지구 위에 사는 수많은 동물 중에 인간이 모든 종을 지배할 수 있었던 것은 지식 덕분이다. 40만 년 전 현생인류의 조상인 호모 사피엔스가 나타났다. 호모 사피엔스는 지혜로운 사람이란 뜻이다. 진화하면서 사람의 근력(힘)은 더 강해지지 않았지만 지식은 폭발적으로 늘어났다. 지식이 늘어난 첫 번째 사건은 인쇄술의 발명이다. 필경사 한 명은 일 년에 성경 1권을 필사할 수 있었다. 그러나 인쇄술이 도입되고 1454년부터 1500년까지 46년 동안 유럽에서 1,200만 부 이상의 책이 인쇄된 것으로 추정된다. 그전 1천 년 동안 필사된 책 보다 많은 양이다. 인쇄술의 발견으로 사람들은 더 이상 교회와 같은 특정 권력에 의존하지 않고 스스로 책을 읽고 지식을 습득하고 다양한 사상이 생겨났다. 두 번째 사건은 트랜지스터일 것이다. 트랜지스터는 1947년 벨 연구소에서 윌리엄 쇼클리, 존 바딘, 월터 브래튼 세 사람이 발명하였고 이들은 노벨상을 수상하였다. 트랜지스터는 전기신호를 조절하여 0과 1을 결정하는 스위치 역할을 한다. 트랜지스터의 발전으로 디지털 컴퓨터가 발전하고, 1990년대에 인터넷이 출현하며 정보와 지식이 늘어났다.
스튜어트 러셀(Stuart Russel)은 지식을 '행동을 위한 정보'라고 하였으며, 지능은 '목적을 달성하는 능력'이라고 하였다. 인간은 경험을 통해 지식을 얻는 학습 과정을 거치며 지능이 강화된다. 인간의 지능이 세계를 인식하고, 학습하고, 추론을 하듯이 AI도 같은 일을 한다. AI가 인식을 할 수 있는 것은 센서(카메라, 녹음기, 키보드)를 통해서이다. 신경망을 통한 학습으로 패턴을 찾아내고, 그 패턴으로 미래에 어떤 일이 생길지 추론한다.
학습 능력
컴퓨터가 학습을 한다는 것은 AI를 이해하는 중요한 개념이다. 내가 처음 프로그래밍 언어를 배울 때 가장 흥미로운 것은 조건문을 배웠을 때였다. 조건문은 If-then을 말한다. A를 입력하면 0을 출력하고, B를 입력하면 1을 출력하도록 만드는 것이다. 초기 컴퓨터과학자들은 조건문을 통하여 AI를 만들었기 때문에 그 한계가 분명했다. 이런 조건문을 이용해서 체스를 두는 프로그램을 만들 수 있었다. IBM의 슈퍼 컴퓨터 딥블루가 1997년 인간 챔피언을 이긴 것은 그다지 놀랍지 않았다. 컴퓨터 연산력의 증대에 따라 조건문을 실행하고 예측하는 능력이 함께 증가했기 때문이고 인간을 이기는 것은 시간문제였기 때문이다. 알파고가 2016년 바둑에서 이세돌을 이긴 것은 훨씬 더 충격적인 사건이었다. 바둑은 19x19줄과 361개의 교차점을 만들어내는 게임판에서 진행된다. 바둑은 10에 170 제곱의 경우의 수가 있으며 우주의 모든 원자 수는 10의 80 제곱이다. 미리 설정된 규칙기반의 프로그램으로는 바둑에서 인간을 이기기 힘들다. 알파고는 딥러닝으로 만든 프로그램이다. 딥러닝은 합성곱 신경망(CNN)과 심층 신경망(DNN)과 강화학습을 통해 만들어졌다. 스스로 수많은 바둑을 시뮬레이션하고 이기면 보상을 받고 지면 페널티를 받는 강화학습을 통해서 알고리듬을 만들었다. 스스로 학습할 수 있는 능력 덕분에 AI는 더욱 빠르게 발전할 것이다. 챗GPT가 대중에게 공개된 이후 AI가 현실로 다가온 걸 실감하게 되었지만 여전히 AI는 그 초기 단계라고 본다. OpenAI의 CEO인 샘 알트만은 AI가 '무한한 가능성'을 지니고 있다며, AI는 질병을 치료하고 기후변화를 해결하고 종국에는 자비로운 신처럼 될 것이라고 예상한다. (AI의 위험을 통제하는 것은 더 중요하며 스튜어트 러셀의 책을 추천한다.)
인공지능, 머신러닝, 생성형AI,......
인공지능과 머신러닝은 같은 말일까? 나는 데이터분석을 독학했다. 데이터분석 커리큘럼의 절반은 전통적인 통계기법이고 나머지 절반은 머신러닝(기계학습)으로 구성된다. IBM에서는 온라인 강의를 통하여 헷갈리는 용어들을 다음과 같이 정리하였다.
인공지능:- 인간의 지능을 모방한 것으로, 일반적으로 학습(learn)하고, 함의를 발견하고(infer), 새로운 것을 추론(reason)하는 것이다.
머신러닝:- 패턴을 찾는 능력을 갖춘 기술이다. 예를 들어, 1,2,1이 주어졌다면 다음에 2가 올것이라고 예측할 수 있다. 1,2,1,2,1,2가 주어진다면 그 패턴이 확실하므로 다음에는 1이 올것이라고 추론할 수 있다. 1,2,1,2,1,2,3이 주어진다면 그 다음 무엇이 올지 예측하기는 어려운 패턴이 된다. 데이터가 많을 수록 패턴을 찾기 쉽다.
딥러닝:- 신경망이란 용어를 사용한다. 인간의 뇌가 작동하는 방식에서 영감을 얻은 것이다. 딥러닝이라고 불리는 이유는 신경망을 려 층으로 만들기 때문이다. 신경망은 몇 백만개로 이어지고 그 층 수십 개가 되기도 한다. 이 때문에 딥러닝이 결과를 내놓더라도 왜 그런 결과과 나왔는지 인간은 이해할 수 없고 블랙박스처럼 작동한다.
생성형 AI:- 현재 가장 유망한 AI의 형태로 chatGPT가 대표적이다. chatGPT를 만드는 모델은 대규모 언어 모(LLM)이다. 딥러닝을 이용해서 하나의 단어가 나오면 다음에 어떤 단어가 나올지 예측하도록 학슴된 알고리듬이다. 새로운 음악만드는 것은 오디오 모델(Audio model)이며 새로운 영상을 만드는 비디오 모델(video model)이 있다.
딥페이크:- 생성형AI 중 오디오 모델이나 비디오 모델로 실제 인물은 말하거나 행동하지 않았던 것을 실제처럼 보이도록 만드는 기술이다. 엔터테인먼트로 많이 사용되고 있지만 범죄로 활용될 위험도 높다.
2010년대부터 머신러닝과 딥러닝이 출현하였고, 2020년대부터는 생성형AI가 상용화 되며 AI발전을 선도하고 있다. 위의 용어를 벤다이어그램으로 나타내면 아래와 같다.
McCarthy(2007, p.2)
McCarthy(2007)
Wang (2019)
스튜어트 러셀(Stuart Russel), 어떻게 인간과 공존하는 인공지능을 만들 것인가
유발 하라리, 넥서스, 154p 인쇄술