brunch

You can make anything
by writing

C.S.Lewis

by 알바트로스 Dec 24. 2023

인공지능과 자연어처리(NLP) (2)

인공지능과 자연어처리의 역사와 미래

1. 인공지능과 자연어처리의 역사


인공지능의 역사는 고대 그리스 신화까지 거슬러 올라갑니다. 대장장이신 헤파이스토스가 만들었다는 청동기계인간 탈로스는 스스로 작동하는 기계에 대한 고대인들의 상상력을 보여줍니다. <아폴로도로스 신화집>에 등장하는 탈로스는 크레타 섬 해안가를 지키는 로봇입니다. 청동으로 만들어진 이 기계는 외부 선박이 침입하려 하면 바위를 던져 공격하고, 수상한 선박이 상륙하려 할 때 자신의 청동 본체를 달구어 침입자들을 끌어안고 타죽게 만든다고 합니다.  그 외에도 18세기 유럽에서 발명된 보캉송의 오토마타(automata)는 유기체의 동작을 모방하여 스스로 동작합니다. 이 외에도 오래전부터 스스로 작동하는 기계에 관한 다양한 기록과 연구가 존재하는 것을 보면 인공지능의 역사는 생각보다 깊은 것이라고 할 수 있습니다. 


이 책의 서두에서 소개했듯이 현대적 의미의 인공지능이라는 개념의 토대를 만든 것은 앨런 튜링입니다. 튜링은 1950년 그의 논문 ‘Computational Machinery and Intelligence(계산기계와 지능)’에서 ‘생각하는 기계’를 학술적으로 연구하기 위한 토대를 마련합니다.  그러나 본격적으로 인공지능(Artificial Intelligence, AI) 이라는 용어를 사용하기 시작한 것은 미국의 심리학자이자 컴퓨터 과학자였던 존 매카시(John McCarthy)입니다. 존 매카시는 1955년 8월 31일에 미국 다트머스 대학교에 인공지능의 선구자격인 미국의 과학자 마빈 민스키, 수학자 클로드 섀넌 등 다양한 분야의 최고 석학들이 모인 다트머스 학회(Dartmouth conference)에서 처음으로 인공지능이란 용어를 세상에 공개한 것으로 알려져 있습니다.


자연어처리는 인공지능의 여러 하위분야 중에서도 역사가 깊은 분야입니다. 자연어처리 분야의 초기 연구는 주로 한가지 언어를 또다른 언어로 번역하는 데 초점을 맞추고 있는데, 이처럼 컴퓨터가 주체가 되어 언어를 번역하는 시스템을 기계 번역(machine translation)이라고 합니다. 최근에는 기계번역 뿐 아니라 감정 분석(sentiment analysis), 문장 생성(sentence generation) 등 다양한 태스크에 자연어처리 기술이 활용되고 있습니다.


1954년, 조지타운-IBM 실험은 최초의 기계 번역 시스템을 보여주었습니다. 이 시스템을 통해 60개의 러시아어 문장을 영어로 번역하는데에 성공합니다. 그러나 초기의 기계 번역은 굉장히 원시적이었으며, 문맥을 전혀 고려하지 않은 채 단순히 단어를 다른 단어로 대체하는 방식으로 이루어졌습니다.


1960~70년대의 자연어처리는 훨씬 더 진보된 방식을 보여줍니다. 자연어처리 연구자들과 엔지니어들은 구문론적(synax), 의미론적(semantic), 화용론적(pragmatics) 요소를 포함한 더 복잡한 모델들을 탐색하기 시작했는데, 이 기간동안 최초의 챗봇으로 알려진 ELIZA와 같은 초기 대화형 AI 프로그램도 개발되기도 했습니다. Section 2 ‘자연어처리의 이해’에서 만나볼 ELIZA는 인간의 환자와 심리 치료사와의 대화를 모방하는 프로그램으로, 사용자의 입력을 분석하여 그에 맞는 반응을 생성하는 방식으로 동작합니다.


1980년대와 1990년대에는 2장 언어모델 해부하기에서 살펴볼 통계적 기계 번역(statistical machine translation)이 주류가 되었습니다. 통계적 기계 번역은 대량의 데이터와 통계적 알고리즘을 사용하여 언어 간의 번역을 진행하는 방식인데, 이 기간동안 통계적 방법론이 NLP의 주요한 연구 방향으로 자리 잡기 시작했습니다.


21세기에 들어서는 딥러닝과 뉴럴 네트워크의 발전 덕분에 NLP의 진화가 더욱 가속화되었습니다. 2010년대 중반 이후로 딥러닝 기반 자연어처리가 주류로 떠오르는데, 특히 2장 언어모델 해부하기에서 자세히 다룰 Transformer 아키텍처를 기반으로 한 BERT, GPT와 같은 모델들이 등장하면서 NLP 연구의 패러다임이 크게 바뀌었습니다. 이러한 모델들은 깊은 표현 학습 능력 덕분에 다양한 NLP 태스크에서 뛰어난 성능을 보이며, 현재도 NLP 연구의 최전선에서 활용되고 있습니다.



2. 약인공지능(AI)/강인공지능(AGI)/슈퍼인공지능(ASI)과 자연어처리


인공지능은 크게 강인공지능(strong AI)과 약인공지능(weak AI)으로 나눌 수 있습니다. 약인공지능은 특정 주제의 분야에서 주어진 일을 인간의 의도에 따라 수행하는 인공지능으로, 방대한 양의 데이터를 학습시켜 인간의 프로그래밍 없이도 스스로 인간의 특정 문제를 해결하는 것을 목적으로 합니다. 


약인공지능은 문제 해결 자체에 포커스가 맞추어져 있습니다. 이 책에서 다루는 자연어처리(NLP)를 비롯하여 자율주행을 위한 객체인식(object detection), 이상치 탐지(anomaly detection) 등 거의 모든 인공지능의 세부 분야와 기술들은 모두 인간의 문제해결을 목적으로 탄생했습니다. 따라서 오늘날 인류의 생활을 편리하게 해주고 업무 생산성을 향상시켜주는 우리가 알고 있는 대부분의 인공지능이 약인공지능의 카테고리에 속합니다.


출처 : Pixabay


반면에 강인공지능(strong AI)이란 컴퓨터에 인간의 것과 동일한 수준의 지성을 구현하고자 하는 시도로, 인공일반지능(Artificial General Intelligence, AGI)이라고 부르기도 합니다. Section2 ‘자연어처리는 왜 어려울까?’에서 살펴보았듯이 1980년대 중국어 방 실험(the chinese room test)을 제안한 존 설 교수가 현재의 약인공지능 기술과 구분하기 위해 제시한 개념이기도 합니다.


강인공지능은 컴퓨터 공학과 통계학뿐만 아니라 인간의 지각능력과 의식에 대한 철학적 논의와 합의가 필요한 매우 복잡한 분야입니다. 영화 그녀(Her), 엑스 마키나(Ex Machina), 터미네이터에서 묘사하고 있는 인공지능은 모두 강인공지능을 모델로 하지만 현재의 기술력으로는 구현하기 힘든 상상속의 개념이라고 할 수 있습니다. 중국어 방 실험에서 소개한 대로 존 설 박사는 튜링 테스트를 통과한 것 만으로는 인공지능이 인간과 비슷한 수준의 지능을 가지고 있다고 판단할 수는 없다고 주장했습니다. 그의 주장대로 인공지능에 인간의 것과 비슷한 수준의 지능을 재현해내기 위해서는 인간 뇌의 작동 메커니즘을 비롯해 아직 밝혀내야 할 점들이 많습니다.


강인공지능의 실현 가능성에 대한 논쟁은 현재진행형입니다. 챗GPT와 같은 초거대언어모델(LLM) 의 학습 데이터와 매개변수(parameter)가 계속해서 증가하며 발전을 거듭하게 되면서 결국은 기계가 인간과 같은 수준의 지능을 획득할 수 있을 것이라는 주장과, 기계와 인간의 지능은 근본적으로 다르며 인공지능은 결국 인간과 같은 수준의 지성을 획득하지 못할 것이라는 주장이 대립하고 있습니다.


이 책을 쓰고 있는 2023년 현재 챗GPT의 등장을 계기로 인류의 지능을 뛰어넘어 스스로 목표를 설정하고 지능을 강화하는 존재인 초인공지능(Artificial Super Intelligence, ASI)의 출현에 대비해야 한다고 목소리를 내는 사람들도 늘어나고 있습니다. 그러나 현재 수준의 인공지능 기술은 아직 일반인공지능(AGI)에도 도달하지 못하고 있습니다. 이를넘어 초인공지능(ASI)의 영역에 도달하기 위해서는 아직 넘어야할 산이 많습니다.


 앨런 튜링은 인공지능의 발전을 두고 그의 저서 The Enigma of Intelligence에서 "인공지능의 발명이란 자동차에서 바퀴를 떼어낸 뒤 그 자리에 발을 달기 위해 고심하는 것이다."라고 말하기도 했습니다. 여기서 ‘발’은 인간의 지성을 의미하고, ‘바퀴’는 인공지능을 의미한다고 볼 수 있습니다. 튜링은 인공지능은 인간의 지능과는 본질적으로 다를 수 있다고 생각했습니다. 그럼에도 불구하고 인공지능은 인류의 지성을 뛰어넘을 수 있다고 믿었던 것이죠. 자동차에 발이 달려있지 않고 대신에 바퀴가 달려있다고 해도 자동차가 사람보다 빨리 달릴 수 있다는 사실을 의심하는 사람은 없는 것 처럼요. 

이전 12화 인공지능과 자연어처리(NLP) (1)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari