brunch

You can make anything
by writing

C.S.Lewis

by 박경아 Aug 19. 2022

2. 인공지능, 머신러닝, 딥러닝 개요

[마케터를 위한 머신러닝, 딥러닝 사전]

먼저 본격적으로 머신러닝, 딥러닝 알고리즘들에 대해 이해해보기 전에 이번 글에서는 인공지능과 머신러닝, 딥러닝이라는 말들이 무엇을 의미하는 지 한 번 생각해 보도록 하자.


인공지능이란 무엇일까?


인공지능이란 말 그대로 인간의 지능과 대비되는 인공적인 지능으로, 컴퓨터가 인간처럼 생각하거나 행동할 수 있는 능력이라 할 수 있다. 굳이 인공지능이라고 말을 하지 않아도 알아서 방 청소를 하는 로봇청소기에서부터 웹사이트에 들어가면 티키타카 해주는 채팅봇, 영화 어벤저스에 악당 역할로 나오는 울트론등 우리가 생각할 수 있는 인공지능의 모습이다.


하지만 인간처럼 생각한다 혹은 행동한다는 말 자체를 정의 내리는 게 어려워서일까? 아이러니한 것은 컴퓨터가 어떤 일을 하는 방법을 알아낼 때마다, 예를 들어 글자를 인식하거나 체스를 두거나 번역을 하는 등 '그건 생각하는 게 아니다' (That's not thinking) 혹은 '그건 단순한 계산일 뿐이다' (Oh, that's just a computation) 등의 비판이 있어 왔다.


이를 두고 AI 효과(AI effect) 라고 하는데 이미 그 방법을 알고나면 더 이상 인공지능이라 불리지 않는 현상을 말한다. 그래서일까? 인공지능에게는 '지금까지 구현되지 않은 모든 것'(AI is whatever hasn't been done yet)이라는 정의도 있다. 그 만큼 인공지능에 대해 미지의 영역에 대한 도전, 기대 내지는 환상을 품고 있는 측면도 있다고 할 수 있을 것이다.


출처: What Is Intelligence? 20 Years After Deep Blue, AI Still Can't Think Like Humans


인공지능이라는 말이 처음으로 등장한 것은 1956년 미국 다트머스 회의이다. 이 말을 처음 만든 스탠포드 대학 존 매카시 교수는 인공지능을 '지적인 기계(Artificial intelligence)를 만들기 위한 과학과 공학'으로 정의했다.


이후 기계에게 인간의 지적 능력을 부여하기 위한 방법으로 기호주의 인공지능과 연결주의 인공지능이 등장하게 된다. 기호주의 인공지능은 인간이 삼단 논법(三段論法)과 같은 논리적 추론을 하듯 세상의 모든 지식을 명제화해 컴퓨터가 연역적으로 추론함으로써 인간과 같이 사고를 할 수 있다는 접근방식이다. 하지만 기호주의는 세상의 모든 지식을 명제화하는 것도 어렵거니와 무엇보다 걷기, 말하기, 운전하기 등 인간이 힘들이지 않고도 잘하지만 어떻게 하는 지 설명하기 어려운 암묵지를 명제로 변환하는 것이 어렵다는 한계에 부딪혀 쇠퇴하고 만다.


지금 주류라 할 수 있는 머신러닝, 딥러닝은 이와는 반대로 데이터로부터 배우는 귀납적 추론 방식이다. 특히 연결주의 인공지능은 인간의 뇌는 지능이 있으니 이것이 어떻게 작동하는 지 보고 따라해보자는 생각에서 시작되었다. 1957년 로젠버트에 의해 제안된 초기 형태의 간단한 인공 신경망(퍼셉트론)은 인간 뇌의 뉴런의 작동원리를 구현한 것으로 등장 초기 그 단순함으로 인해 비판 받았으나 이후 다층 퍼셉트론과 딥러닝으로 발전하게 된다. 퍼셉트론을 비롯한 인공신경망에 대해서는 나중에 다시 한 번 이야기할 예정이다.


생물학적 뉴런 (Biological Neuron)



컴퓨터와 인공지능은 뭐가 다를까?


최초의 컴퓨터는 1946년에 만들어진 애니악이다. 애니악이 등장했을 당시 사람들은 '거대한 두뇌'(Giant Brain)라 부르며 그 어마어마하게 빠른 연산능력과 기억능력에 이제 인간이 기계에 대체되는 게 아닌가하는 두려움이 있었다고 한다. 마치 최근 몇 년간 인공지능이 사람들에게 많이 알려지면서 나오는 반응들과 비슷하다. 이렇게 놓고보면 컴퓨터와 인공지능이 다른 것이 아니라 컴퓨터의 발전, 진화가 곧 인공지능이 아닐까라는 생각도 든다.


최초의 컴퓨터 애니악, 위키피디아


컴퓨터에게 과연 지능이 있는 지 아닌지 구분하는 방법으로 1950년 대 앨런 튜링이 제안한 튜링 테스트가 있다. 심판은 컴퓨터가 2대가 있는 방에 들어가 컴퓨터 채팅을 통해 질문을 주고 받는데 상대편에는 한 쪽 컴퓨터는 사람이 대답하고, 다른 한 쪽은 컴퓨터가 대답을 하게 된다. 전체 심판의 1/3을 속이고 사람으로 뽑히면 그 컴퓨터는 인공지능을 지녔다고 판단하는 것이다.


어떤 질문을 했는지도 궁금하지만 단순한 계산이라면 모를까? 당시에 컴퓨터가 사람의 텍스트를 어떻게 이해하고 답을 할 수 있 수 있었는 지 궁금했는데 역시나 아직까지 튜링 테스트를 통과한 기계는 없다고 한다. 2014년에 우크라이나에서 개발한 유진이라는 인공지능이 튜링 테스트를 통과했다는 기사도 있었지만 대답하는 캐릭터 자체가 영어 모국어가 아닌 13세 소년을 가정해 5분이라는 짧은 시간 동안 심사위원을 속아 넘길 수 있었다며 이를 인정하지 않는 회의적인 시각도 존재한다.



머신러닝과 딥러닝의 차이 


자, 그럼 이제 머신러닝과 딥러닝에 대해 알아보자. 컴퓨터는 기계이고 이를 데이터로 학습시키는 것을 일컬어 머신러닝(Machine Learning)이라고 한다. 사람도 동일한 사건이나 일이 반복되면 그곳에서 패턴이나 규칙을 발견해 학습하듯 기계 역시 데이터 (사람으로치면 경험이나 일)로 배우는 것을 말한다.


명확한 정의가 없는 인공지능과 달리 머신러닝은 정의가 있다. 1950년대 머신러닝이라는 용어를 만든 아서 사무엘에 따르면 머신러닝은 '컴퓨터가 명시적으로 프로그램되지 않고 학습할 수 있도록 연구하는 분야' 라고 한다. 예를 들어 전통적인 프로그램은 2에 3을 곱하면 6이라는 결과를 도출하도록 인간이 프로그래밍하는 반면, 머신러닝은 (수많은) 입력값이 주어지면 정답을 나올 수 있는 조건를 컴퓨터가 학습해 찾는 것이다. 


https://brunch.co.kr/@gdhan/10


실제 머신러닝의 경우 수십만, 수백만 개의 데이터를 대상으로 하는데, 모델을 훈련시킨다는 의미는 모델에게 입력값을 넣었을 때 주어진 정답을 가장 잘 도출할 수 있는 최적의 조건, 즉 모델의 최적의 가중치를 찾는 것을 의미한다. 그래야 새로운 데이터가 주어졌을 때 정답이라고 생각하는 답을 예측할 수 있기 때문이다.


이렇듯 머신러닝은 데이터로 학습하면서 해당 데이터를 가장 설명할 수 있는 가중치를 찾아내는 과정인데, 딥러닝 역시 데이터로부터 배우는 머신러닝의 방법 중에 하나이다. 다만 딥러닝은 앞서 말했듯 인간의 뇌의 뉴런의 작동방식을 수학적으로 모델링한 것이다.

https://www.slideshare.net/linagora/deep-learning-in-practice-speech-recognition-and-beyond-meetup


퍼셉트론에서 시작한 딥러닝 역시 데이터로부터 학습하며 최적의 가중치를 찾아내는 과정(컨셉) 기본적으로 동일하지만 연결주의가 아닌 머신러닝과 사용하는 수식이 좀 다르고, 무엇보다 딥러닝은 수학적으로 모델링된 인공 뉴런을 수십, 수백개 깊게 (Deep) 쌓아 일반적인 머신러닝 알고리즘이 발견하지 못하는 패턴을 발견하거나 복잡한 문제를 보다 잘 해결하는 것으로 알려져 있다.


그래서 최근에 와서는 딥러닝이 각광받고 있고, 머신러닝으로부터 딥러닝을 구분해야 한다는 의견도 나오고 있다. 다음 글에서는 머신러닝이 어떻게 데이터를 학습해 최적의 가중치를 찾아 가는 지 머신러닝의 학습방법에 대해 조금 더 자세히 알아보도록 하자. 



* 참고자료

1. AI Effect

https://en.wikipedia.org/wiki/AI_effect

2. 인공지능, 머신러닝, 딥러닝 개념

https://brunch.co.kr/@gdhan/10

3. 세계를 놀라게 한 인공지능(AI) 5가지

http://www.aitimes.com/news/articleView.html?idxno=131595

4. 조성준 '세상을 읽는 새로운 언어, 빅데이터' (21세기 북스)


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari