70년전부터 연구되던 AI, 2000년 이후로 급격히 주목 받게 된 이유
'인공지능'이라는 말은 언제 처음 쓰였을까요?
1956년, 기계가 인간처럼 학습할 수 있는지에 대한 논의가 펼쳐진 다트머스 회의에서 '앨런튜링'이라는 사람에 의해 '인공지능'이라는 말이 세상에 처음 알려지게 됩니다. 앨런튜링이 제안한 테스트 방법인 'Turing Test(튜링테스트)'를 통해 '인간의 지적능력' 혹은 '인공지능'이란 무엇인가?에 대한 근본적인 물음을 제기했습니다.
인공지능에 대한 연구의 초기단계에서는 '지능'이라는 개념에 대한 기준 정의도 잘 되지 않았었는데요, 앨런튜링은 우선 '인간이 보기에 인간 같은 것을 인간에 준하는 지능이 있다'고 간주하고, 튜링테스트를 제안합니다.
튜링테스트(1단계)란, 한 사람으로 구성된 질문자가 두 응답자에게 text로 질의를 합니다.
이때 응답자 중 한 명은 사람이고, 다른 한 명(?)은 컴퓨터로 구성되는데, 질문자는 어떤 응답자가 사람인지 알 수 없습니다.
질의 내용에 따라 두 응답을 받고, 두 응답(위 그림의 '응답내용 A', '응답내용 B') 중 어느쪽이 컴퓨터가 한 응답인지 구별할 수 없다면 해당 테스트는 통과하게 됩니다. (이 방법은 향후에 2022년 말, 세계를 놀라게 한 chatGPT의 주 학습방법인 사람의 피드백에 의한 강화학습,RLHF에도 영향을 미치게 돼요!)
이후 약 1970년대까지 활발한 연구가 진행되었지만, 컴퓨터를 비롯한 기계들의 성능, 학습 데이터의 부족 등의 한계로 잠시 주춤하게 됩니다.
※ 인공지능의 학습방법에는 지도학습/비지도학습/강화학습 크게 3가지가 있는데 이에 대한 개념은 차례대로 업로드할게요!
(사람의 피드백에 의한 강화학습은 '강화학습'에서 비롯됩니다.)
침체기 후, 1980년대에 어떠한 규칙에 기반하여 자동으로 판정을 내려주는 전문가 시스템이 등장하게 됩니다. 너무도 방대하게 연구되던 인공지능의 범위를 법률, 의학, 비즈니스 등으로 세분화하여 그 규모(범위)를 줄이고 보다 실용적으로 활용할 수 있도록 했습니다. 하지만 '사람이 입력한 규칙에 기반'하기 때문에 여러 한계가 있었습니다.
이후 '사람이 입력한' 즉, 인간의 명령으로만 동작이 되던 AI는 스스로 규칙을 찾아 학습하는 '머신러닝'이 등장합니다. 스스로 규칙을 찾아 학습할 수 있게 된 데에 배경으로는 '인터넷(검색엔진)'의 등장인데요!
인터넷에 떠다니는 대량의 정보(빅데이터)를 모아 학습할 수 있는 환경이 조성됨으로써 머신러닝의 연구가 활발히 진행할 수 있게 됩니다.
※ 여기서 '하드웨어의 발전'이 빠질 수 없는데요!
이전에는 인공지능이 학습할 수 있는 환경, 즉 '하드웨어'의 성능이 너무 낮아 학습을 하는데에 어려움이 있었습니다. 그런데 컴퓨터 게임이 등장하고, CPU에 이어서 GPU(그래픽카드)가 등장함으로써 이전보다 훨씬 빠른 연산(처리)을 할 수 있게 되었지만, 이때만해도 아직은 하드웨어의 성능이 역부족이었어요.
이미 1960년대쯤, 인간의 신경망을 그대로 옮긴, 인공신경망 중 하나인 퍼셉트론에 대한 연구가 진행되었습니다. 향후 이 퍼셉트론의 연구가 더해져 '다층 퍼셉트론', '심층 신뢰 신경망' 등의 이론이 등장하게 되어 이전 연구에서의 한계를 뛰어 넘을 수 있었습니다.
앞서 잠시 말씀드린것처럼, 하드웨어의 미미한 발전으로 직접 학습을 시켜 증명할 수 있는 환경이 구축되지 않았습니다.
그러던 중, 2000년대 이후 기술이 급격하게 발전함에 따라 GPU의 성능도 급속도로 높아지게 됩니다.
이로써 학습데이터량이 풍부하고, 빠른 연산이 가능한 하드웨어가 발달하며, 기존 신경망의 한계를 극복함으로써 머신러닝에서 딥러닝으로의 발전이 이루어질 수 있었습니다.