brunch

You can make anything
by writing

C.S.Lewis

by chorong Aug 16. 2023

AI가 점점 더 똑똑해지는 이유, 학습방법의 차이_#1

생성형AI, 대규모 언어모델, Transformer 등 GPT에 관심이 있어 조금 찾다보면 정말 다양하고 많은 정보들이 쏟아져 나오는데요. 오늘은 AI가 점점 더 똑똑해지는 이유가 무엇인지, 학습방법에는 어떤 차이가 있는지에 대해 간략히 설명드리려 해요!  특히 다양한 AI학습방법 중 하나인 'Few-shot' learning에 대해 쉽게 풀어내려 합니다. 그 전에 먼저 '인공지능'과 관련된 기본정보부터 차근차근 설명드릴게요!

글이 길어질 것 같아 총 두 편으로 나누어 말씀드리겠습니다:)




1. 아주아주 기초적인 인공지능의 개념

'인공지능'이라고 하면 알파고와 GPT의 등장으로 많이 익숙해졌지만 아직까지는 막연하게 '어렵다'라는 느낌을 받는 분들이 계실 것 같아 준비했어요.

'인공지능'이란 말 그대로 '인공적으로 만든 지능'인데요. 학습하고, 추론하고, 언어를 이해하는 등 사람의 능력을 컴퓨터 프로그래밍으로 실현하는 학문이나 기술을 말합니다. 인공지능은 아래 3가지 특징을 지니고 있습니다.


(1) 문제해결능력

: 문제를 해결하기 위한 지능적인 행동으로 수식계산, 사진 속에 대상 판단, 알파고의 바둑판을 이해하고 다음 수를 결정하는 것 등 문제해결을 위한 모든 행동을 일컫습니다.


(2) 학습능력

: 입력과 출력의 데이터가 주어지면 규칙을 자동으로 파악하는 모델을 만듦. 과거 사람이 모든 프로그램을 직접 작성한 것과는 다르며, 이 특징은 곧 머신러닝 및 딥러닝을 의미합니다.


(3) 범용성

: 딥러닝 모델을 수정해 다양한 분야에서 응용할 수 있도록 하는 인공지능의 특징입니다.



2. 아주아주 기초적인 인공지능의 유형

인공지능은 '약한'인공지능과 '강한'인공지능으로 나누어집니다.


(1) ANI(Artificial Narrow Inteligence)

'약한인공지능' 혹은 '협의적(좁은의미의) 인공지능'이라고도 합니다.

특정한 업무(task)를 수행할 수 있도록 집중 훈련된 인공지능으로, '바둑'에 특성화된 구글의 알파고가 대표적입니다. 현재 약한인공지능은 다양한 분야에서 활발이 이용되고 있습니다. 교육, 의료, 서비스 등 해당 분야에서의 특화된 인공지능이 모두 '약한 인공지능'에 해당합니다.


(2) AGI(Artificial General Inteligence)

'강한인공지능' 혹은 '넓은의미에서의 인공지능'입니다.

특정 분야만이 아닌, 많은 유형과 클래스의 문제를 해결할 수 있고, 인간의 개입없이 풀고자 하는 문제점을 선별할 수 있는 AI를 의미합니다. 즉, 사람처럼 생각하고 스스로 문제점이 무엇인지 판단할 수 있는 인공지능이기에 현재까지 실현되지는 않았습니다.



3. 머신러닝(ML; Machine Learning)의 종류

대규모언어모델이 등장하기 전의 학습 방법으로는 크게 3가지로 나눌 수 있습니다. 


(1) 지도학습(Supervised Learning)

입력값과 결과값(정답 레이블)을 주고 학습하는 방법입니다. 맞냐, 틀리냐를 기준으로 학습하기 때문에 분류혹은 회귀 등 여러 방법에 활용됩니다. 주로 과거 데이터를 기반으로 앞으로 있을 이벤트를 예측합니다.

대표적으로는 이메일에서의 스팸 분류, 자동차의 엔진을 포함한 부품 고장의 예측을 하는데에 활용됩니다. 스팸의 성격을 띄는 메일인지 아닌지, 자동차 엔진이 고장났는지 아닌지와 같이 정답이냐, 아니냐에 따른 학습방법입니다.


(2) 비지도학습(Unsupervised Learning)

정답 레이블이 주어지는 지도학습과는 달리, 결과값 없이 입력값만 주고 학습하는 방법입니다. 데이터를 탐색해 내부 구조와 유사한 속성을 파악합니다. '클러스터링' 즉, 그룹화(군집화)를 통해 유사한 속성끼리 분류하고, 그룹화된 유사성을 근거로 속성을 파악하는 학습방법입니다.

대표적으로 금융거래 내역에 대한 데이터를 분석해 부정 사기 행위를 예방하는 데에 활용됩니다. 사기 행위에 대해 명확히 분류하기에 어렵습니다. 따라서 정답이 따로 있는 게 아니기에 비지도학습을 통해 별도의 그룹으로 분류되므로 한 번 더 점검해 볼 필요성이 있다는 것을 알려줍니다.


(3) 강화학습(Reinforcement Learning)

결과값을 주는 지도학습과는 달리, 어떤 행동이 '최선'인지를 학습하는 방법입니다. 일정 시간 내 예상되는 보상을 극대화할 수 있는 동작을 선택하도록 합니다. 주로 사용되는 분야는 로봇, 게임, 자율주행 자동차 등이 대표적입니다. 구글의 알파고 역시 강화학습을 통해 학습되었습니다. 과거 바둑기사들의 기보를 학습해 끊임없이 시행착오를 겪으며 점점 이길 수 있는 방법으로 학습합니다. 사람과는 달리, 컴퓨터에서 실행되기에 수천번의 게임플레이를 함으로써 데이터를 수집할 수 있습니다. 앞서 지도학습 및 비지도학습에 비해 보다 '능동적으로 데이터를 수집할 수 있다'는 것이 가장 큰 특징입니다.






지금까지의 내용은 인공지능의 아주 기초적인 내용을 다루었습니다. 구글에서 발표한 Attention is all you need라는 논문을 통해 '어텐션 신경망'이라는 개념의 등장으로, 트랜스포머 모델을 포함한 대규모 언어모델까지. 다음은 이들의 관계와 사람의 피드백에 의한 강화학습인 RLHF 및 적은 데이터로 학습할 수 있는 Few-shot Learning 등에 대해 살펴보겠습니다!

매거진의 이전글 [번역] 효과적인 프롬프트 엔지니어링 방법 3가지
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari