brunch
매거진 AI

1-2. 기계가 배우는 법

머신러닝과 딥러닝의 탄생

by 유비관우자앙비

1️⃣ 인간처럼 배우는 기계

우리는 태어나면서부터 배움을 시작합니다. 언어를 배우고, 규칙을 익히며, 실수와 경험을 통해 세상을 이해하죠. 인공지능(AI)도 비슷한 과정을 거칩니다. 기계가 스스로 세상을 이해하도록 만드는 방법, 그 출발점이 바로 머신러닝(Machine Learning) 입니다.


머신러닝은 사람이 모든 규칙을 일일이 알려주는 대신, 기계가 데이터를 보고 스스로 규칙을 찾아내도록 학습시키는 기술입니다. 즉, “답을 알려주는 것”이 아니라 “스스로 답을 찾아내게 하는 것.” AI의 본질은 바로 이 학습 능력(Learning) 에 있습니다.


2️⃣ 데이터가 스승이 되다

머신러닝의 스승은 사람 대신 데이터입니다. 기계는 수많은 데이터를 보면서 “이런 상황에서는 이런 결과가 나올 확률이 높다”는 패턴을 스스로 찾아냅니다. 예를 들어 수천 장의 고양이와 개 사진을 보여주면, 기계는 색상, 형태, 귀의 각도, 꼬리의 길이 등 다양한 특징을 분석해 “이건 고양이일 가능성이 높다”라는 감각을 형성합니다. 이때 인간은 정답(라벨)을 알려주지만, 그 정답에 이르는 규칙은 기계가 스스로 학습합니다. 그래서 머신러닝에서 인간은 교사라기보다 코치에 가깝습니다.


CASE 1. 유튜브 추천 알고리즘
유튜브의 ‘추천 영상’은 머신러닝의 대표적인 예입니다. 수십억 건의 시청 데이터를 학습해, “이 영상을 본 사람은 다음 영상을 볼 확률이 높다”는 패턴을 스스로 찾아냅니다. 사람의 개입 없이도 AI가 개인의 취향을 예측하고 큐레이션을 수행하죠.


3️⃣ 세 가지 학습 방식

머신러닝에는 대표적으로 세 가지 학습 방법이 있습니다.


① 지도학습(Supervised Learning)
정답이 있는 데이터를 사용해 학습시키는 방식입니다. 예를 들어 “이건 고양이, 저건 개”처럼 결과를 함께 알려주며 학습합니다. 이미지 분류, 스팸메일 탐지, 음성 인식 등이 대표적인 사례입니다.


② 비지도학습(Unsupervised Learning)
정답이 없는 데이터를 스스로 분석해 패턴이나 구조를 찾아내는 방식입니다. 고객 데이터를 분석해 유사한 구매 패턴을 가진 사람들을 묶는 ‘고객 세분화(Clustering)’ 같은 일이 이에 속합니다.


③ 강화학습(Reinforcement Learning)
시도와 실패를 반복하며 보상을 극대화하는 방향으로 학습하는 방식입니다. 대표적인 예로는 알파고(AlphaGo) 가 있습니다. 알파고는 스스로 수백만 번의 대국을 반복하면서, 승리 확률이 높은 수를 선택하도록 진화했습니다. 또한 ChatGPT의 핵심 기술인 RLHF(Reinforcement Learning from Human Feedback) 도 강화학습의 일종입니다. 사람의 피드백을 통해 “좋은 대화”와 “좋지 않은 대화”를 구분하며

AI가 점점 더 자연스럽고 논리적인 언어를 사용하게 만든 것이죠.


CASE 2. 자율주행 자동차
테슬라와 현대자동차의 자율주행 시스템은 강화학습 기반의 머신러닝을 사용합니다. 차량 센서와 카메라가 도로 상황을 수집하고, AI는 매 순간 “브레이크를 밟을지, 가속할지”를 결정합니다. 수백만 km의 주행 데이터를 통해, AI는 실제 운전자처럼 도로의 ‘패턴’을 학습합니다.


4️⃣ 딥러닝 ― 뇌를 닮은 구조

머신러닝이 “기계의 학습”이라면, 딥러닝(Deep Learning) 은 “기계의 사고방식”입니다. 딥러닝은 인간의 뇌 구조를 모방한 기술입니다. 우리의 뇌는 수십억 개의 뉴런(신경세포)이 연결되어 전기 신호를 주고받습니다.

딥러닝도 마찬가지로, ‘노드(Node)’라 불리는 인공 뉴런이 여러 층으로 연결된 구조를 가집니다. 이걸 인공신경망(Artificial Neural Network) 이라고 부릅니다.


‘딥(Deep)’이라는 단어는 말 그대로 층이 깊다는 뜻입니다. 입력층 → 은닉층 → 출력층으로 이어지는 이 네트워크는 데이터를 여러 번 통과시키며 점점 더 복잡한 특징을 이해합니다. 예를 들어 첫 번째 층은 단순한 선과 색을 인식하고, 두 번째 층은 형태를 구분하며, 세 번째 층은 눈·코·입의 관계를 파악합니다. 그리고 마지막에는 “이건 고양이다”라는 추상적 개념을 스스로 인식하게 됩니다.


CASE 3. 구글 포토의 자동 분류 기능

구글 포토 앱에서 “강아지”, “하늘”, “음식” 등을 검색하면 별도로 태그를 달지 않아도 이미지가 분류되는 이유가 바로 딥러닝입니다. 수십억 장의 사진을 학습한 인공신경망이 각 픽셀의 패턴을 분석해, 이미지의 내용을 이해하는 것이죠.


5️⃣ AI는 정답을 외우지 않는다

많은 분들이 “AI는 데이터를 단순히 외운다”고 생각하시지만, 실제로는 추론(Inference) 을 통해 새로운 상황을 해석합니다. AI는 예시를 통해 패턴을 학습하고, 그 패턴을 바탕으로 보지 못한 상황에서도 적용 가능한 규칙을 만들어냅니다. 그래서 ChatGPT는 새로운 문장을 쓸 수 있고, Midjourney나 DALL·E 같은 모델은 본 적 없는 이미지를 창조할 수 있는 것입니다. 즉, 인공지능은 암기하는 존재가 아니라, 관계를 이해하는 존재로 진화하고 있습니다.


6️⃣ 트랜스포머와의 연결

1편에서 다뤘던 트랜스포머(Transformer) 는 이 딥러닝의 연장선상에 있습니다. 트랜스포머는 특히 ‘언어’라는 비정형 데이터를 다루는 데 최적화된 구조입니다. 단어와 단어 사이의 관계를 이해하고, 문맥 속에서 어떤 정보가 중요한지를 스스로 판단합니다. 이 구조의 등장으로 AI는 단순히 인식하는 수준을 넘어,

“의미를 이해하는 기계” 로 발전했습니다. 머신러닝이 AI의 눈을 열었다면, 트랜스포머는 AI의 언어를 열었다고 할 수 있습니다.


CASE 4. ChatGPT의 문장 이해
ChatGPT가 “오늘 서울 날씨 어때?”라는 질문에 “서울의 오늘 기온은…”으로 자연스럽게 답할 수 있는 이유가 바로 이 트랜스포머 구조 덕분입니다. 단어의 순서뿐 아니라 ‘의도’와 ‘맥락’을 함께 이해하기 때문이죠.


7️⃣ 인간의 학습, 기계의 학습

인간은 감정을 통해 배우고, 기계는 데이터를 통해 배웁니다. 인간은 직관으로 패턴을 인식하고,
기계는 확률로 패턴을 계산합니다. 방식은 다르지만, 학습의 본질은 같습니다. 과거의 경험으로 미래를 예측한다는 점에서, AI의 학습 과정은 결국 인간의 학습과 닮아 있습니다. AI를 이해한다는 것은 곧, “인간이 어떻게 배우는가”를 다시 배우는 일일지도 모릅니다.


keyword
매거진의 이전글1-1. 인공지능이란 무엇인가 ― 상상에서 현실로