2. 머신러닝과 딥러닝을 알아보자

전문 지식은 필요 없지만, AI를 '어느 정도' 이해하고 싶은 당신께

by 먀 ai

머신러닝: AI는 어떻게 그렇게 똑똑할까?


과거의 AI는 사람이 일일이 규칙을 정해줘야 했습니다. 예를 들어, “이렇게 생긴 건 고양이야” 같은 규칙을 직접 만들어서 작동시켰지요. 이런 방식은 '규칙 기반 시스템(rule-based system)'이라고도 합니다. 하지만 데이터가 기하급수적으로 늘어나면서, 모든 규칙을 사람이 만들 수 없게 됐습니다.


그래서 등장한 개념이 바로 머신러닝(Machine Learning)입니다. 머신러닝은 1편에서 자율주행 자동차 예시로 알아본 것처럼, AI가 데이터 속 패턴을 통계적으로 분석하고 예측 모델을 만드는 방법입니다.


고양이 사진을 수천, 수만 장 보여주면, AI는 스스로 "귀의 모양", "털의 패턴", "눈의 생김새" 같은 특징을 학습합니다. 그 결과, 처음 보는 고양이 사진이 나와도 "엇, 이건 고양이다!"라고 판단할 수 있게 되지요. 머신러닝은 이름에서 알 수 있듯이 'AI(machine)가 규칙을 스스로 찾아 학습한다(learning)'는 의미입니다.


인공신경망과 딥러닝: 더 깊게 배우는 과정


머신러닝 안에서도 복잡하고 어려운 문제를 해결하는 데 특히 강한 방법이 있습니다. 바로 이름부터 심화 과정 느낌이 나는 딥러닝(Deep Learning)입니다.

ChatGPT Image Apr 14, 2025, 05_25_08 PM.png

딥러닝은 인공신경망(Neural Network)이라는 구조를 기반으로 하는데요. 이 신경망은 사람 뇌의 신경세포인 뉴런 연결 방식을 흉내 냅니다.


치킨 냄새를 맡으면 '먹고 싶다!'는 생각이 드는 것처럼, 우리가 무언가를 보거나 듣고 생각할 때, 뇌 안에서는 수많은 뉴런이 신호를 주고받습니다. "입력(치킨)"을 받아서 가공하고, 그 결과를 "출력(먹고 싶다!)"으로 보내는 과정을 반복하지요. 인공신경망도 똑같습니다.

ChatGPT Image Apr 14, 2025, 05_37_00 PM.png

인공신경망 안에는 수천, 수만 개의 노드(뉴런처럼 행동하는 계산 단위)가 층층이 연결되어 있습니다. 각 노드는 입력받은 정보를 조금씩 정돈해서 다음 노드로 전달하는데요. 이 과정을 여러 층을 거치며 점점 더 복잡하고 정교한 패턴을 학습하게 됩니다.


노드 층의 가장 기본 구조는 이렇습니다:

첫 번째 층(입력층, Input Layer)이 데이터를 받습니다. (예: 사진의 픽셀 값)

중간층(은닉층, Hidden Layers)에서는 정보를 조금씩 가공하여 보다 정확한 출력을 장려합니다.

마지막 층(출력층, Output Layer)에서는 최종 결과를 냅니다. (예: "이건 고양이야!")


이렇게 층을 여러 번 거치면서, AI는 단순한 특징(색, 모양)부터 시작해 복잡한 패턴(고양이의 귀 모양, 얼굴 구조, 배경과의 구별 등)까지 점점 더 정교하게 이해하게 됩니다.


딥러닝은 기본적으로 인공신경망을 사용하지만, 목적에 따라 구조도 다양합니다. 예를 들어, 이미지를 잘 처리하는 CNN(합성곱 신경망), 시계열 데이터를 다루는 RNN(순환 신경망), 최근 대화형 AI에 혁신을 일으킨 Transformer(트랜스포머) 등이 있지요. 지금은 이런 용어는 몰라도 괜찮아요!


머신러닝 vs. 딥러닝


'스스로 학습'하는 기술

딥러닝은 머신러닝에 속한 학습 방법이라고 볼 수 있는데요. 기본적으로 머신러닝도, 딥러닝도 모두 '데이터를 보고 스스로 규칙을 배우는 기술'입니다. 교과서인 데이터를 많이, 다양하게 제공하여 AI가 스스로 패턴을 찾고 공부하게 만드는 방식이지요.


그렇다면, 차이점은 무엇일까요?


학습 방식

머신러닝은 사람이 어느 정도 개입을 해야 합니다. 고양이 사진을 무턱대고 잔뜩 주는 대신, 사람이 그 사진에서 고양이의 특징(Feature)을 뽑아줘야 하지요. "여기가 귀고, 이건 털 패턴이야"처럼 부위마다 설명을 해주어야 합니다.


머신러닝에는 데이터를 학습하는 여러 방식이 있는데요. 방금 설명한 ‘고양이 사진을 보여주며 학습하는 방식’은 정답(label)을 알려주고 학습하는 '지도학습'에 해당합니다. 다양한 학습 방식은 차차 알아보겠습니다.


반면, 딥러닝은 '특징 뽑기'도 스스로 합니다. 인공신경망을 이용해서 처음부터 끝까지 자동으로 패턴을 찾지요. 고양이 사진을 무턱대고 잔뜩 보여주기만 해도, AI는 내부에서 스스로 "엇, 귀가 뾰족하네?", "얘는 털 패턴이 다르네?" 같은 특징을 찾아냅니다.

ChatGPT Image Apr 14, 2025, 05_30_24 PM.png


복잡한 문제 해결 능력

사람이 어느 정도 정리해 둔 데이터를 사용하는 머신러닝은 구조가 비교적 단순합니다. 그래서 고객 이탈 예측, 스팸 메일 필터링처럼 규칙이 명확하고 규모가 작은 문제에 주로 활용되지요. 이미 '설명서'가 있는 데이터를 사용하기 때문에, 상대적으로 적은 양의 데이터로도 충분히 학습할 수 있습니다.


반대로, 딥러닝은 '설명서' 없이 데이터 속에서 스스로 패턴을 찾아야 합니다. 그래서 훨씬 많은 데이터가 필요하고, 그만큼 신경망 구조도 깊고 복잡해지지요. 이런 복잡한 구조 덕분에 딥러닝은 해석은 어렵지만, 규모가 크고 구조가 복잡한 문제에도 강합니다. 우리가 익숙한 챗GPT와의 대화, 지브리풍 이미지 생성, 자율주행 자동차 같은 고난도 작업에는 주로 딥러닝이 사용됩니다.




AI의 교과서라는 데이터는 어떤 방식으로 인공지능에게 제공해야 할까요? 다음 글에서는 데이터를 '가공'한다는 게 무엇인지, 또 좋은 데이터와 나쁜 데이터란 무엇인지 등, 데이터데이터 라벨링에 대해 좀더 알아보겠습니다.


전문적인 지식까지는 아니어도, AI 뉴스 정도는 이해하고 싶으시다면 다음주 글도 기대해 주세요!

keyword
이전 02화1. AI를 알아보자