머신러닝에 대하여

데이터 먹고 똑똑해지는 AI?

by 이롱이

스스로 배우는 똑똑한 기계, 머신러닝이 뭐예요?

여러분은 머신러닝(Machine Learning)이라는 말 들어보셨나요? 단어 뜻 그대로 기계(Machine)가 스스로 배우는(Learning) 기술이에요. 옛날에는 컴퓨터가 어떤 일을 하게 하려면, 사람이 "이럴 땐 이렇게 해!", "저럴 땐 저렇게 해!" 하고 하나부터 열까지 다 알려줘야 했어요. 마치 우리가 게임 캐릭터 조종법을 배우는 것처럼요.

하지만 머신러닝은 좀 달라요. 컴퓨터에게 엄청 많은 정보(데이터)를 주고, 컴퓨터가 그 안에서 스스로 규칙이나 비밀을 찾아내게 하는 거예요. 마치 우리가 시험공부할 때 교과서랑 문제집을 잔뜩 풀면서 스스로 요령을 익히는 것처럼요. 이렇게 배우면, 나중에 처음 보는 문제가 나와도 배운 내용을 바탕으로 "음, 이건 이렇게 풀면 될 것 같은데?" 하고 스스로 생각해서 답을 찾을 수 있게 되죠.

오래 전인 1959년에 아서 새뮤얼이라는 똑똑한 과학자는 머신러닝을 "사람이 일일이 가르쳐주지 않아도 컴퓨터가 스스로 배울 수 있게 만드는 기술"이라고 설명했어요. 복잡하고 어려운 문제를 풀기 위해, 이제 컴퓨터도 스스로 배우고 성장하기 시작한 거예요!


ChatGPT Image 2025년 5월 13일 오후 02_29_46.png
ChatGPT Image 2025년 5월 13일 오후 02_29_49.png


고양이 사진 백만 장 보면 나도 냥이 박사? 머신러닝 학습법 엿보기

그럼 컴퓨터는 대체 어떻게 혼자 배우는 걸까요? 쉬운 예를 들어 볼게요. 컴퓨터에게 고양이 사진을 엄청 많이 보여준다고 생각해 봐요. 사진을 보여줄 때마다 "이건 고양이야!" 또는 "이건 고양이 아니야!" 하고 정답도 같이 알려줘요.

컴퓨터는 이 사진들을 보면서 "아하! 고양이는 보통 귀가 뾰족하고, 눈이 동글동글하고, 수염이 있구나!" 하는 식으로 고양이만의 특징들을 스스로 찾아내기 시작해요. 이렇게 수많은 사진으로 열심히 공부하고 나면, 나중에 처음 보는 사진을 딱 보여줘도 "어? 이 사진, 내가 공부했던 고양이 특징이랑 완전 비슷한데? 이건 95% 확률로 고양이야!"하고 꽤 정확하게 맞출 수 있게 된답니다.

이렇게 데이터 속에서 스스로 규칙이나 특징(패턴)을 찾아 배우는 것, 이게 바로 머신러닝이 작동하는 방법이에요. 유명한 과학자 얀 르쿤은 "우리의 최종 목표는 사람처럼 세상을 스스로 배우고 이해하는 똑똑한 시스템을 만드는 것"이라고 말했는데, 머신러닝은 바로 이 멋진 목표를 향해 나아가는 첫걸음인 셈이죠.


공부에도 스타일이 있지! 머신러닝의 3가지 학습 스타일

사람마다 공부하는 스타일이 다르듯이, 머신러닝도 배우는 방법이 여러 가지예요. 어떤 문제를 풀어야 하는지, 어떤 데이터가 있는지에 따라 가장 좋은 학습 방법을 선택할 수 있어요.


boardviewimage.png 출처 한국CDC웹진


1. 지도학습 (Supervised Learning)

정답 보며 공부하는 꼼꼼한 모범생 스타일. 이건 마치 선생님이 정답지를 나눠주고 "자, 이거 보면서 공부해!" 하는 것과 같아요. 컴퓨터에게 문제(데이터)와 함께 정답(레이블)을 알려주면서 공부시키는 방법이죠. 컴퓨터는 문제와 정답을 계속 맞춰보면서 "아하! 이런 문제엔 이게 답이구나!"하고 규칙을 스스로 익혀요. 예를 들어 스팸 메일을 걸러내는 기능을 만들 때, 어떤 메일이 스팸인지 아닌지 정답을 알려주면서 컴퓨터를 공부시키면 나중엔 새로운 메일도 척척 스팸인지 아닌지 구분할 수 있게 돼요. 고양이 사진엔 '고양이', 강아지 사진엔 '강아지'라고 알려주면, 나중에 처음 보는 동물 사진도 잘 구분하겠죠?


2. 비지도학습 (Unsupervised Learning)

정답 없이 스스로, 끼리끼리 모여봐! 탐험가 스타일. 이번엔 정답지를 안 줘요! 마치 탐험가가 아무 정보 없이 새로운 곳을 탐험하듯, 컴퓨터가 정답 없는 데이터 속에서 스스로 "어? 얘네들은 좀 비슷하게 생겼네?"하고 비슷한 것들끼리 그룹을 만들거나 숨겨진 특징을 찾아내는 방식이에요. 이걸 '군집화(Clustering)'라고 부르기도 해요. 예를 들어, 쇼핑몰에서 고객들의 나이나 어떤 물건을 샀는지 정보를 보고, 비슷한 물건을 사는 사람들끼리 그룹으로 묶을 수 있어요. 또는 동물 사진을 잔뜩 주고 "비슷한 애들끼리 모아봐!"하면, 컴퓨터는 (이름은 몰라도) 고양이처럼 생긴 애들끼리, 강아지처럼 생긴 애들끼리 구분해서 모아 놓을 수 있답니다.


3. 강화학습 (Reinforcement Learning)

직접 해보고 상 받으며 레벨 업! 게임 고수 스타일. 이건 마치 우리가 게임하면서 실력을 키우는 것과 아주 비슷해요! 컴퓨터(플레이어)가 어떤 행동을 직접 해봐요. 그 결과가 좋으면 "잘했어!"하고 칭찬(보상)을 받고, 결과가 나쁘면 "아쉽네!"하고 벌점(페널티)을 받아요. 이걸 계속 반복하면서 컴퓨터는 어떻게 해야 칭찬을 더 많이 받을 수 있는지, 즉 가장 좋은 결과를 얻는 방법을 스스로 배우는 거예요. 바둑 천재 '알파고'가 바로 이 방법으로 수없이 바둑을 두면서 이기는 수를 두면 칭찬, 지는 수를 두면 벌점을 받으며 실력을 키워 세계 최고가 되었어요. 스스로 운전하는 자동차가 안전하게 운전하면 보너스 점수를 받고, 위험하게 운전하면 감점을 받으면서 점점 운전을 잘하게 되는 것도 이 방식 덕분이죠.


진짜 사람처럼 생각하는 걸까? NO! 하지만 세상을 바꾸는 능력자!

인공지능이 지브리 화풍이 가진 패턴을 학습했다.

자, 그럼 이제 컴퓨터가 정말 사람처럼 '생각'한다고 말할 수 있을까요? 음... 아직 그건 아니에요! 지금의 머신러닝은 사람처럼 슬픔이나 기쁨 같은 감정을 느끼거나, "이게 옳은 일일까?"하고 철학적으로 고민하거나, 피카소처럼 완전히 새로운 그림을 창조해내지는 못해요.

그 대신, 머신러닝은 데이터 속에서 규칙이나 패턴을 찾아내는 걸 정말, 정말 잘하는 '패턴 찾기 챔피언'이라고 생각하면 좋아요. 엄청나게 많은 정보를 보고 그 안의 공통점이나 규칙을 사람보다 훨씬 빠르고 정확하게 찾아내는 거죠.

'생각'은 못 하더라도, 머신러닝이 우리 세상을 바꾸는 엄청난 능력자라는 건 확실해요! 우리가 매일 보는 유튜브나 넷플릭스에서 "네가 딱 좋아할 만한 영상이야!"하고 추천해주는 것도, 복잡한 도로에서 씽씽 달리는 자율주행 자동차도, 병원에서 의사 선생님이 병을 더 정확하게 찾아내도록 돕는 기술도, 게임 속 캐릭터들이 진짜 사람처럼 움직이는 것도, 심지어 농장에서 식물이 언제 물을 줘야 가장 잘 자라는지 알려주는 기술까지! 이 모든 게 머신러닝 덕분에 가능해지고 있어요.


머신러닝이 만든 그림이나 음악이 사람들에게 깊은 감동을 준다면, 그것은 기계가 '창의성'을 지녔다고 말할 수 있는 증거일까요? 아니면 단순히 수많은 데이터 조합의 정교한 결과물일 뿐일까요?
keyword
이전 03화인공지능의 역사