brunch

[너도아는] 머신러닝과 딥러닝

학습하는 기계

by 있잖아

현대 AI의 성과 대부분은 머신러닝(Machine Learning), 그리고 그 하위 분야인 딥러닝(Deep Learning)에서 비롯되었다. 이 둘은 규칙을 일일이 코딩하던 시대를 넘어, 데이터로부터 스스로 학습하는 기계라는 새로운 패러다임을 열었다.



# 머신러닝: 규칙 대신 학습

전통적 프로그래밍은 사람이 직접 알고리즘에 규칙을 입력해야 했다. 하지만 인간 사회와 자연 세계는 예외와 변수가 끝없이 많아, 규칙만으로는 설명할 수 없다. 머신러닝은 이러한 한계를 넘어 “데이터가 곧 규칙”이라는 관점에서 작동한다.

머신러닝은 크게 세 가지 학습 방식으로 나뉜다.


1) 지도학습 (Supervised Learning)

- 입력과 정답(라벨)을 함께 제공하여 패턴을 학습

* 회귀(Regression): 연속적인 값 예측(예: 주택 가격 예측)

* 분류(Classification): 범주 구분(예: 질병 진단, 스팸 메일 분류)

- 기업에서는 고객 이탈률 예측, 매출 추정, 이미지 분류 등에 활용


2) 비지도학습 (Unsupervised Learning)

- 정답 없이 데이터 자체의 구조를 학습

* 군집화(Clustering): 데이터 유사성 기반 그룹화(예: 고객 세분화)

* 연관 규칙 학습(Association): 항목 간 규칙 찾기(예: 장바구니 분석)

- 넷플릭스·스포티파이는 시청·청취 패턴을 비지도학습으로 파악해 추천 시스템을 고도화


3) 준지도 학습(Semi-supervised Learning)

- 일부 데이터에만 정답(Label)이 있고, 나머지는 비라벨 데이터 활용 분류(Classification)

군집화 (Clustering)

- 텍스트 분류, GPS 차선 인식 등에 활용


4) 강화학습 (Reinforcement Learning)

- 정답이 주어지지 않고, 시행착오와 보상을 최대화하는 전략을 통해 스스로 학습

* 분류(Classification)

* 제어/최적화(Control)

- 알파고가 바둑을 학습한 방식, 물류·재고 관리에서 최적 경로 탐색

- 최근에는 로보틱스, 광고 입찰 자동화, 게임 AI 등에서 광범위하게 쓰인다


즉, 머신러닝은 “규칙을 사람 대신 데이터가 써 내려가는 과정”이라 할 수 있다.



# 딥러닝: 신경망의 심층화

머신러닝 중에서도 딥러닝(Deep Learning)은 혁신의 엔진이었다. 인간 뇌의 뉴런을 모방한 인공신경망(ANN)을 여러 층으로 깊게 쌓아, 데이터 속 패턴을 다층적으로 인식한다.

2012년, 제프리 힌튼(Geoffrey Hinton) 연구팀의 알렉스넷(AlexNet)이 이미지넷 대회에서 오류율을 절반으로 줄이며 우승한 사건은 AI 연구의 분수령이었다.
GPU 연산, 클라우드 인프라, 빅데이터 축적이 결합하며, AI는 실험실 기술에서 산업 핵심으로 부상했다.



# 딥러닝 아키텍처

딥러닝의 위력을 만든 것은 아키텍처(구조)의 발전이다.


1) CNN (Convolutional Neural Networks)

- 이미지·영상 처리에 최적화

- 자율주행차의 보행자 감지, 의료 영상에서 종양 탐지


2) RNN (Recurrent Neural Networks)

- 순차적 데이터(텍스트, 음성)를 처리

- 기계번역, 음성인식의 초창기 주역


3) LSTM(Long Short term Memory)

- RNN이 가진 장기 의존성 문제 해결

- 셀 상태(Cell state)와 게이트(Gates) 구조를 도입해서 중요한 정보는 오래 기억.

불필요한 정보는 잊어버릴 수 있음

- 번역, 음성 인식, 시계열 데이터 예측


4) Transformer (트랜스포머)

- 2017년 구글 논문 “Attention Is All You Need”에서 제안

- 병렬처리와 어텐션 메커니즘으로 장기 문맥 이해 가능

- 챗GPT, Gemini, Claude 같은 초거대 언어모델(LLM)의 토대


이 아키텍처들은 단순히 성능 향상에 그치지 않고, 산업 패러다임 자체를 뒤바꿨다.



# 실제 활용: 산업 현장에서의 딥러닝

오늘날 딥러닝은 일상과 산업 전반에 깊숙이 들어와 있다.


- 의료: 영상진단 AI가 폐암을 조기 발견, 신약 후보 물질 탐색 속도 단축

- 자동차: 자율주행차의 객체 탐지, 충돌 예측

- 콘텐츠: 유튜브 추천, 넷플릭스 개인화 큐레이션, 틱톡의 초개인화 피드

- 언어·소통: 챗봇의 자연스러운 대화, 회의록 자동 요약

- 제조업: 센서 데이터를 활용한 예지보전(Predictive Maintenance)


즉, 딥러닝은 더 이상 ‘첨단 연구’가 아니라, 경제를 움직이는 보이지 않는 엔진이다.



# 한계와 규제

그러나 딥러닝은 설명 불가능성데이터 편향이라는 근본적 문제를 안고 있다.


- 아마존의 채용 AI가 여성 지원자에게 불리하게 작동한 사례

- 얼굴인식 시스템의 인종 차별적 오류 (NIST 연구 결과: 아시아·아프리카계 오인식률 높음)


이 때문에 2024년 이후, 유럽연합 AI Act를 비롯한 글로벌 규제는 설명가능한 AI(XAI), 윤리적 검증, 데이터 투명성을 의무화하고 있다.



# 미래 전망: 학습하는 기계의 진화

머신러닝과 딥러닝은 여전히 AI의 심장이다. 향후 연구는 단순히 더 많은 데이터와 연산을 사용하는 것을 넘어, 적은 데이터로도 강력히 학습하는 모델, 편향을 줄이고 설명 가능한 모델을 향해 나아가고 있다.

정리하면, 머신러닝과 딥러닝은 규칙을 넘어 학습하는 기계라는 패러다임을 열었고, CNN·RNN·Transformer 같은 아키텍처를 통해 AI를 연구실에서 산업·사회로 이끌었다.

이제 AI는 단순한 도구가 아니라, 데이터 시대의 새로운 지능 인프라로 자리 잡았다.

keyword
이전 02화[너도아는] 인공지능의 역사와 발전