학습여정
“제가 학습하고 있는 다양한 강의를 공유합니다. 함께 발전하길 바랄 뿐입니다.”
딥러닝과 신경망은 인공지능에서 자주 혼용되며, 머신러닝의 핵심 기술이다.
그러나 이 기술은 종종 과장된 기대와 신비주의에 둘러싸여 있다.
많은 사람들이 기술적 장벽과 심리적 거리감으로 인해 쉽게 접근하지 못한다.
신경망은 단순한 구조물이 아니라 데이터로부터 학습하고 문제 해결 능력을 갖춘 동적인 시스템이다.
신경망을 이해하려면 가장 작은 단위인 인공 뉴런부터 알아야 한다.
인공 뉴런 하나는 매우 단순한 원리로 작동한다.
예시로, 티셔츠의 가격에 따라 수요를 예측하는 모델을 사용한다.
가격이 오르면 수요는 줄고, 일정 가격 이상부터는 수요가 0으로 수렴한다.
이 관계를 나타내는 곡선(비선형)은 인공 뉴런 하나로도 계산 가능하다.
인공 뉴런은 입력(가격)을 받아 출력(예상 수요)를 계산하는 작은 구조이다.
뉴런은 단순 전달기가 아니라 입출력 관계를 학습하는 함수 근사기 역할을 한다.
단순한 직선뿐 아니라 비선형적인 현실 관계도 모델링 가능하다.
인공 뉴런 하나는 그 자체로 독립된 수학 모델이며, 이것이 신경망의 기본 벽돌이다.
인공 뉴런 하나는 단순한 입력-출력 관계를 모델링할 수 있다.
더 복잡한 문제 해결을 위해 여러 뉴런을 연결하여 신경망 구조를 만든다.
신경망은 뉴런들을 층(layer)으로 구성하며, 특히 은닉층이 중요한 역할을 한다.
예시로, 티셔츠 수요는 가격 외에도 배송비, 마케팅, 원단 등 여러 요인의 영향을 받는다.
이 다양한 입력을 처리하기 위해 은닉층에서는 중간 개념(경제성, 인지도, 인지된 품질)을 계산한다.
출력층은 이 중간 개념들을 종합해 최종 수요 예측을 수행한다.
신경망은 단순한 블랙박스가 아니라, 입력을 추상화 계층으로 처리하여 복잡한 문제를 이해 가능한 구조로 재해석한다.
이처럼 계층적으로 정보 처리하는 방식은 신경망이 '이해 기반의 지능'을 갖춘 시스템이 되게 만든다.
앞선 장에서는 신경망이 ‘경제성’ 등 중간 개념을 계산해 문제를 푼다고 설명했다.
하지만 인간이 직접 그 개념을 프로그래밍하지는 않는다는 점이 핵심이다.
신경망은 입력(A)과 출력(B)만 주어지면, 중간 과정(은닉층 계산)을 스스로 학습한다.
개발자의 역할은 ‘경제성을 계산하라’고 지시하는 것이 아니라,
(1) 데이터를 제공하고
(2) 신경망 구조를 설계하며
(3) 학습 알고리즘을 실행하는 것이다.
이 과정에서 신경망은 스스로 필요한 중간 특징(feature)을 창발적으로 형성한다.
‘경제성’, ‘인지도’ 같은 개념은 인간이 정의한 게 아니라, 신경망이 데이터를 통해 스스로 발견한 것이다.
이것은 기존 프로그래밍(규칙 기반 명시) 방식에서, 데이터 기반 학습 시스템으로의 패러다임 전환이다.
이제 인간은 규칙 설계자가 아니라 환경 설계자(Architect)와 데이터 교사(Teacher)의 역할을 맡는다.
이 자동화된 특징 학습 능력 덕분에, 인간이 명시적으로 설명하기 어려운 복잡한 문제까지도 신경망이 해결할 수 있다.
얼굴 인식처럼 수백만 개의 입력값을 가진 복잡한 문제도 신경망의 기본 원리로 해결 가능하다.
컴퓨터는 이미지를 픽셀 값 숫자 배열로 처리하며, 컬러 이미지 1000×1000 해상도라면 약 300만 개 입력값이 필요하다.
신경망은 이 수많은 입력을 받아 한 명의 신원을 출력하는 구조로 학습한다.
이처럼 많은 층과 뉴런이 필요한 복잡한 신경망을 딥러닝이라 한다.
딥러닝의 핵심은 층이 깊어질수록 더 복잡하고 추상적인 특징을 학습한다는 점이다.
학습 계층 구조는 다음과 같다:
→ 초기 계층: 선, 곡선 같은 엣지(edge) 탐지
→ 중간 계층: 엣지를 조합해 눈, 코, 입 등 얼굴 부위 인식
→ 깊은 계층: 얼굴 부위를 조합해 전체 얼굴 형태 인식
→ 출력 계층: 최종적으로 인물의 신원 판별
이 모든 특징 학습은 인간의 지시 없이 자동으로 학습된다.
결국, 층이 깊을수록 추상화 수준이 높아져, 신경망은 사람처럼 고차원적 인지를 하게 된다.
수요 예측과 얼굴 인식은 규모는 다르지만, “입력 A → 출력 B”라는 학습 원리는 동일하다.
표 1: 신경망 모델 비교 분석: 수요 예측 vs. 얼굴 인식
입력 데이터의 형태나 문제의 종류와 상관없이,
충분한 데이터와 적절한 구조만 주어진다면
신경망은 입력과 출력 사이의 복잡한 관계를 스스로 학습하여
놀라운 성능을 발휘하는 범용 학습 기계(universal learning machine)로 작동합니다.
인공 뉴런은 입력과 출력을 연결하는 작은 함수 근사기로 작동한다.
여러 뉴런이 레고 블록처럼 연결되어 복잡한 신경망을 형성한다.
은닉층은 ‘경제성’, ‘인지도’ 등 추상적 개념을 자율적으로 형성한다.
인간이 명시적 규칙을 코딩하지 않아도, 데이터만으로 내부 로직을 신경망이 스스로 학습한다.
이 학습 능력은 얼굴 인식처럼 수백만 개 입력이 필요한 문제까지도 확장 적용된다.
딥러닝은 픽셀 → 엣지 → 얼굴 부위 → 전체 얼굴 → 신원으로 이어지는 계층적 특징 학습을 수행한다.
핵심은 개별 계산 단위가 아닌, 단순한 뉴런들의 집단적 상호작용과 자동화된 학습 구조이다.
딥러닝의 원리는 신비가 아니라, 명확한 개념적 이해로 설명 가능한 기술적 구조임이 드러났다.
이것은 인공지능 시대의 이해와 활용을 위한 새로운 출발점이 된다.
딥러닝은 복잡한 코딩 없이, 단순한 뉴런들이 데이터로부터 스스로 학습해 문제를 해결하는 집단적 지능 시스템이다.
※본 요약은 ‘공정 이용(fair use)’사용 목적으로, 모든 내용은 Stanford University 의 Coursera강의 ‘모두를 위한 AI’를 수강하며 작성한 요약이며, 직접적인 강의 내용 복사, 슬라이드 캡쳐등은 저작권에 의하여 엄격히 보호됩니다. - 앤드류 응(Andrew Ng)의 강의 by Coursera Plus - "Learning Notes and Summaries by Digitalian”출처: https://digitalian.tistory.com/12 [디지털리안 (Digitalian):티스토리]