brunch

"생성형"을 이해하기 위한 AI 최상위 패턴 정리

AI 인사이트 나누기 -> 의사결정 FlowChart

by HJH

"생성형"이라는 키워드가 여전히 뜨겁다. 개발하는 부서 간, 개인 간의 원활한 대화를 위해 정리해 본다.

정규 분포가 만들어진 역사를 보고, AI는 미세 조정까지 반영해 구조(아키텍처) vs 생성 패러다임을 명확히 분리한 GNN·Transformer(음성)·생성모델(오디오) 보강, 명칭 통일(Evoformer, RFdiffusion)을 다룬다.

정규 분포 만드는데 190여 년이 소요되었다고 한다.

정규 분포 같은 문제 해결 모형이 CNN, RNN, Transformer 등(하위에 총정리)이고, 생성형은 이런 패턴이 아니라 목적(이미지, 음성, 글,...)을 이루는 만들어 내는 방식이다. 즉, 생성형에 CNN, RNN, Transformer 등의 도구를 끼워 넣어 목적을 달성하는 것이다. 대표적인 "생성형"은 다음과 같다.


Autoregressive(AR)

글자를 한 글자씩 이어 쓰듯 순서대로 생성

GPT(글), PixelRNN(이미지), WaveNet(소리)


VAE

데이터를 요약본(잠재벡터)으로 압축했다 다시 복원

특징 뽑아 저장했다가 비슷하게 재구성


GAN

그리는 사람 vs 감별하는 사람이 경쟁하며 발전

선명한 이미지, 다만 훈련이 까다롭기도


Diffusion

사진에 노이즈를 넣었다가 다시 걷어 원본을 복원하듯 생성

요즘 이미지 생성의 대표 주자


Flow/Flow-Matching

되돌릴 수 있는 변환을 배워 정확한 확률도 계산

깔끔한 수학, 구현은 다소 섬세


EBM

“좋은 데이터일수록 에너지를 낮게” 만들게 학습

유연하지만 학습/샘플링이 어려울 수 있음


모든 상황별 실험을 해봐야 알겠지만, 비용 문제도 고려해야 하기에 당장은 정답이 없다. 다만 러프하게 의사결정 플로우를 보면,


지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.

brunch membership
HJH작가님의 멤버십을 시작해 보세요!

AISS(AI Security Sector) K-programmer. 아이쓰 프로그래머 분야를 한국에서 만들고 개척한 사람으로 기억되고 싶습니다.

434 구독자

오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠

  • 총 41개의 혜택 콘텐츠
최신 발행글 더보기