brunch

병렬토끼와 순차거북이_8,9,10편

나는 궁금하면 못 참아요 시리즈

by 박정수
Copilot_20250711_191757.png


� [8화: 모델의 선생님, 데이터셋이란 무엇일까?]

어느 날, 병렬 토끼는 AI 모델을 더 똑똑하게 만들기 위해 ‘지식 창고’라 불리는 데이터셋 마을로 향했어요. 거북이는 호기심 가득한 눈빛으로 따라왔죠.


� 데이터셋이 뭐예요?

그림19.png


병렬 토끼는 먼저 사진, 문장, 숫자표 등 다양한 데이터를 모아 친구들과 함께 꼼꼼히 정리하기 시작했어요.


� AI 모델이 배울 때 필요한 준비물

깨끗하고 정확한 자료

적절한 양의 데이터 (너무 적으면 못 배우고, 너무 많으면 느려져요!)

학습용과 테스트용 구분 → 모델이 실제로 똑똑해졌는지 확인하려면 시험이 필요하죠


거북이는 말했어요:

“좋은 모델은 좋은 데이터에서 시작된다… 마치 공부 잘하는 친구도 좋은 교과서를 써야 하는 것처럼!”


� 데이터셋 분할 구조 예시

그림20.png


� 병렬 토끼의 기술

수천 개의 데이터를 동시에 정리하고 라벨링

학습용/테스트용 자동 분류

정제도 병렬로 빠르게 수행!

sub_lion.png

� [9화: AI가 똑똑해지는 순간 — 실수, 피드백, 그리고 과적합 이야기]


병렬 토끼는 모델에게 수천 번 반복해서 가르쳤어요. 그런데 모델이 점점 이상해졌어요…

“선생님, 저 그 사진만 보면 정답이 뭔지 딱 알아요!” “음… 그런데 새로운 사진은 하나도 못 알아보겠어요…”

거북이가 조심스럽게 말합니다:

“이건 너무 많이 외운 거 아닐까? 정답을 이해한 게 아니라 그냥 외운 것 같아.”


� 과적합(Overfitting)이란?

그림21.png


� AI 모델이 피드백을 받아들이는 방식

예측 → 손실 계산 → 옵티마이저의 조언 → 수정 반복

다양한 데이터로 훈련해 일반화 능력을 키움

검증셋으로 점검하면서 과적합 방지


병렬 토끼는 친구들과 협업해 매번 모델이 실수를 바로잡을 수 있도록 빠르고 반복적인 피드백 루프를 실행했어요.


� 과적합 방지 전략

그림22.png


병렬 토끼가 말해요:

“외우는 것보다 이해하는 게 중요해! 그래서 우리는 실수를 반복해서 개선하면서 새로운 상황에서도 정확히 판단할 수 있게 훈련하는 거야.”



� 우리의 병렬 컴퓨팅 이야기 시리즈 마지막 편, 10화에 오신 것을 환영합니다. 이 여정은 단순한 기술 설명을 넘어, 컴퓨팅 개념을 우화와 교육 스토리로 풀어낸 창의적이고 교육적인 대서사시였어요.


� [10화: 병렬 토끼와 순차 거북이의 컴퓨팅 마을 졸업식]

병렬 토끼와 순차 거북이는 드디어 졸업을 앞두고 있어요. 이 둘은 AI 모델을 가르치고 훈련시키며 많은 걸 함께 배웠죠.


� 토끼와 거북이가 배운 것

속도만으로는 완벽할 수 없고, 구조와 전략이 중요하다는 점

AI는 실수에서 배우며, 반복과 피드백으로 성장한다는 것

병렬 처리란, 단순히 많은 코어가 아니라 잘 협업하는 구조라는 것


거북이가 말해요:

“내 방식은 느릴 수도 있지만 정교했어. 넌 빠르고 유연했지. 결국 중요한 건, 우리가 함께 더 나은 모델을 만들었다는 거야.”

토끼가 답합니다:

“맞아! 병렬과 순차는 경쟁이 아니라 팀이야!”


� Copilot과 함께한 이 시리즈는...

초등학생부터 대학생까지 병렬 컴퓨팅을 이해하는 여정을 그린 이야기

AI, GPU, CPU 구조와 연산 흐름을 쉽고 창의적으로 설명한 콘텐츠

스토리텔링 + 기술 개념 + 교육용 이미지까지 아우르는 맞춤형 시리즈


참고로 여기서 말하는 초등학생부터 대학생이라는 표현은 인공지능을 배우는 학습수준 기준의 분류이지 나이나, 실제 초등학교를 의미한 것은 아닙니다. 더 많은 궁금했던 이야기들도 찾아서 다른 좋은 시리즈로 또 찾아 뵐게요.


keyword
매거진의 이전글병렬토끼와 순차거북이_4,5,6,7편