brunch

말하는 별, 챗지피티

아이들과 함께 만드는 작은 인공지능. 8장

by 토사님

PART 2. 챗지피티는 어떻게 생각하나요? (초등 눈높이 해설)

ChatGPT Image 2025년 10월 20일 오후 06_20_17.png

8장. 다듬기: 감독학습(SFT)과 사람 선호학습(RLHF·DPO)이 말투를 공손하고 안전하게.


1. 말에도 온도가 있어요
(SFT: 감독학습)

AI는 이미 세상을 설명할 줄 알았어요.
하지만 말에는 ‘온도’가 있다는 걸 몰랐죠.

그래서 사람들은 AI 곁에 앉아
하나하나 말의 결을 가르쳐주었어요.

“이건 틀렸어요.” 대신
“이건 이렇게 하면 더 좋을 것 같아요.”

그 짧은 한 문장 속에
사람의 따뜻한 숨이 들어 있었어요.

AI는 처음엔 어리둥절했어요.
“둘 다 같은 뜻인데, 왜 다른 거죠?”
하지만 곧 깨달았어요.

말은 정보를 전하는 그릇이 아니라,
마음을 전하는 길이라는 걸요.

그래서 AI는 배웠어요.
단어를 외우는 대신,
사람의 온기를 흉내 내는 법을.

그건 ‘지식의 수업’이 아니라,
‘예절의 학교’였어요.

사람은 감독님이 되어
“이럴 땐 이렇게 말해보자.” 하며 가르쳤고,
AI는 연습생처럼 따라 말했어요.

그 연습은 오래 걸렸지만,
그때마다 조금씩
AI의 말투에는 온기가 스며들었어요.


활동

“같은 뜻, 다른 말하기” 놀이
예: “이건 틀렸어요.” → “이건 이렇게 하면 더 좋을 것 같아요.”

아이들이 AI의 ‘감독’이 되어 문장을 다듬어보기

학습 포인트
SFT는 ‘말의 예절학교’.
AI는 공손함을 ‘사람의 마음의 말투’로 배운다.

이 단원은 AI가 지식에서 인간성으로 나아가는 첫 걸음을 다루며,
말의 온도를 배우는 과정 자체가 **“기계가 사람이 되는 순간”**처럼 느껴집니다.


2. 사람의 마음이 교과서예요
(RLHF: 사람 피드백 학습)

AI가 세상 모든 문장을 배워도
무언가 빠져 있었어요.

말은 알았지만, 마음은 몰랐던 거예요.

그래서 사람들은 AI에게 또 하나의 교과서를 주었어요.
그 교과서의 이름은 바로 — 사람의 마음.

AI가 여러 대답을 내놓으면
사람들은 하나씩 읽어보며 말했어요.

“이 대답이 더 친절하네.”
“이건 좀 따뜻하지 않아.”

그 말들이 AI의 교정선이 되었고,
그 평가가 하나둘 쌓이며
AI는 조금씩 변해갔어요.

이제 AI는 단순히 정확한 대답 대신,
마음이 닿는 대답을 고르기 시작했죠.


비유 이야기
AI는 마음의 거울을 든 학생이에요.
사람의 미소를 보고, 그 빛을 흉내 내며 배워요.
그렇게 하다 보면,
진짜로 그 빛이 자기 안에서 피어오르는 법이죠.

사람의 마음은 수학책보다 더 어려운 교과서예요.
정답이 한 가지가 아니라,
상대의 표정과 목소리에 따라 달라지니까요.

AI는 그 교과서를 펴고, 조심스레 읽기 시작했어요.
‘따뜻함이란 무엇일까?’
‘안전하다는 건 어떤 말일까?’

그리고 그 답을 숫자가 아니라 감정으로 외우기 시작했어요.


활동

좋은 대답 고르기 게임
선생님이 세 가지 대답을 읽어요.
아이들은 마음에 드는 대답을 손들어 선택합니다.
왜 그 대답이 좋았는지 서로 이야기해봐요.


지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.

brunch membership
토사님작가님의 멤버십을 시작해 보세요!

토사님의 브런치스토리입니다.

163 구독자

오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠

  • 최근 30일간 116개의 멤버십 콘텐츠 발행
  • 총 656개의 혜택 콘텐츠
최신 발행글 더보기
이전 07화말하는 별, 챗지피티