brunch

말하는 별, 챗지피티

아이들과 함께 만드는 작은 인공지능. 4장.사람의 마음을 배우다.

by 토사님

PART 1. 이야기로 여는 인공지능

4장.사람의 마음을 배우다: 인스트럭트GPT와 RLHF(사람 피드백으로 가르치기).

ChatGPT Image 2025년 9월 15일 오후 03_38_08.png

소단원 1. 마음으로 가르치는 선생님

이야기로 열기

하루는 로봇 친구 하나가 있었어요.
이 로봇은 세상 모든 책을 읽었지만,
어떨 땐 너무 무뚝뚝했고,
어떨 땐 틀린 말도 자신 있게 했지요.

사람들은 생각했어요.
“이 로봇에게 책만 주는 게 아니라,
마음으로도 가르칠 수 없을까?”

그래서 새로운 실험이 시작되었습니다.
사람들은 로봇이 한 대답을 보고,
“이 대답이 더 좋아.”
“이건 좀 다듬어야 해.”
하고 하나하나 알려주기 시작했어요.


비유로 풀기

이건 마치 아이가 글씨를 쓸 때,
선생님이 옆에서 손을 잡고
“여기 조금 더 둥글게, 여기 조금 더 길게”
하고 직접 고쳐주는 것과 같았어요.

그 순간, 로봇은 책 속 지식만으로는
배울 수 없었던 따뜻한 사람의 마음을 배우기 시작했답니다.


활동: 좋은 말 찾아주기

선생님이 같은 질문에 대한 두 개의 대답을 칠판에 씁니다. 하나는 너무 짧고 차가운 말 하나는 따뜻하고 친절한 말

아이들이 손을 들어 “더 좋은 대답”에 투표합니다.

선생님이 말합니다. “바로 이런 식으로 과학자들이 로봇에게 가르쳤단다.”


배움의 씨앗

로봇은 책만 읽어서 똑똑해진 게 아니었어요.
사람들이 마음을 다해 가르쳤기 때문에,
더 따뜻하고 믿을 만한 친구가 될 수 있었던 거예요.

그리고 우리도 마찬가지예요.
누군가 우리에게 “이렇게 하면 더 좋을 것 같아”라고 말해주면,
우리는 조금 더 성장한 사람이 되지요.


소단원 2. 좋은 대답 고르기 게임

이야기로 열기

어느 날 과학자들은 로봇이 만든 대답 여러 개를 한 줄로 세웠어요.
그리고 사람들에게 말했죠.
“자, 이제 어떤 대답이 제일 좋은지 골라 주세요!”

사람들은 별점을 매기고,
좋은 대답에는 큰 별,
애매한 대답에는 작은 별,
엉뚱한 대답에는 별을 주지 않았어요.

로봇은 그 별들을 보며 배웠어요.
“아, 사람들은 이런 대답을 좋아하는구나!”


비유로 풀기

이건 마치 노래 경연 대회 같았어요.
심사위원이 여러 노래를 듣고 점수를 매기면
가장 멋진 노래가 1등을 하잖아요?

로봇은 ‘좋은 대답’을 고르는 게임을 통해
점점 더 사람이 좋아하는 방식으로 말할 줄 알게 된 거예요.


활동: 별점 붙이기 놀이

선생님이 칠판에 같은 질문의 다른 대답 3개를 써 줍니다. 예: “네 이름이 뭐야?” 대답 A: “이름.” 대답 B: “나는 챗지피티야.” 대답 C: “나는 챗지피티야. 만나서 반가워!”

아이들이 스티커나 손으로 ‘좋아요!’ 표시를 하며 가장 마음에 드는 대답에 투표합니다.

가장 많은 표를 받은 대답을 확인하고 이야기 나눕니다. “왜 이 대답이 더 좋을까?” “친절해서? 자세해서?”

지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.

brunch membership
토사님작가님의 멤버십을 시작해 보세요!

토사님의 브런치스토리입니다.

163 구독자

오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠

  • 최근 30일간 113개의 멤버십 콘텐츠 발행
  • 총 665개의 혜택 콘텐츠
최신 발행글 더보기
이전 03화말하는 별, 챗지피티