brunch

You can make anything
by writing

C.S.Lewis

by 안녕 사이시옷 Mar 03. 2023

9분 만에 '무조건' 이해하는 챗GPT의 모든 것

챗AI봇 제작·기획 젠틀파이 / 박정남 대표


※본 콘텐츠는 팟빵 메인 추천, 경제이슈 콘텐츠에서 추천되었습니다.


※ 이 인터뷰는 챗GPT로 문의한 인터뷰 질문으로 구성되었습니다.



챗GPT의 원리

챗 GPT는 GPT부터 생각하면 좋을 것 같은데요. GPT라는 게 '생성 AI'예요.

뭔가를 만드는 인공지능이죠. 언어를 배워서 언어와 관련된 아웃풋들을 내는 인공지능이거든요.

GPT 중에서 GPT 3.5를 기반으로 만든 게 챗 GPT인데, 챗 GPT는 상호 작용하면서 대화하는 거에 조금 더 초점이 맞춰져 있어요. 내가 뭘 물어보면 잘 대답해 주는 인공지능모델이라고 생각할 수 있죠.

아주 쉽게 생각하면 네이버에 '서울에서 강릉까지'라고 치면 다음 단어들을 예측해서 보여주잖아요.

그런 기술하고 동일한 데 그것보다 더 많은 데이터와 더 많은 함수 매개변수를 가지고서 더 정확하게 예측하게 된 거예요.

예를 들면 '부정어'같은 거예요 [결코] 다음에는 "~하지 않는다" 는게 나오기 쉽겠죠. 이런 게 우리가 만든 데이터 문서나 리포트, 여러분이 게시판에 쓴 글 이런 것들 에서는 그런 흐름이 되게 자연스럽단 말이죠. 이런 것들을 이제 챗 GPT가 학습을 하고 그거에 맞춰서 확률적으로 가장 높은 단어를 그 다음 단어로 나오게 하는 원리입니다 




챗GPT가 문맥을 이해하는 과정

예전에는 데이터라는 게 너무 적었어요. 지금 이번에 챗 GPT 같은 경우는

175,000,000,000 개. 엄청나게 많은 매개 변수라고 하는데 함수라고 생각하면 좋아요.

예를 들면 1차 함수, 2차 함수, 3차 함수 배우셨을 텐데 이건 175,000,000,000 차 함수죠.

굉장히 복잡한 식으로 만들어서 확률을 계산해 내고, 확률적으로 가장 높은 것을 보여주는 그런 원리라고 생각하시면 되겠습니다.


이런 변수는 사실 다 외운 거예요. 다 외우니까, 이해한 것처럼 보이는 거죠.

어떤 문장이나 이런 것들을 다 외우다 보니 그다음에 나올 단어나 문장들을 자연스럽게 내뱉게 되는 건데요.

문맥을 이해한다는 것도 되게 재밌는 건데, 문맥을 이해한다는 것은


"삼다수 얼마야?"라고 하면 "얼마예요"라고 하겠죠.

다음 질문으로 "그거 어디서 팔아?" 했을 때

그거를 [삼다수]라고 이해하는 게 문맥을 이해하는 거거든요



챗 GPT는 그 문맥을 어떻게 이해하냐면 제가 이전에 했던 대화를 질문할 때 같이 던지는 거예요.

앞에 있는 질문과 답변을 같이 포함해서 물어보기 때문에 '얘가 문맥을 이해하는 것 같구나' 이렇게 생각하는 거거든요. 그 대신 지금 챗 GPT 같은 경우는 특정한 길이의 단어 아니면 문장정도만 같이 질문으로 넣을 수 있어요. 거대한 양의 데이터를 같이 들면서 같이 질문한다거나 그런 건 아직 안 돼요.





챗GPT가 잘 하는 것

챗 GPT 같은 애들이 잘하는 게 '어떤 스타일로 글을 써줘' 이런 것들이에요.

유행가 가사를 만들 건데 "셰익스피어가 쓴 것처럼 써줘", "어떤 스타일로 글을 써줘"라고 하는 글에 특화된 것이기 때문에 그런 쪽으로 사용하기 쉬워요.


저희 회사에 서비스가 있는데, 챗봇에 대한 데이터 분석서비스예요.

사람이 내용을 생성해 내는 데 한계가 있고 거기에 대한 인사이트도 생각보다 되게 한정적이었어요.

"얘를 가지고 한번 테스트해보자" 그래서 테스트를 해봤더니 저희가 생각했던 것보다 너무 잘 쓰고

"길이 좀, 길게 해 줘" 그러니까 또 길게 써주고, 그래서 이거 진짜 요물이다


번역도 잘해요. 특히 영어로 하는 걸 더 잘하고 영어를 한국어로 하는 건 조금 어려운 것 같아요.

찾아봤더니 (현재기준) 챗 GPT에는 한국어가 한 1.5% 밖에 없대요. 그래서 한국어를 표현하고, 이해하는 것은 영어에 비해서는 조금 부족하다. 말 안 되는 영어지만 영어로 물어보면 훨씬 더 풍부하게 정보를 알려주는 것 같습니다.





다른 어플리케이션과의 연동 가능성

Open Ai는 마이크로소프트가 투자해서 만든 회사이기 때문에 마이크로소프트의 서비스와 결합하는 건 아주 쉬울 거예요. 구글에서도 구글과 관련된 프로덕트의 생성 AI인 바드를 결합시킨다거나 하는 일은 굉장히 쉽다고 생각이 돼요. 그런 회사들은 (기술적) 인프라 이런 것들이 지금 다 이미 이루어져 있잖아요.



다만, 그냥 일반적인 회사들은 일단 그런 시스템이나 컴퓨팅 시스템 자체가 되어 있지 않고 어느정도의 비용이 들지 아직 모두 예측하지 못하고 있거든요. 그리고 기업입장에서 내가 MS나 구글에 중요데이터를 주고 싶지는 않을 거잖아요. 그런 부분에서 여전히 어떤 경계들이 있을 것 같아요.


그게 언제가 될지 모르겠지만 GPT가 4, 5 나오고 그런 보완적인 문제가 해결이 되면 그때는 결합을 해서 쓸 수 있겠죠.




챗GPT의 단점

예전에 MS에서 낸 테이(Tay)라는 봇이 있었어요. 인종 차별적인 그런 발언을 하기도 하고 최근 이루다 같은 경우도 편향적인 말을 했었잖아요. 근데 이런 부분이 사실 생성 모델에서는 늘 되게 어려운 주제였어요.

그걸 이번에 Open Ai에서 어떻게 보면 그걸 해낸 거예요.

기본적으로 학습도 하지만 인간이 계속 지도를 해준 거예요. 사람이 "이건 좋아", "나빠", 1~5점까지 점수를 내. 높은 점수를 받은 거를 얘한테 계속 학습시키는 거예요. 챗 GPT는 기본적으로는 누군가를 되게 기분 나쁘게 하거나 그렇게는 대답하지 않게 만들어진 학습을 받은 아이인 거예요. 그래서 얘한테 뭔가를 물어봤을 때

아주 극단적인 대답을 하지 않죠. '예의 바른 청년'이랄지. 그런 사람처럼 대답을 한단 말이죠.

그래서 오히려 좋은 사람처럼 인공지능이지만 되게 훌륭한 성품을 가진 어떤 인격체로서 우리가 대할 수 있게 된 것 같아요.




챗GPT는 창의적인가?

'창의'라고 하는건 기본적으로 자기가 뭔가를 알고 그것에서 파생되는 무엇이라고 생각하거든요.

아까 얘기했던 것처럼 '셰익스피어처럼 가사를 써라', '플라톤이 쓴 것처럼 랩을 써봐라' 이런 것들은 이미 그 텍스트 나 톤 앤 매너가 다 있잖아요. 그거를 따라서 하는 것은 사실 굉장히 쉬운 일이라고 생각해요.



근데 "그걸 넘어서는 무엇을 할 수 있느냐?"

창의력 부분에서는 아직 인간이 기존에 낸 거에서 더 넘어서는 것을 내지는 못한다라고 생각하고 있거든요.

내가 어떤 가이드를 줬을 때 부합하는 내용 정도가 나오는거죠.


또, 확률적으로 옳은 걸 하다 보니까, 우리의 기대에서 아주 넘어서는 것들을 선택하지 않는 거예요.

우리가 선택하는 단어나 그 맥락에서 쓰는 거에서 확률적으로 안전한 대답이잖아요. 그렇기 때문에 창의적인 대답이라는건 아직 없다는 거죠. 창조를 하기에는 아직은 어렵다고 생각해요. 지금은 지식을 많이 갖고 있고

사람과 대화할 수 있을 정도로 얘기를 할 수 있다. 그리고 앞으로도 한참 동안은 그렇겠죠. 


하지만 정말 특이점이 와서 우리를 넘어서는 그런 창의력을 가진 그런 AI가 분명히 나타나겠죠. 그때는 정말 크리에이터가 나타날 수 있겠지만 지금은 여전히 우리를 도와주는 집사, 혹은 인턴이라고 생각하고 있어요.





챗GPT와 한국의 챗봇

하루에 서버 비용이 몇 십억씩 든다는 얘기를 하더라고요. 그런 식으로 돌릴 수 있는 그런 언어 모델은

소비자가 만난 건 처음이라고 생각하거든요. 그래서 챗 GPT가 나오니까 경쟁사에서 다른AI가 나오는것처럼

차원이 다르기 때문에 이렇게 많은 사람들이 열광하는 것이죠.



다만, 저는 심심이나 이루다에 대해서는 같이 얘기하고 싶은 게 있어요.

그 모델들은 일반적인 지식에 대해서 답변하라고 만든 애들이 아니에요. 걔는 엔터테이닝하게 만든 애들이에요. 그 가치를 별도로 봐야해요. 


예를 들면 챗 GPT는 학교친구, 학문적으로 얘기할 수 있는 사람이라면 

심심이나 이루다는 같이 노는 얘잖아요. 어떻게 보면 연예인이라고도 할 수도 있고

잘할 수 있는 영역이 다르고 학습된 말도 다르거든요.


그래서 그 영역은 다르다고 생각하지만 그런 생각을 하는 거죠. 지금 챗 GPT처럼 다 답변할 수 있는 얘한테 퍼스널리티를 줘서 더 재밌는 아이가 됐어. 그러면 많이 알면서 재밌는 아이가 될 수도 있겠죠.




챗GPT(AI)가 심리를 이해할까?

영화 Her(한국개봉명 '그녀')을 보면 주인공남자 테오가 사만다라는 AI 보수하고 사랑에 빠지게 돼요.

나에 대해서 모든 걸 알고, 내가 좋아하는 걸 알고, 내가 좋아하는 얘기를 해주고. 그래서 사랑에 빠지게 되는데 이번에 이제 챗 GPT를 보니까, '이렇게 하면 사람이 좋아해' 이런 걸 계속 이렇게 지도 학습을 했단 말이에요. 당연히 사랑할 수 있을 것 같아요. 너무 먼 얘기이기도 하지만 실제로 로봇의 형체가 있을 수도 있잖아요.



한참 우스개로 한 얘기인데 요즘 출산율도 낮잖아요. 제가 보기에는 AI 때문에 더 연애도 안 하고, 더 아이도 안 낳을 수 있지 않을까? 그런 생각도 해보게 되는데요. 그게 큰 비즈니스가 되지 않을까요?


생성 AI는 다양한 회사에서 계속 만들고 있잖아요. 언어생성 모델도 만들고, 하드웨어도 만들고 해서

돌(doll)이든지, 로봇이든지 당연히 만들 수 있을 것 같아요.





챗GPT의 한계

현재 한계점은 학습한 게 한계가 있다는 거예요.

"신사임당은 누구냐?" 하니까, "신라의 왕이다" 이렇게 얘기했다고도 하는데 학습한 데이터 양이 아주 충분하지는 않은 거죠. (현재까지는) 2021년까지 밖에 안 돼 있으니까, 시간적으로도 떨어져 있죠. 그렇기 때문에 현재의 데이터에 대해서 물어볼 수도 없고, 현재의 실시간 정보들과 연동되어 있지 않아요.



이건 제가 얘기한 게 아니라 테드 창이라는 소설가가 얘기를 한 건데 엄청나게 큰 데이터를 우리가 지금 학습시킨 거잖아요. 그래서 어쩔 수 없이 이 데이터를 어느 부분은 소실시켜요. 얘는 파편화된 데이터를 갖고 있어요. 예를 들면 JPEG로 내가 한번 줄였단 말이에요. 이걸 다시 큰 파일로 넓혔을 때는 그 데이터가 왜곡돼 있을 수 있어요. 우리가 좀 더 깊이 파고 들어갈 때 이게 진짜인지 아닌지 확신하기가 어려워요.


얘는 생성 모델이기 때문에 어떤 거를 인용하는 게 아니라, 그냥 만들어낸단 말이에요. 그래서 이 말의 출처를 우리가 알 수가 없어요. 얘가 막 뭐 "신사임당의 남편은 이순신"이고 이렇게 얘기해도 네 살짜리 아이가 물어봤어, 근데 그렇게 얘기하면 "그렇구나" 이렇게 생각할 수 있겠죠.

출처를 알 수 없기 때문에 이 정보가 정확한지 아닌지 확인하는 몫은 여전히 인간의 몫인 거예요.


이게 맞는지 안 맞는지에 대해서 늘 의심할 수밖에 없는 거죠





챗GPT와 창작활동?

저도 '달리' 나 이런 '스테이블 디퓨전'(AI로 그림제작)의 아웃풋들을 봤을 때 멋지다고 생각하는데, '레퍼런스'로는 쓸 수 있을 것 같아요. 

"우주에 있는 토끼에 대해서 그림을 그리고 싶어" 자기 머리에 뭔가가 없을 수 있잖아요. AI 한테 그려보게 해서 그림이 나왔어요. 그렇지만 사실 그게 완성본은 아닐 테고, 거기에 조금 더 수정을 해서 완성이 됐어.

그럼 사실 저는 그것도 이 사람이 작품이라고 생각하거든요. 



[달해서 토끼가 있는데 헤엄치고 있는 걸 그려줘] 그 생각자체는 인간의 생각이지 AI의 생각은 아니잖아요.

세밀한 디테일은 그 작가가 개입하는 부분이거든요. 예전에는 그림을 그렸을 때, 사진을 찍거나, 진짜 그리거나, 포토샵 작업을 했다면 이제는 그냥 말로 오더를 내리고 그거에서 말로 수정을 하는 거죠.


얘가 뭔가를 크리에이트 했다기보다는 내가 크리에이트 한 것, 생각한 걸 시각적으로 더 빨리, 더 쉽게 구현하게 해 줄 수 있다. 그런 '툴'로 보는 것이 지금은 적당하지 않은가라고 생각이 들어요.





AI로 인한 특이점은 올까?

당연히 올 것 같은데, 지금 그 변곡점을 딱 지나고 있다고 보여져요.

그 전하고는 정말 다르거든요. 대화가 되잖아요. 이상하게 이해하지 않아요.

답을 잘못 낼지언정 이상하게 이해하는 건 아니에요.



많은 분들이 그렇게 얘기를 해요. 99%의 완성도와 100% 완성도는 천지차이다. 그런 면에서는 아직 천지차이로 남아있다고 생각하지만 그럼에도 거의 다 온 것 같아요, 제 생각에는


네이버 검색 이 있다고 해서 어떤 사이트의 검색이 없는 건 아니에요. 범용적인 검색이나 대화를 할 수 있는 챗봇이 필요하다고 하면 각 기업의 필요한 것들은 그 분야에 특정한 지식을 더 많이 가르치고, 거기에 더 맞게 파인튜닝을 해야 돼요.


기술과 관련된 것은 정말 돈이 많은 회사에서 많이 해결할 거예요.

그걸 가지고 정말 사람이 쓸만한 프로그램, 이런 걸 만드는 것은 여전히 우리처럼 그런 작은 기업들이 해야 될 분야라고 생각하거든요.



기분이 좋아요.

제가 지금껏 만들었던 챗봇들은 분류 AI라는 걸 썼어요. 생성 AI랑 다른 인공지능기술을 쓴 거죠.

이런 것들을 생성 AI가 붙음으로 인해서 사람들이 더 편하게 쓸 수 있고, 자신 있게 내놓을 수 있을 만한 무엇인가를 만들어낸다고 하면 전 더 좋다고 생각이 들어요.


제가 지금 생각하는 것은 "얘를 어떻게 하면 정말 잘 써먹을 수 있을까?" 그런 것에 대한 고민이고요,

그걸 잘 써먹어서 훌륭한 회사가 되겠습니다



                    



https://brunch.co.kr/@gentlepie#articles


https://www.youtube.com/watch?v=Al4s32S7DHE&t=2s


https://www.youtube.com/watch?v=-iK7OhQyW4s&t=3s

매거진의 이전글 '재벌집 막내아들'로 보는 4가지 성격장애
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari