brunch

You can make anything
by writing

C.S.Lewis

우리 생활 속으로 들어오는 AI 기술

ChatGPT, DALL E, MidJourney 사용기




최근 연일 뉴스와 여러 IT 관련 미디어에 빠지지 않고 등장하는 이름이 있다. 바로, 대화형 인공지능 Chat GPT다. 최근 MS의 투자 소식이 전해지면서 점점 더 많은 사람이 해당 기술에 대해 알게 되었고, 직접 경험해보고 놀란 자신들의 경험을 공유하면서 빠르게 명성을 얻고 있다. 이러한 관심은 더 다양한 AI 기술들로 이어지고 있으며, 많은 사람이 다양한 인공지능을 시험해보고 벌써 상업적인 용도를 개발해나가고 있다.


이제는 심지어 유명 유튜버의 컨텐츠에 까지 '침'투했다


이러한 기술을 접한 사용자들의 반응은 대부분 놀랍다는 평가다. 인간이 많은 시간을 투자하며 만들어내는 글이나 이미지들을 단순한 명령어 입력과 엔터키 한 번으로 만들어 낼 수 있다는 현실에 많은 이들이 빠르게 발전하는 기술에 감탄하며, 이를 활용할 수 있는 방안에 대하여 많은 아이디어를 내고 있다.


우려의 목소리도 있다. ‘과연 인공지능이 쓴 글이나 그림이 문학 또는 예술 작품으로 인정받을 수 있는가?’ ‘기술의 발전이 단순노동을 대체하게 될 것이란 건 이미 예상했지만, 최근의 인공지능 기술의 발전으로 봐서는 창의력을 요하는 직업 직업들도 없어지는 것 아닌가?’ 이와 같은 걱정을 시대에 뒤떨어진 발상이라고 비판하는 사람들도 있지만, 필자는 오늘만이 아니라 내일도 밥 벌어 먹고살아야 하는 우리는 꼭 한 번씩 던져봐야 하는 질문들이라고 생각한다.


다만, 막연한 우려와 걱정을 할 것이 아니라, 이 기술에 대해 알아보고, 이해하고자 노력하며 앞으로 변해나갈 미래에 대하여 객관적으로 예상해보아야 한다. 이를 위해, 위에 소개한 ChatGPT를 포함하여 최근 주목 받는 텍스트 또는 이미지 기반의 인공지능 기술들에 대해 소개하고, 앞으로의 미래를 상상하고자 한다.





**대화형 인공지능  : ChatGPT**


첫 번째로 소개할 서비스는 위에서도 이야기한 최근 화제의 중심인 ChatGPT**다. 간단한 회원가입만 하면 누구나 사용할 수 있는 이 서비스는 <자연어 처리 기반 대화형 인공지능 서비스>로서, 주요 기능은 사용자가 하는 말을 알아듣고 이에 대해 잘 정리된 형태의 한편의 글로써 답을 하는 것이다. 필자도 직접 사용해본 결과, 좀 복잡한 질문에 대해서도 잘 이해하고 구성이 잘 잡힌 형태로 답을 준다. 특히, 사용자가 구체적인 내용, 형태 등을 잡아주면 더욱더 기대하던 답을 쉽게 얻을 수 있다. 대부분의 대답은 인터넷에서 공개된 정보들을 집대성하여 작성하고, 세상 모든 주제에 대하여 완벽한 DB 형태의 자료를 가진 것은 아니기에 접근이 힘든 정보에 대해 주도적으로 리서치를 해주지는 못한다.


실제로 여러 방면으로 사용해본 결과, ChatGPT가 유용한 사례는 다음과 같다.

1. 한 주제에 대한 설명을 짜임새 있게 정리해서 보고 싶은 경우

2. 주제와 핵심 내용이 명확한 목적성의 글을 빠르게 쓰고 싶은 경우

3. 심심한데 같이 카톡 할 친구가 없는 경우


ChatGPT가 쓰는 글들이 웬만한 사람들은 못 쓰는 수준의 엄청난 글을 쓰는 것은 아니다. 대부분이 정보나 글의 수준은 한 사람이 마음먹고 자료를 잘 찾아 모으고 공을 들여 글을 쓴다면 충분히 가능한 글이다. 또, 원하는 글의 형태나 길이 등을 지정해주지 않으면, 오히려 사용하지 못하는 글들이 나올 때가 많다. (간단한 답을 얻고자 질문을 던졌는데 정작 600자 자리 정리 글을 답으로 주었을 때면 의욕과 자신감만 넘치는 신입사원이 중간에 안 물어보고 혼자서 끙끙대며 써온 글 같다고 느꼈을 때가 많다) 다만, 이러한 글을 사람은 절대로 불가능한 엄청난 속도(한 5~10초 정도) 만에 쓴다는 게 이 서비스의 강력한 장점이다.


실제로 필자가 ChatGPT를 가장 유용하게 쓰는 경우는 회사에서 고객사의 CEO에게 자사 CEO 명의의 영문 레터를 대신 써야 할 때이다. 비즈니스 레터라는게 어느 정도 형식이 잡혀있다 보니, 수신자 발신자의 이름과 주요 내용 등을 간단히 정리해서 엔터를 누르면 5초 만에 굉장히 스트럭쳐가 잘 잡힌 레터 한편이 뚝딱 나온다. 물론, 우리 부서 신입사원 OO이도 ChatGPT 못지않게 레터 잘 쓸 수 있다. 시켜놓으면 한세월 걸려서 문제지.


인터넷에 떠돌아다니는 예시, 난 회사에서 어떻게 써먹어야 할지 궁리하는데 얘는 어떻게 놀지 물어본다. 동갑인데 나도 좀 끼워줬음 좋겠다


다만, 이 정도면 굉장히 쓸만하다고 생각하며 ChatGPT를 오랫동안 만지작거리다 보면 느끼는 게 있었다.

“이 내용, 이 글... 어디서 많이 본 것 같은데?”

ChatGPT는 인터넷의 여러 글을 탐독하며 정보와 글의 형태와 의미들을 깨우쳤고, 이렇게 배운 여러 가지 글의 형태와 내용들을 조합할 수 있게 트레이닝 되어 있다.  글은 그 글의 목적에 맞는 문법과 글의 구성법 등이 어느 정도 정형화되어 잡혀있기 때문에, 인터넷을 통해 방대한 양의 글을 접한 ChatGPT의 글은 정말 그럴싸해 보인다. 다만, ChatGPT는 새로운 형태를 주도적으로 만들거나, 새로운 의견을 만들지는 못한다. 현재 ChatGPT는 GPT 3.5 기반이라 하니 점점 버전을 업그레이드하면서, 더 강력한 프로세서가 나타나서 주도적으로 새로운 형태와 의견을 낼 수 있게 될지 모르지만, 적어도 지금은 다양한 글을 잘 조합하는 게 한계다.


무료로 쉽고 빠르게 즐길 수 있는 만큼, 굳이 쓸 일이 없더라도 한 번쯤은 접해보는 것을 권한다.


[ChatGPT: Optimizing Language Models for Dialogue](https://openai.com/blog/chatgpt/)





**이미지 기반 인공지능  : DALL E, MidJourney**


두 번째는 원하는 이미지를 텍스트 형태로 입력하면 그림으로 표현하는 DALL E와 MidJourney이다. 이미지의 주제와 스타일, 느낌 등을 글로 쓰면 인터넷에 있는 이미지들을 조합하여 꽤나 멋진 결과물을 낸다. 지시사항을 입력하면 처음엔 각기 다른 여러개의 결과물을 주고, 그 중 이용자가 가장 자신의 기대와 맞는 결과물들을 추려나가는 식으로 최종 결과물에 도달해 나간다. 또한, 기존에 사람이 만들어낸 그림에 추가적인 배경을 그려넣는다거나, 특정 작가의 화품으로  또다른 작가의 그림을 그려보게 하는 것도 가능하다.


DALL E의 Outpainting 기능을 활용한 진주목걸이를 한 소녀의 배경을 만들어냈다. 이름과는 다르게 새로운 스타일을 추구하진 않는가 보다.


이 또한 시간 가는줄 모르고 새로 산 장난감 마냥 뜯어보면서 가장 유용하게 쓰일만한 곳들에 대해 고민해 보았다.

1. 글의 분위기와 내용을 파악하는데 도움주는 삽화 수준의 이미지를 만들 고 싶은 경우 ( ex) “협상의 기술”에 대한 글에서 양복을 입은 회사원들이 악수를 하는 이미지, 포스터에 들어가는 간단한 픽토그램 등)

2. 아이디어 시제품 이미지를 단순한 그림으로 표현해보고 싶은 경우

3. 인터넷 커뮤니티를 떠돌다가 심심해지는 경우


ChatGPT와 다르게 Dall E나 MidJourney는 다른 의미에서의 놀라움을 줄 때가 많다. ChatGPT는 글로 표현하면서 많은 정보를 결과값으로 내놓을 수 있기 때문에, 그 많은 결과의 내용 중에 내가 기대하던 내용이 포함되기가 쉽다. 하지만, 이미지 기반 AI들은 한 장면의 이미지로 표현해야하기 때문에, 정확히 내가 기대했던 이미지와는 다른 결과물을 낼 때가 많다. 물론, 설명에는 부합하지만, 정확히 내가 상상하고 있던 결과물을 만들어내고자 하면 정말 많은 수식어들을 넣은 긴 글을 써야할 때가 많다. Dall E와 MidJourney가 유명세를 타게 되면서, 유튜브에는 벌써 해당 소프트웨어에 어떻게 이야기 해야 기대하는 결과물을 얻을 수 있는지에 대한 팁들이 올라오고 있다. 또한, 이러한 기술을 이용해 만든 이미지로 NFT를 발행하여 판매를 하기 시작하기도 했다.


위 이미지 기반 인공지능의 특징이자 단점인 다른 당황스러운 지점은 바로 절대 똑같은 결과물을 다시는 만들어 낼 수 없다는 것이다. 아무리 입력 내용을 똑같이 넣어봐도 몇 분전에 만들어내었던 결과값과는 조금씩이라도 차이가 나는 결과값을 도출해낸다. 이는 이들에게 지난번 동일한 지시사항을 내렸을 때, 이용자의 선택이나 반응이 해당 인공지능의 추가적인 변수로 작용되어서이지 않을까 싶다. 인공지능은 점점 더 똑똑해지고 있다는게 틀린 말이 아니다.


[DALL·E 2](https://openai.com/dall-e-2/)

[Midjourney](https://midjourney.com/home/?callbackUrl=%2Fapp%2F)





**도구를 대하는 마음, 도구를 이용하는 미래**


몇가지 인공지능 서비스들을 접해보고서 느낀점이 있다. 첫 번째는 이들은 미래의 직업을 위협하는 두려움의 대상이 아니라 그저 도구일 뿐이라는 것이다. 이들이 만드는 output은 사람들이 기존에 만들어 놓은 data와 지시사항으로 추가로 입력되는 input으로 만들어진다. (물론 훨씬 더 복잡한 프로세스가 있겠지만) 계산기에 1과 2를 집어넣고 더하기를 수행시켜 3을 만드는 것과 크게 다르지 않다. 이들은 어떠한 Output이 필요할지 목적성을 가지면서 주도적으로 움직이지 못하며, input되는 data가 없이는 작동되지 않는다. 인간은 주도적으로 자기 고유의 삶의 목적과 방향성과 생각을 하며 남들과 비슷한 생각을 할 때도, 또는 전혀 다른 생각을 할 때도 있다. 물론, 모방은 창작의 어머니라고, 인간들도 모방을 통해 자기 자신의 지식 수준을 고도화하고 새로운 발상의 기반을 삼기도 한다. 다만, 아직 인공지능이 모방을 통해 새로운 스타일과 주도적인 목적성을 찾는 수준까지 도달하진 못한 것 같다.


두 번째는 앞으로 더욱 전문적인 깊은 지식과 스킬 그리고 컴퓨터 활용 능력이 중요해질 것이라는 것이다. 인공지능이 고도화 되면서 더 많은 분야에서의 간단한 수준의 작업들이 수월하게 자동으로 처리되게 변할 것이며, 앞으로는 Entry Level의 지식과 스킬은 그 자체로는 아무런 경제적 가치가 없어질 것이다. 물론, Entry Level 지식과 스킬만 있어도 미래 성장 가능성에 대한 투자로서 고용될 순 있겠지만, 인공지능으로 처리할 수 있는 Level을 넘어설 때 기업 내의 가치가 있는 인재로 평가될 수 있을 것이다. (대학원 진학율이 높아지는 게 이런 이유도 있을지도 모르겠다.) 또한, 인공지능이 어떠한 Process를 통해 결과물을 내었는지 이해하고, 특정 분야에 대해 더 고도화 될 수 있게 발전시키기 위해선 이를 사용하는 모두가 어느정도 인공지능에 대한 기초적인 지식과 Coding에 대해 이해하고 있어야 할 것이다. 예전에 엑셀을 쓸줄 아는 건 회계담당자면 되었지만, 오늘 날의 사무공간에선 모두가 엑셀은 기본적인 소양이 된 것과 크게 다르지 않다.


쓰는 기간이 길어지다 보니 불필요하게 내용도 많고, 시간도 오래 걸린 것 같다. ChatGPT한테 시켰으면 30초면 썼을지도 모르겠다는 생각을 해본다.



기계 좋아하는 안대리


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari