AI로 인해 생긴 일들을 수습·보완하며 드는 이런저런 생각
작년 여름께 개발자 친구와 만나 얘기를 하다가 AI 얘기가 나온 적이 있었다. 그 얘기가 나오자 친구는 한숨을 쉬더니 AI 때문에 전보다 할 일이 오히려 많아졌다고 하소연했다. 회사가 업무 전반을 AI로 혁신하겠다며 업무 프로세스 곳곳에 AI를 도입하고 자동화 가능한 부분은 자동화하겠다고 선언했는데, 정작 이를 안정적으로 구축하기 위한 과정에 시간이 더 걸린다는 것이었다. 어떤 부분에서는 오히려 AI 도입 이전보다 전반적인 효율성이 낮아지고 하는 일은 전보다 더 늘어났다고도 했다. 그럼에도 불구하고 윗선에서 계속해서 AI 확산을 밀어붙이고 있는 상황이라, AI 얘기만 들어도 지겹다고 토로했다.
이 얘기를 작년에 들었을 때까지만 해도 그냥 그렇구나, 하고 지나갔었다. 그런데 이후 내가 AI와 관련된 일을 하게 됐고, 그러면서 그때 그 친구가 했던 말이 무슨 말인지 피부로 느껴지기 시작했다. AI를 활용한 콘텐츠 생성 작업이 올해부터 본격화되면서 신경 써야 할 부분이 늘어났기 때문이다.
최근 들어 콘텐츠 생성을 위한 프롬프트 작업과 시스템 구축이 어느 정도 완료되면서 AI로 본격적으로 콘텐츠를 만드는 시도를 하기 시작했다. 문제는 콘텐츠에 불완전한 부분이 많다는 것이었다. 프롬프트가 꽤 길고 복잡하다 보니 프롬프트를 100% 준수할 것이라는 생각을 하지는 않았지만, 간혹 숫자를 완전히 잘못 읽거나 데이터 추출에 실패해 내용을 완전히 다르게 해석하는 등 예상치 못한 문제들이 많이 발생했다. 물론 사람이 직접 콘텐츠를 생산하는 것에 비해 속도가 훨씬 빨랐지만, 정보성 콘텐츠이니만큼 정확도가 떨어진다면 의미가 상당 부분 퇴색되기 때문에 빠른 생성에 큰 의미를 부여하기는 쉽지 않았다.
그렇게 잘못 생성된 콘텐츠를 의도에 맞게 고치느라 시간을 많이 소요하고 있다. 때로는 AI가 좀 더 알아듣기 쉽다고 생각되는 방식으로 프롬프트를 수정해 보기도 했지만, 문제가 100% 해결되지는 않았다. AI 성능이 꾸준히 개선되고 있다고는 하지만 여전히 의외의 기본적인 포인트에서 환각 현상을 일으키거나 데이터를 잘못 읽는 사례가 발생하다 보니 완전히 믿고 맡길 수가 없는 상황이다. 어쨌든 AI로 콘텐츠 생산량을 크게 늘릴 수 있도록 만들긴 했지만, 콘텐츠의 질을 관리하기 위해 쉬지 않고 사람이 지켜봐야 하는 상황이 계속된다면 과연 AI로 생산성이 증대됐다고 말할 수 있을지 아직까지는 고개가 갸웃하다.
그와 동시에 AI 콘텐츠를 만드는 자체 내부 프로그램 개선 작업도 해야 했다. 프로그램에는 콘텐츠의 원문으로 주로 활용되는 사업보고서 등 각종 재무 관련 보고서가 업데이트되고, 여기서 생성 AI 모델을 활용해 텍스트 콘텐츠로 가공해 준다. 업무의 편의성을 높이고 AI가 보다 잘 동작하도록 하기 위해 프로그램 업데이트에 대한 기획을 꾸준히 하는데, 실질적으로 프로그램을 업데이트하는 것은 개발 쪽의 몫이었기 때문에 회사 개발자들과도 머리를 맞대야 했다. 그런데 개발자들과의 소통이 생각보다 쉽지 않았다.
이들과 업무 논의를 하면서 깨달은 것은, 우리가 원하는 구현 방향을 잘 설명하기 위해서는 나 역시 AI로 콘텐츠를 생성하는 원리를 알아야 한다는 것이었다. 개발자들이 이 프로그램을 통해, 실제로 생성 AI에 프롬프트를 어떻게 적용해 콘텐츠를 생산하게 하는지에 대해 일을 하면서 배워 나갔다. 챗GPT나 제미나이를 그대로 끌어 쓰는 것이 아니라 언어모델을 API로 활용하는 방식이었기 때문에 개발자가 이를 어떻게 설계했느냐가 중요했다. 처음에는 구체적으로 어떤 부분을 어떻게 개선해야 하는지 설명하는 데 애를 먹었다. 지금은 우리 프로그램이 어떻게 AI 콘텐츠를 생성하는지 원리를 어느 정도 이해했지만, 여전히 기술적인 부분으로 깊게 들어가면 이해하기 어렵다. 내 업무는 콘텐츠 에디터지만, AI를 활용하는 입장에서 실질적으로는 단지 콘텐츠를 만들고 편집하는 일만 할 수 없다는 사실을 실감했다. AI로 인해 신경 써야 할 범위가 더욱 늘어난 셈이다.
최근 시도한 '바이브 코딩'을 통해 그러한 생각은 좀 더 강해졌다. 한국거래소의 KRX OPEN API를 연동해, 여기서 제공되는 각종 주가 관련 정보들을 편리하게 볼 수 있는 툴을 만들고자 바이브 코딩을 해 봤다. 해당 API를 구글 스프레드시트에 연동해, 날짜와 개별 종목을 입력하면 날짜별 종가와 입력한 기간 동안의 전반적인 주가 흐름을 브리핑해 주도록 했다. 주가 흐름은 문장 형태로 설명해 주도록 하고 이 기간 최고점과 최저점, 코스피/코스닥 대비 증감률 비교 등의 기능을 더했다. 클로드 코드 등 개발자용 에이전트를 쓸 엄두는 나지 않아 챗GPT를 활용해 봤다. API 호출/응답 방식을 재설정하고, AI가 스스로의 가정을 토대로 임의로 짠 코딩을 KRX API에 지정된 문자 체계에 맞추느라 시간이 좀 걸렸지만 어쨌든 기본적인 기능은 약 서너 시간 만에 구현하는 데 성공했다. 지금도 계속 기능을 추가해 보는 중이고, 스프레드시트에서 벗어나 웹페이지에서도 같은 기능을 구현해 보고 있다.
코딩 경험이 전혀 없는데, 생각보다 어렵지 않게 API가 연동되니 양가적인 감정이 든다. 코딩을 전혀 모르는 사람들도 바이브 코딩으로 그럴싸한 무언가를 만들 수 있는 길이 열렸다는 점에서 분명히 혁신적이기는 하지만, 동시에 앞으로는 완전히 개발자의 영역으로 여겨졌던 부분이 비개발자 쪽으로 넘어오는 현상이 가속화되면서 비개발자들이 해야 할 일이 더 많아지지 않을까라는 두려움도 들었다(이미 서비스 기획자나 프로덕트 디자이너 등에게는 점차 바이브 코딩이 반쯤 필수가 되는 것 같기도 하다).
또 바이브 코딩으로 서비스를 만들었다고 하더라도, 갑작스럽게 오류가 발생하는 등 문제가 생기면 결국 코딩을 뜯어봐야 하는 상황이 올 텐데 이럴 경우 개발자가 원활하게 문제를 해결할 수 있을지도 긴가민가했다. 개발자들의 글을 읽어 보면 AI가 짠 코딩이 여전히 비효율적이고 쓸데없이 길다는 반응들이 많은데, 문제가 생기면 길고 비효율적인 코드 속에서 오류의 원인을 찾아야 한다고 생각만 해도 머리가 아파온다. 개발자들도 이럴 텐데 바이브 코딩을 한 나 같은 비개발자는 어떻겠는가. 솔직히 구현 과정에서 오류가 발생하고, 오류의 원인을 챗GPT한테 물어볼 때마다 두 눈을 안대로 가린 채 누군가에 완전히 의지하는 느낌이었다.
이렇듯 AI로 인해 오히려 일이 많아지는 것 같다는 느낌은 비단 나와 내 주변에서만 느끼는 것은 아닌 것 같다. 지난달 미국 '액티브트랙 생산성연구소'가 발표한 보고서에는 AI가 전체적인 업무량을 늘리지만, 생산성 측면에서는 의문이라는 조사 결과가 담겼다. AI로 인해 전체적인 협업 활동과 멀티태스킹이 다소 늘어나며 효율성이 늘어난 것처럼 보이지만, 업무 집중 시간은 기존 대비 일 평균 23분 감소해 최근 3년 간의 조사 결과 중 오히려 최저치로 떨어졌다고 한다. 또 AI 도입 이후 이메일 사용은 104%, 채팅·메시징은 145% 증가하는 등 업무 하중은 늘었지만, 이러한 증가세가 생산성 향상으로 직결되지는 않고 오히려 평균적인 주말 근무가 늘어나는 결과를 낳았다고 언급했다. 이에 더해 전체 근무 시간의 7~10% 정도만 AI 도구 사용에 투자하는 직원들이 가장 높은 업무 생산성을 보였다는 조사 결과도 있었다.
챗GPT 등 생성 AI가 처음 나왔을 때 이제는 정말로 AI가 사람들의 업무를 대신해 주며 인간에게 큰 도움이 될 것이라는 기대가 컸다. 그 기대에 어느 정도 부응한 면도 있지만, 그런 만큼 새롭게 해야 하는 일이 생기고 기존에 하지 않아도 될 업무를 하게 되는 일도 늘어났다. 심지어 오히려 해야 할 일을 키우거나, 업무상 내 영역이 아니라고 여겨졌던 일들에 대해서도 경계가 점차 흐려지고 있다는 느낌이다. 그래서 AI가 업무 효율성을 증대시키는 것이 맞느냐고 묻는다면 답을 하는 데 좀 고민이 필요할 것 같다.
지난해 여름, 전직을 한다고 가족들에게 처음 얘기하고 내가 하게 될 일을 대강 말했을 때 동생은 "그러면 AI 시다 하러 가는 거네"라고 답했다. 처음에는 시다라는 표현에 살짝 '긁혔지만', 지금 생각해 보면 그 단어만큼 현재 내 업무 상황을 잘 나타내는 단어를 찾기가 어렵다는 생각이 든다. 끊임없이 지시에 따라 무언가를 계속해서 하는 AI와, 그것을 어떻게든 수습하기 위해 애를 쓰는 인간들의 모습을 상상한다. 그리고 그 인간 중 하나가 내가 아닐까 생각해 본다. 확실한 건, AI를 뒷바라지하고 AI가 저지른 일을 감당하는 인간의 역할이 오히려 커졌다는 점이다.