프롬프트의 시대는 끝났다

"853명을 해고한 AI가 다시 그들을 불러야 했던 이유"

by ViVERs

첫 달, 230만 건.


핀테크 기업 클라라(CLA)의 AI 에이전트가 고객 상담 창구에 투입되자마자 찍어낸 숫자다. 6천만 달러가 절감됐고, 853명의 상담원이 자리를 비웠다. 그 비워진 자리는 AI의 효율괴 비용절감이라는 기대감과 희망으로 대신 채워졌다. 경영진은 샴페인을 터뜨렸을 것이다.


아마도.


나는 그 뉴스를 보면서 묘한 기시감을 느꼈다. 당신도 한 번쯤 겪어보지 않았나 — 숫자가 너무 완벽해서 오히려 불안한 순간. 대시보드의 모든 지표가 초록색인데, 복도에서 마주친 현업 팀장의 표정이 영 아닌 그런 날.

나한테도 그런 날이 있었다.

Ultra-wide_anamorphic_composition_of_a_corporate_c-1772030864672.png


완벽한 흥행이었다. 유튜브 콘텐츠가 방송사의 메인 콘텐츠 보다 화제성이 더 좋았다. 모든 사람이 유튜브에서 탄생한 새로운 장르에 대해 인정했다. 더 이상 마이너 콘텐츠가 아니다. 이제 메인스트림이다. 나는 성공했다, 그 당시에는... 다음 프로젝트가 빠르게 잡혔다. 힘줘서 만들자. 각 잡고 찍자! 그렇게 대형 유튜브 콘텐츠 제작을 위해 소니 시네마 라인 FX9 네 대, FX6 한 대, FX3 4 대, 거기에 시네마 렌즈까지 — 도합 1억 원어치를 질렀다. 2천만 원짜리 카메라 세트를 네 대나 들인 건, 유튜브에서는 보여줄 수 없는, 소위 말하는 때깔을 찍겠다는 확신 때문이었다. 시네마급 색감, S-Log3의 넓은 다이내믹 레인지, 10bit 비트뎁스, 풀프레임 얕은 심도. 그 누구도 유튜브에서 이 정도 화질을 보여준 적 없다고 생각했다.

장비가 도착한 날, 스튜디오 한켠에 박스를 쌓아놓고 혼자 꽤 들떴다. 솔직히. 이런 게 플렉스 인가?


Ultra-wide_composition_of_a_film_production_studio-1772030854312.png

그런데 5억짜리 콘텐츠가 망했다.


조회수는 목표 대비 50%를 밑돌았다. 제작사는 실망했고, 광고주는 떠났다. 스튜디오에 남은 건 1억 원어치 장비와, 이유를 알 수 없다는 공허함뿐이었다. 나는 꽤 오래 고민했다. 기획이 틀렸나. 편집이 문제였나. 출연자 캐스팅을 잘못했나. 밤마다 원본 영상을 돌려봤다. 찍힌 그림은 완벽했다. 색감, 심도, 다이내믹 레인지 — 나는 국제공인 컬러리스트다. 적어도 내 눈에는 완벽했다. 모든 스펙은 OTT 이상이었다. 출연진의 유튜브 구독자수만 다 합쳐도 1000만이 넘었다. 어디 하나 흠잡을 데가 없었다. 도저히 답을 모르겠어서, 결국 시청자 반응 데이터를 뜯어보고, 업계 사람들에게 물었다.

돌아온 한 대답이 묘했다.

대표님! "영상이 너무 예뻐요." - 네? 뭐라고요?

유튜브의 결과 맞지 않는다는 거다. 시청자는 4K 시네마틱 룩이 아니라, 친구가 폰으로 찍어 보내준 것 같은 날것의 질감에 반응했다. 우리는 '최고의 화질'에 최적화했지, '유튜브라는 플랫폼에서 시청자가 진짜 원하는 것'에 최적화하지 않았다. 1억 원어치 장비가 스튜디오에서 빛을 반사하고 있었다. 아름답게. 무의미하게.


Transform_the_image_to_show_a_professional_coloris-1772030845930.png


클라라에서 벌어진 일은 정확히 같은 구조다.

AI는 '티켓을 빨리 해결하라'는 지시에 완벽하게 복종했다. 문제는, 그게 진짜 목표가 아니었다는 것이다. 고객이 새벽 2시에 결제 오류로 전화하는 건 단순히 기술적 해결을 원하는 게 아니다. "내 돈이 어디 간 건지 불안하다"는 감정이 먼저고, 그 불안을 누군가 알아줬다는 경험이 장기 충성도를 만든다. 클라라의 AI는 티켓을 닫았다. 동시에, 관계도 닫았다.

결국 해고했던 인간 상담원을 다시 불러들여야 했다.


그리고 나는 결국 오래된 소니 AX700 캠코더에 오즈모 액션, 그리고 오즈모 포켓을 다시 장비 리스트에 올렸다.


클라라가 853명의 상담원을 되돌린 건, AI가 실패해서가 아니다. '빠른 해결'이라는 잘못된 표적에 맞춰져 있던 조준을 '장기적 고객 관계'라는 진짜 의도로 재조정해야 했기 때문이다. 내가 1억 원어치 시네마 장비를 내려놓고 액션캠과 포켓 짐벌을 집어든 것도 같은 이유다. 스테빌라이저 따위는 내다 버린 30배 디지털 줌, 최신 트래킹 기술이 들어간 손바닥만 한 가벼운 바디의 조작감 — 그게 고가의 시네마 카메라의 때깔을 이긴 게 아니다. 유튜브라는 플랫폼의 의도에 정확히 조준된 것이다. 시청자가 원한 건 완벽한 화질이 아니라, 자기 일상의 눈높이에서 만나는 영상이었다.


853명의 인간 상담원이 가진 건 더 빠른 타이핑 속도가 아니었다. 고객의 불안을 감지하는 0.5초의 눈치였다. 오즈모 포켓이 가진 건 더 좋은 센서가 아니었다. 시청자와 같은 눈높이라는 감각이었다.

결국 같은 이야기다. 기술의 스펙이 아니라, 그 기술이 향하는 방향. 도구의 성능이 아니라, 도구를 쥔 손의 의도.


전 세계 기업의 57%가 디지털 혁신 예산의 절반 가까이를 AI에 쏟아붓고 있다. 평균 7억 달러. 그런데 74%는 가시적인 성과를 보지 못하고 있다. 74%라는 건, 지금 이 글을 읽고 있는 당신의 회의실에서도 벌어지고 있을 확률이 높다는 뜻이다.


월요일 아침, AI 도입 성과 리뷰 미팅. PPT에는 "도입 완료"라고 적혀 있는데, 현업에서는 아무도 안 쓰고 있다는 그 어색한 침묵. 포춘 500대 기업의 85%가 마이크로소프트 코파일럿을 도입했지만, 대규모 배포로 이어진 곳은 고작 5%. 이 숫자들이 말하는 건 하나다.

AI가 멍청한 게 아니다. 우리가 AI에게 잘못된 것을 원하게 만들고 있다.

나는 이걸 '의도 격차(Intent Gap)'라고 부르기로 했다. 그리고 이 격차를 메우는 작업이, 2026년 기업 AI의 진짜 전쟁터가 될 거라고 확신한다. 다만 이 확신이 가리키는 건 꼭 정답이 아닐 수 있다.


하지만 방향은 분명하다.

지금 우리가 서 있는 자리를 정직하게 들여다보자. AI와 인간의 협업은 지난 몇 년 사이 세 개의 뚜렷한 단계를 거쳐 왔다. 그리고 이상하게도, 이 세 단계가 내 세 번의 창업과 겹쳐 보인다.


처음은 프롬프트 엔지니어링이었다. "이렇게 물어보면 더 좋은 답이 나온다"는 세션 단위의 기술. 솔직히 말하자면, 이건 구글 검색을 잘하는 것의 연장선이었다. 내 첫 번째 창업이 그랬다. 좋은 장비를 골라서, 잘 세팅하면 좋은 결과물이 나온다고 믿었다. 개인의 기교에 의존하는 방식. 유용했다. 하지만 조직 단위로 스케일되지 않는다. 당신의 회사에서 프롬프트를 가장 잘 쓰는 사람이 퇴사하면? 그 '역량'은 함께 걸어 나간다. 내 첫 회사에서 에이스 촬영감독이 나갔을 때와 똑같다.


그래서 컨텍스트 엔지니어링이 등장했다. RAG 파이프라인, 벡터 데이터베이스, 지식 그래프 — 조직의 정보를 구조화해서 AI에게 '무엇을 알아야 하는지(What to know)'를 가르치는 단계. 지금 대부분의 기업이 여기에 있다. 두 번째 창업 때, 나는 워크플로우 시스템을 만들었다. 개인의 역량에 기대지 않고, 프로세스에 지식을 녹이는 것. 여기까지는 꽤 그럴듯해 보인다. 이제 누가 갑자기 회사를 나가도 겁나지 않는 딱 그수준.


문제는, 아는 것과 원하는 것은 전혀 다른 차원이라는 거다.

내가 영상 현장에서 20년간 봐온 걸로 비유하겠다. 촬영감독에게 렌즈 스펙, 조명 차트, 색온도 데이터를 전부 줄 수 있다. 그게 컨텍스트다. 하지만 "이 장면에서 관객이 불안을 느끼게 하라"는 건 컨텍스트가 아니다. 그건 의도(Intent)다. 같은 24mm 렌즈, 같은 3200K 조명 아래서도, 의도에 따라 완전히 다른 장면이 나온다. 찬 모니터 빛 아래서 데이터를 들여다보는 것과, 그 데이터로 무엇을 만들겠다는 방향을 아는 것. 이 둘 사이의 간극이 지금 기업 AI를 침몰시키고 있다.


인텐트 엔지니어링. 이게 세 번째 단계다.

AI에게 '무엇을 원해야 하는지(What to want)'를 가르치는 것. 조직의 목적, 가치, 의사결정의 경계를 기계가 읽고 실행할 수 있는 매개변수로 인코딩하는 작업. 인쇄술이 정보를 복제하게 했고, 도서관이 그 정보를 분류하게 했다면, 편집자가 비로소 "이 정보로 무엇을 말할 것인가"를 결정했듯이 — 인텐트 엔지니어링은 AI에게 편집자의 판단력을 이식하는 작업에 가깝다. 아직 아무도 이 단어를 쓰지 않고 있다. 아무도 대비하지 않고 있다.


세 번째 창업을 하면서, 나는 이걸 온몸으로 배우는 중이다. 그래서 쓴다.

자, 여기서 클라라로 돌아가 보자. 만약 클라라가 인텐트 엔지니어링을 갖추고 있었다면 무엇이 달라졌을까?

수주에서 수개월씩 자율적으로 작동할 AI 에이전트는 인간이 아니다. 간단한 표현과는 달리, 이게 의미하는 바는 생각보다 깊다. 신입 사원은 회식 자리에서 팀장의 농담 뉘앙스를 읽고, 복도에서 스치는 대화에서 '아, 우리 회사는 이런 걸 중요하게 여기는구나'를 흡수한다. 조직 문화라는 건 문서에 쓰여 있지 않다. 공기처럼 떠돌다가 사람의 피부로 스며드는 것이다.


AI에게는 피부가 없다. 복도의 공기를 읽을 코가 없고, 팀장의 한숨 뒤에 숨은 뉘앙스를 감지할 귀가 없다. 그러니까 우리가 해야 할 일은 명확하다. 그 공기를 액체로 바꿔서, 파이프라인에 흘려보내야 한다.


클라라의 AI에게 '고객 만족도 향상'이라는 목표가 주어졌다고 치자. 이걸 그대로 던지면, AI는 만족도라는 단어의 사전적 정의를 참조할 뿐이다. 목표를 해체해야 한다. 만족도를 측정하는 데이터 소스는 NPS인가, CSAT인가, 재구매율인가. 에이전트가 승인된 조치의 범위 — 예를 들어, 20달러 이하의 자동 보상을 즉시 실행할 수 있는가? 응답 속도와 응대 품질이 충돌할 때, 가중치를 어느 쪽에 둘 것인가 — 이를테면 70:30으로? 60:40으로? (솔직히 이 비율은 내가 지금 임의로 적었다. 하지만 진짜 핵심은 이거다 — 당신의 조직에서 이 비율을 결정할 권한과 데이터를 누가 쥐고 있는가? 그 사람이 AI 프로젝트에 참여하고 있는가?) 이런 구체적 매개변수 없이 AI에게 "만족도를 높여"라고 말하는 건, 촬영감독에게 "좋은 그림 느낌있게 잘찍어"라고 말하는 것과 같다. 운이 좋으면 걸작이 나오고, 대부분은 망한다.


그 다음이 더 지저분하다. 현실의 고객 응대는 교과서대로 흘러가지 않는다. 누군가 환불 규정에 없는 예외를 요구한다. 클라라의 인간 상담원이라면 목소리 톤에서 감정의 온도를 읽고, "이건 규정대로 하면 안 되겠다"는 판단을 0.5초 만에 내렸을 것이다. AI에게는 이 0.5초의 눈치를 코드로 번역해줘야 한다. 효율성과 관대함이 충돌할 때, "우리는 어떤 회사인가?" — 이 질문의 답이 의사결정 로직에 명시되어 있어야 한다. 대부분의 기업이 이걸 한 번도 쓴 적이 없다. 인간끼리는 암묵적으로 공유하고 있었으니까. 뭐랄까, 사내 연애처럼 — 다들 알고 있는데 아무도 공식적으로 인정하지도 명문화하지도 않은 것.


그리고 마지막. 클라라가 853명을 해고한 뒤 고객 불만이 폭증하기까지 몇 주가 걸렸을까? 그 몇 주 동안 에이전트의 결정이 조직의 의도와 이탈하고 있다는 신호를 잡아내는 루프가 닫혀 있었다면? 에이전트를 배포하고 나서 "잘 돌아가겠지"라고 방치하는 건, 촬영 현장에서 카메라를 돌려놓고 모니터를 안 보는 것과 같다. 찍히고 있다. 하지만 뭐가 찍히고 있는지 아무도 모른다.


세 개의 층위 — 목표의 해체, 충돌의 룰, 피드백의 루프 — 가 맞물려 돌아갈 때, 비로소 AI는 '지시를 수행하는 기계'에서 '의도를 공유하는 파트너'로 전환된다.

묘하게, AI 도입이 조직을 더 인간적으로 만드는 역설이 여기서 발생한다.


솔직히 나도 항상 같은 고민에 빠져있다.

얼마 전 AI 스타트업을 운영하는 후배를 만났다. 시리즈A를 막 끝낸 친구다. 내가 인텐트 엔지니어링 이야기를 신나게 풀어놓았다. 후배가 고개를 끄덕이더니, 커피를 한 모금 마시고 말했다.

"형, 그거 좋은데요. 근데 우리 고객사 대표들한테 그 얘기 하면 다들 이렇게 물어봐요. '그래서 그거 누가 해요?'"

맞았다. 그리고 그 한마디에 내가 2도쯤 식었다.


인텐트 엔지니어링이 기술 팀의 숙제가 아니라 경영진의 숙제라는 건, 말처럼 쉽지많은 않다. 하지만 현실에서 이게 뭘 의미하는지 생각해 보자. CEO, COO, CMO가 한자리에 앉아서 "우리 회사가 진짜 원하는 게 뭔가"를 합의해야 한다는 뜻이다. 해본 적 있나? 비전 워크숍이라는 이름으로 한 번쯤 해봤을 수도 있다. 대부분 벽에 포스트잇 붙이다가 끝났을 것이다. 이번에는 그 포스트잇의 내용을 기계가 실행할 수 있는 매개변수로 바꿔야 한다. 맞다 사실 너무 원론적이다. 인정한다.


Ultra-wide_one-point_perspective_of_a_long_empty_o-1772030836446.png


하지만, 솔직히 이건 무섭게 어렵다. 의도를 명문화하면, 그동안 모호하게 둬서 유연하게 굴렸던 것들이 단단하게 굳는다. "우리는 고객 경험을 최우선시한다"고 적어놨는데, 3개월 뒤 생존이 걸리면? 그 문장이 회사를 옥죈다. 그래서 이건 한 번 새기고 끝나는 비석이 아니라, 계속 다시 쓰는 일기장이어야 한다. 그 일기를 쓸 사람이 없으면 — 또 다른 클라라가 태어날 뿐이다.

생각해 보자. 불편한 진실을 마주하는 자세로...

당신의 조직에서, AI한테 가르칠 의도 이전에, 사람들끼리도 조직이 뭘 원하는지 합의가 돼 있나?

경험상, 대부분 안 돼 있다. 그러면 이건 AI 프로젝트가 아니다. 조직이 처음으로 자기 속을 꺼내놓는 과정이다. 불편하지만, 어쩌면 그게 인텐트 엔지니어링의 진짜 가치일 수도 있다.


이제 프런티어 Ai 모델의 프롬프트 시대는 끝났다.

더 이상 누가 가장 똑똑한 모델을 가졌는지는 중요하지 않다. GPT든 Claude든 Gemini든, 모델의 성능 격차는 빠르게 수렴하고 있다. 6개월 뒤면 지금의 최첨단이 평범해진다. 이건 내가 영상 산업에서 세 번이나 목격한 패턴이다. 카메라 해상도 경쟁이 끝나고 나면, 승부는 항상 '그 카메라로 무엇을 찍을 것인가'에서 갈렸다. RED와 ARRI의 스펙 전쟁을 기억하는가? 8K니 12K니 숫자를 올려붙이던 그 시절. 결국 아카데미를 휩쓴 건 더 좋은 센서가 아니라, 더 명확한 비전을 가진 감독이었다.


기업 AI도 같은 지점에 도달했다.

평범한 모델과 탁월한 의도 인프라를 갖춘 기업이, 최첨단 모델과 파편화된 지식을 가진 기업을 매번 이길 것이다. 매번. 이건 예측이 아니라, 필름에서 디지털로, 디지털에서 AI로, 세 번의 전환을 관통하며 내가 목격한 패턴이다.


의도가 없는 컨텍스트는 표적 없이 장전된 총이다.

AI를 도입하는 것을 넘어, AI의 방향성을 조직의 진정한 목표에 정밀하게 조준하는 기업만이 살아남을 것이다. 그리고 그 조준은 기술 부서가 아니라, 당신이 해야 한다.

...

여기까지 쓰고, 다시 그 찬 모니터 빛을 떠올린다. 새벽에 편집실에서, 두 번째 창업이 무너지던 날 회의실에서, 그리고 지금 이 글을 쓰는 이 화면 앞에서 — 모니터의 빛은 항상 같은 온도였다. 차갑고, 정직하고, 무심하게. 하지만 그 빛으로 무엇을 비출 것인가를 결정하는 건, 결국 빛 앞에 앉은 사람이었다.


853명의 상담원이 클라라로 돌아왔을 때, 그들이 느꼈을 감정은 뭐였을까. 안도? 분노? 아니면 묘한 승리감? 내가 1억 원어치 장비를 내려놓고 오즈모 포켓3를 집어들었을 때, 그건 패배가 아니었다. 조준을 바꾼 것이었다.

Transform_the_aged_weathered_hand_marked_in_the_im-1772031052659.png


나는 모른다. 다만, 853명이 돌아와야 했던 이유, 그리고 손바닥만 한 카메라가 2천만 원짜리 바디를 이긴 이유 — 결국 같은 한 문장으로 수렴한다. 기술의 성능이 아니라, 그 기술이 향하는 곳. 의도.

아이러니하게도, AI가 더 똑똑해질수록 우리는 더 정확하게 '우리가 뭘 원하는지'를 알아야 한다. 기계에게 답을 가르치기 전에, 우리 자신에게 질문을 던져야 한다.


나는 세 번의 창업에서 세 번 다 이 질문을 너무 늦게 던졌다. 매번 기술에 먼저 매혹됐고, 매번 방향을 나중에 물었다. 그리고 매번 대가를 치렀다.

그 질문 앞에서 멈추지 않는 것.

그게, 내가 아는 유일한 생존 문법이다. 살아남자. 난 살아남을 것이다. 당신도