야근 탈출! Claude vs Codex 하네스 활용

FOMO 방지 비개발자 바이브코딩 클로드 vs 코덱스 하네스 비교

by 져니박


캡처지옥 야근 탈출! 비개발자 직접 바이브코딩하다


바이브코딩의 첫걸음은 반복되는 업무를 정렬하고 가장 우선순위 높은 것부터 단순화, 자동화하는 것이라 한다. 버튼 클릭하기, 화면 캡처하기, 문서 스크롤 내리기, 클로드한테 물어보기, 오래된 것 지우기, 메일 보내기...


그중에서 아차! 했던 것이 하나 있었다. 해외 파트너사, 개발자, 디자이너와 협업할 때마다 반복되는 '캡처' 작업. 화면을 일부 캡처하고, 전달하고, 서로 이해를 맞추는 커뮤니케이션에 자주 추가 리소스를 써야했다.


캡처를 전달하는 맥락과 상대는 매번 달랐지만, 공통점이 있었다. 다음 내용을 요청받고 답변해야했던 것.


- 누가 언제 캡처한 화면인가요? : 이슈 제보한 CS팀? 고객 제보? 개발팀

- 어느 경로로 캡처했나요? : 무슨 URL 인지, 무엇을 검색한 결과인지

- 캡처를 전달하여 무엇을 얻고자 하나요? : '에러' 또는 '테스트 결과' 박스치고 설명하기


다음 PRD.md 참고하여
비개발자 PM의 문제를 해결할
올인원 캡처 앱을 만들어줘

결국 올인원 캡처 앱 PRD(요구사항 문서)를 작성했다. Google Gemini 활용해서 2회 정도 수정하고, 똑같은 파일을 각각 Claude Code 창과 Codex 창에 전달했다.

Disclaimer:
본 글에서 다루는 바이브코딩 결과물(캡처 크롬 익스텐션)및 코드는 PM 업무 효율화에 착안했으나 모두 개인 PC와 개인 구독 계정(Claude Pro, Codex Pro)으로 진행한 프로젝트이다. 재직중인 회사에서는 클로드 지원 제약이 있어 회사 자산과 무관하며 소유권은 본인에게 있음 밝힌다.


클로드 코덱스 다 알아야 하나요? 까짓 거 바이브코딩 직접 해보자


비개발자로서 아직 클로드 코드도 우당탕탕 하면서 경험치를 쌓고 있다. 그리고 틈틈이 클로드 공식 자료 기준으로 새로 알게 된 개념이나 동작 방식, 꿀팁을 풀어내는 해리포터 시리즈를 쓰고 있다. 조회수도 꽤 나온다 :)


그런데 개발자 친구가 한 마디 한다. "요즘 개발은 코덱스 시켜~ 클로드 요즘 토큰 너무 빨리 닳아서"


어라라 하나만 뽀개면 되는 거 아니었나? 이 기회에 그럼 해리포터 말고 멋지고 잘생긴 마법사를 파 볼까!

출처 : Harry Potter




클로드 하네스, 코덱스 하네스 원칙 한 줄 요약


저번 글에서 클로드 코드의 하네스 엔지니어링, 벤치 신세를 탈출해서 퀴디치 게임을 이기기 위해 주장(계획자) - (생성자) - (평가자) 3박자의 중요성을 다루었었다.


3월에 올라온 Anthropic 공식 기술블로그를 참고했는데, 그보다 1달 더 앞서서 Open AI 코덱스에서도 하네스 엔지니어링을 통해 인간 개발자 개입 없이 코드를 짰다는 글이 화제가 되었었다.


https://www.anthropic.com/engineering/harness-design-long-running-apps

https://openai.com/ko-KR/index/harness-engineering/


각 하네스 원칙을 요약하자면 다음과 같다.


클로드 하네스 엔지니어링 : 판단과 실행의 분리 - Planner은 무엇을 왜 / Generator은 어떻게 / Evaluator은 그래서 실제로 구현되었는지를 묻는다.


코덱스 하네스 엔지니어링 : 인간과 AI의 분리 - 사람은 목표와 승인 기준만 정하면 끝 / AI가 실행 가능한 작업 할당,기획,개발,검증,또 개발 무한 반복한다.


다음은 각 Claude Code Codex 에게 각각 문서 url을 주고 모든 세션과 프로젝트에서 일하는 방식으로 참고하도록 global convention으로 등록 요청한 뒤, 너가 이해한 바를 내게 설명해보라 한 상황이다.




비개발자 PM 클로드 코덱스 하네스 코딩 결과 발표!


클로드 바이브코딩 결과물'올인원 캡처 1.0.0'는 심플하다. 너무 심플해서 활성화된 상황인지도 모르고 똑같은 캡처 했다. 캡처하는 작업화면이 메인이고, 작업창은 정말 작다. PRD에 언급한 여러 채널 중 슬랙 연동만 있다.


코덱스 바이브코딩 결과물 'All-in-One Capture 0.1.0'도 심플하다. 클로드보다 기능은 많지만 못생겼다.

PPT 기획서 친 것처럼 버튼의 위치, 캡처 및 이슈 전달을 위한 form 서식이 오와 열을 맞춰 나온다.


결론로드 코덱스 둘 다 마음에 아주 안 들었다. 그렇지만 어느 지점부터 각 클로드, 코덱스 서로 다르게 이해했는지, 다르게 범위를 정의하고 개발을 시작했는지 궁금해졌다.


똑같은 문서 전달했는데
클로드, 코덱스
왜 이렇게 다른 결과가 나온 거야?




바이브코딩 1막. PRD 던져주고, 알아서 해보라 했더니


클로드 vs 코덱스 하네스 비교 ㅡ 배째라거나 넵!하거나


Codex : 넵! 플러그인 PRD를 바로 구현 착수 가능한 산출물 형태로 만들고, 필요하면 간단한 프로토타입까지 구성하겠습니다~ 산출물은 제품/기술 문서로 만들겠습니다~


Claude : 배 째. 못해 나는. 개발팀이 '그래서 뭐부터? 뭐 하라고' 할걸. PRD 리뷰 다시 써와.


Codex : (계속) 만들겠습니다~ 문서 쪽은 요구사항을 구현 단위로 쪼개고, API/DB/QA 기준까지 필요한 수정으로 고정하겠습니다~ 다음은 이해관계자가 손으로 만져볼 수 있게...



바이브코딩 2막. 우선순위? PC 웹부터 해보라 했더니


클로드 vs 코덱스 하네스 비교 ㅡ 역질문하거나 넵!하거나


Claude : 웹? 네이티브 앱 말고 브라우저/웹앱? 그럼 제일 간단한 건 크롬 익스텐션인데? 어때?


(져니, 솔깃해서 잠시 고민하다가 Codex 창에 입력한다.)

Codex, 웹에서 사용하는 것이면 Chrome Extension이 mvp가 되어야 하는 것 아닌가?


Codex : 넵! 좋은 선택입니다. 크롬 익스텐션을 첫 번째 MVP로 iOS/Android 보다 먼저 순서로 추가하고 올게요. 잠시만요... prd.md, technical-design.md, qa-plan.md 수정했습니다. 그리고 또...



바이브코딩 3막. 너의 결과물 어떻게 만들었는지 보여줘!


클로드 vs 코덱스 하네스 비교 ㅡ 맘대로 없애거나 vs 로드맵 다하거나


Claude, Codex의 1/4의 길이다.


Claude : 크롬 익스텐션 MVP만 생각. PRD에 나와있던 기능들 팝업이고 모바일 햅틱이고 뭐고 다 날렸다. Codex : MacOS, AndroidOS 등등 모든 로드맵 계획을 다 유지하고 있었다. 형평성 측면에서 Chrome Extension MVP와 무관한 파일은 삭제해!라고 했는데도 여전히 FM대로. css, html, js 풀세트 구비중이다.


솔직히 클로드 코덱스 두 개 다 바이브코딩 1턴만 돌려서인지 사용성, 심미성, 확장성 다 마음에 안 든다..

그래도 비개발자인데 1시간도 안 되어 크롬 익스텐션을 2개나 배포했다니 바이브코딩은 대단한 무기이다.




너도나도 하네스, 클로드 vs 코덱스 비개발자도 이해하기 쉽게


이 지점에서 양대산맥 Antrhopic 클로드, OpenAI의 코덱스 하네스 전략을 비교해 봤다.

하네스란 저번 글에서 밝혔듯이 코드가 잘 작동하게 하는 장치이자 환경일 뿐. 각자의 사상에 따라 다르다.


호그와트(Anthropic)의 해리포터(Claude)는 저번 하네스 전략으로 퀴디치 게임 이겼듯이, 계획자-생성자-평가자 역할을 분담하고 협력하며 문제를 해결한다. 그래서 고객에게도 계속 피드백을 요구하며, 배 째!라고 우기기도 한다. 그리고 여전히 빼먹는 테스트는 나오지만, 평가하는 역할을 명시적으로 따로 둔다.


덤스트롱(OpenAI)의 빅터 크룸(Codex)는 폭룡적인 추진력이 하네스 전략이다. 사용자는 코드 0줄만, 아주아주 적은 요구사항, 방향성만 전달하면 로직 설계, 디자인, 개발, QA, 코드 관리, 문서화까지 모든 업무를 혼자서 해내는 것이다. 바로 검증 가능한 서비스를 무에서, 자율적으로 개선하면서 만들어내는 루프이다.



그래서 제 점수는요? 두구구두구...

둘 다 정말 마음에 안 들고 손 볼 것이 많지만, Claude에게 한 표를 주겠다!


왜냐하면 Claude, 정확히는 1번 주자 Planner 에이전트가 초반에 배 째! 로드맵 정리하라 했고, 크롬 익스텐션이 MVP라고 새로 제안까지 했기 때문이다. 즉 Claude만의 효율적인 MVP 개발을 넘어 사람(져니)를 움직여서 Codex에게 수정 요청을 하게 하여 Codex의 불필요한 시간 및 토큰 낭비도 막았다. 그때까지 Codex는 넵! 외치면서 기획문서, 소스, 테스트코드 동시에 양산하고 있었고.




코딩이 쉽고 빨라질수록, 조심해야 할 검은 호수 속 위험 2가지


비개발자 바이브코딩을 하게 되면서 개발자가 원래 맞닥뜨리던 똑같은 위험 2가지 맞닥뜨리게 된다. 목적만 달성해서 얼른 이 검은 호수를 탈출해야 하는데 말이다.


1. 온갖 화려하고 있어 보이는 디자인으로 옆길로 새게 하는 사이렌의 유혹 (주관성)

2. 빠른 실행만큼 더 빠르게 쌓이는 컨텍스트, 중복 파일, 자가증식 그린딜로우 촉수의 압력(엔트로피)이다.



심해 호수의 함정을 벗어나는 방법이 있을까? 불필요한 야근 탈출, 고객과 동료의 마음을 한 번에 얻고 승리하려면 어떻게 바이브코딩해야할까?


최적의 모델과 최고의 하네스 전략이 무엇인지는 아무도 모른다. 매달 아니 매주마다 LLM 모델이 나오고 매일 같이 새로운 스킬, 바이브코딩 사례가 나온다. 모범 답안은 없다. 개발자의 영역을 넘어 데이터분석, 디자인 등 더 많은 영역에서 '딸깍'이 나오는 상황에서 1등 답안지는 없다.


유일한 정답은 없지만 수많은 비개발자가 ㅡ PM, 마케터, 교사, 학생 등 ㅡ 정답을 찾았다. 사이렌의 유혹과 촉수의 위협으로부터 탈출하는 이들의 공통점은 무엇일까. 아마도


어떤 문제를 해결하기 위해
내가 직접 바이브코딩을 하는가?


최적의 모델이 중요하지 않다는 입장 중에는 이런 것도 있다. 각자 스탯과 일하는 방식이 다 다른 모델을 한 번에 전부 고용하면 된다. (수 십만 원의 디지털 월세를 낼 충분한 여유만 있다면!)


출처 : Harry Potter + 이미지 추가

져니박 씀

클로드 코드 쓰고 싶은데 고민된다면? 비개발자 PM Journey DM으로 편하게 연락주세요


P.S.

오늘 가장 놀라운 것은 각 Codex, Claude의 하네스 사상을 직접 셋업 하고, 크롬 익스텐션을 2개나 만들어본 경험이 아니다.


해리포터 트리위저드 검은 호수 미션에서 실제로 해리포터가 이긴 이유는, 제한시간을 넘겼지만(!) 자신이 구해야 하는 론뿐 아니라 플뢰르의 동생, 빅터의 사랑 헤르미온느까지 살리고자 한 의리 때문이었다. 오늘도 해리(Claude)가 바로 호수에 뛰어들지 않고 질문을 던져서, 빅터(Codex)까지 도와준 것이다. 찰떡 비유 :)





매거진의 이전글벤치 탈출! Claude Code 하네스 전략