[5편] Windsurf의 실험 문화와 조직 구조

우리는 실패한 기능을 자랑스럽게 회고한다

by 오유나
이 글은 Pragmatic Engineer 뉴스레터 내 Building Windsurf with Varun Mohan을 바탕으로 작성되었습니다.
Windsurf의 CEO 바룬 모한(Varun Mohan)과의 인터뷰를 통해, 단순히 LLM으로 코드를 생성하는 기술을 넘어서, AI 에이전트 시대에 우리가 재정의해야 할 문제 해결력, 개발자의 역할, 그리고 신뢰할 수 있는 도구와 조직이란 무엇인지 실무자의 시선으로 되짚어봅니다.


Windsurf가 단기간에 빠르게 성장할 수 있었던 이유 중 하나는,

실패를 실험의 결과로 받아들이는 문화와 엔지니어 중심의 제품 개선 구조입니다.

이들은 단순히 에이전트를 개발한 팀이 아니라,

그 에이전트를 자기들이 직접 매일 쓰며 고쳐가는 팀이기도 합니다.

Varun은 이렇게 말합니다.

“엔지니어링은 공장이 아닙니다. 문제를 풀기 위한 가설을 세우고, 실험을 통해 학습하는 과정입니다.”


이 말은 단순히 이상적인 문화론이 아니라, Windsurf의 제품 전략과 맞닿아 있습니다.


실패한 제품도 기록하고 공유한다 – 예: 코드 리뷰 도구 'Forge'

2023년 초, Windsurf는 내부에서 ‘Forge’라는 코드 리뷰 보조 도구를 개발했습니다.

자동으로 PR을 분석하고, 어떤 수정이 의미 있고 어떤 부분이 비효율적인지 알려주는 기능이었습니다.

내부 테스트에서는 유용해 보였지만, 실제 사용자 반응은 미지근했습니다. 많은 개발자들이 기존 워크플로우와 맞지 않는다고 느꼈고, 실질적인 리뷰 시간 단축도 미미했습니다. 결국 제품은 철회됩니다.

그럼에도 Windsurf는 Forge를 실패로 ‘숨기지’ 않았습니다.

“우리는 이 제품이 왜 실패했는지를 리뷰했고, 문서화했고, 이후 기능 설계에 반영했습니다.”


실패는 삭제 대상이 아니라, 다음 실험을 위한 구조적 자산이 됩니다.


누구든 실험하고, 모두가 피드백한다 – 엔지니어 주도 릴리즈 구조

Windsurf에서는 어떤 개발자든 실험적인 기능을 만들어 ‘Next’ 릴리즈에 배포할 수 있습니다.

이 버전은 회사 내부 개발자들이 사용하는 특별 버전으로, 매일 실사용 환경에서 피드백이 수집됩니다.

피드백은 Slack, GitHub, 커스텀 툴을 통해 자동화되어 수집되고, 다음 날 바로 반영되기도 합니다. 중요한 건 이 과정에서 ‘디자이너’나 ‘기획자’가 중심이 되는 게 아니라, 개발자가 곧 제품 관리자(Product Owner) 역할을 한다는 점입니다.

“내가 만든 기능을 팀 전체가 써보고 바로 욕해줍니다. 덕분에 진짜 빠르게 개선됩니다.”


절반은 미래를 위한 실험을 한다 – ‘두 개의 두뇌’ 조직 전략

Windsurf 팀의 절반은 오늘의 사용자 문제를 해결하는 데 집중합니다.

나머지 절반은 아직 제품화되지 않은 미래 기능에 집중합니다.

이 구조는 CTO와 Varun 모두가 직접 설계한 조직 전략이기도 합니다.

이들은 이를 “split-brain” 구조라고 부릅니다.

Brain 1: 지금 당장 유저들이 겪는 문제를 해결하며 제품을 다듬는 팀

Brain 2: 아직 실패하거나, 미완성인 기능을 실험하며 미래를 준비하는 팀

Cascade도, GPT-4.1 대응도, 고속 indexing 시스템도 모두 이 Brain 2에서 시작되어 이후 정식 기능으로 발전했습니다.

“우리가 혁신을 유지하려면, 절반의 리소스를 실패 가능성이 높은 도전에 쓰는 걸 두려워하지 않아야 합니다.”


실패가 반복되는 실험도 ‘중단’ 하지 않는다

Varun은 AI 에이전트 개발에 있어 ‘몇 달간 아무것도 안 되는 기간’을 겪었다고 말합니다.

하지만 그는 이를 실패가 아니라 진행 중인 학습이라고 표현했습니다.

Nick Moy라는 리서치 엔지니어가 몇 달간 에이전트 기능 실험을 반복했지만, 번번이 결과가 만족스럽지 못했습니다. 일반적인 조직이었다면 중단하거나 팀을 재배치했을 상황이었지만, Windsurf는 끝까지 실험을 밀어붙였습니다.

그 결과는 오늘날의 Cascade로 이어졌습니다.

“우리는 한 번 실패한 기능을 몇 달 후 다시 꺼내 재시도하는 걸 두려워하지 않습니다.”


이러한 문화는 단순한 ‘실패 포용’을 넘어, 학습을 위한 실패 관리로 이어집니다.

실패를 덮지 않고 구조화해서 기록하고, 나중에 조건이 바뀌면 꺼내 다시 시도하는 방식입니다.


'폴리싱'보다 '문제 해결력'을 중심에 두는 문화

Varun은 끝으로 이런 말을 덧붙입니다.

“똑같은 버튼 위치 바꾸는 것만 반복하는 조직은 결국 도태됩니다. 문제를 끝까지 정의하고, 해결책을 만들 줄 아는 사람이 살아남습니다.”


즉, Windsurf는 UI 디테일이나 트렌디한 변화보다, 문제 정의 → 실험 → 학습 → 개선이라는 반복을 중요시합니다.

Cascade나 코드 전용 LLM이 단기간에 만들어진 것처럼 보일 수 있지만,

그 배경엔 수많은 실패의 축적과 반복 실험, 그리고 그것을 버티게 해주는 조직 문화가 있었습니다.


6편에서는 Windsurf가 바라보는 미래 – 코드 생성 90% 시대 이후의 개발자 역할, 인간과 AI가 어떻게 협업하고 공진화할 것인지에 대한 철학적 전망을 다룹니다.

keyword
화, 목, 토 연재
이전 23화[4편] Cascade가 만든 새로운 개발자 경험