제품에 기여하는 AI 조직은 연구 안하지 않나요?
이런 질문, 정말 자주 듣습니다. 왜 이런 말씀하시는 지 이해도 됩니다. 하지만, 저희 조직에서는 반드시 연구가 필요합니다. 솔직히 연구 없이 비즈니스에 기여할 수 있다면 그렇게 하고 싶습니다. 효율적이니까요. 하지만, 연구 없이는 제품에서 임팩트 내기가 어렵습니다. 처음 한 두번은 운이 좋아서 임팩트가 날 수 있지만, 지속적으로 임팩트를 내는 조직을 만들기는 참 어렵습니다.
연구란 무엇일까요?
학계에서는 연구의 내용을 다른 사람에게 전달할 때 논문이라는 형식을 사용합니다. 저는 논문이 가이드하는 형식이 연구의 전체 과정을 아주 잘 설명한다고 생각합니다.
1. Introduction
2. Related works
3. Solution
4. Results
5. Conclusion
Introduction에서는 어떤 문제를 풀 지, 그 문제가 왜 중요한지를 이야기합니다. 저는 ‘왜 이 문제가 중요한가’를 동료 리뷰어들에게 설득할 수 있는 게 연구의 핵심이라고 생각합니다. 회사에서도 이건 다르지 않습니다. 회사에서 풀어야 하는 문제는 정말 많습니다. 그 중에 왜 지금 이 문제를 푸는 것이 중요한지, 혹은 왜 AI 기술을 왜 이 기능에 도입하는 것이 최선인지 연구자 스스로 설명하고 동료들에게 설득할 수 있어야 합니다. 학계에서는 익명의 리뷰어/AC만 설득하면 됐다면, 회사에서는 실명의 주요 의사결정권자들을 설득할 수 있어야 합니다. 설득의 대상이 명확하기 때문에 오히려 학계에서의 설득보다 쉬워질 수도 있지만, 회사의 복합적인 상황을 이해해야 하기 때문에 설득이 학계에서보다 더 어려울 수도 있습니다. 대학원에서는 연구 주제, 즉 풀어야 하는 문제를 스스로 찾기도 하지만 박사 고년차 학생이나 교수님이 주기도 합니다. 회사에서도 마찬가지입니다. 신규 입사하면 회사에서 중요한 문제가 무엇인지 바로 파악하기 어렵기 때문에, 연구 주제를 받는 경우가 흔합니다. 하지만, 회사 내에서의 레벨이 올라갈수록 스스로 중요한 문제를 정의하고 풀기를 기대받습니다.
풀어야할 문제가 설정되었다면 기존 연구들을 찾습니다. 기존 연구들은 학계에서는 다른 사람들이 쓴 연구들일 겁니다. 하지만, 제품에 기여하는 것을 목적으로 하는 AI 조직에서는 기존 연구의 범위가 더 넓어집니다. 당연히 다른 연구 그룹이 출판한 논문은 포함되어야하고, 회사 내에서 했던 시도들, 타 회사의 테크블로그 등도 고려되어야 합니다. 학계에서는 피어 리뷰가 끝나지 않은 연구들은 related works에서 제외하기도 하지만, 제품에 기여하는 AI 조직에서는 이 역시 모두 포함해 종합적으로 검토 되어야 합니다.
조사한 related works 중에서 우리의 문제를 잘 풀 수 있는 솔루션이 있다면 사용하면 됩니다. 하지만, 현실은 그렇게 만만하지 않습니다. 우리의 문제를 가장 잘 풀 수 있는 솔루션을 깊이있게 고민하다보면 나와 있는 연구들도 풀리지 않는 경우가 매우 많습니다. 비슷한 문제라고 하더라도 우리 회사에서 갖고 있는 제약조건과 공개된 연구 결과물들의 제약 조건이 매우 다르기 때문에 솔루션이 달라집니다. 적당한 솔루션을 골라 빠르게 풀어버리고 넘어가도 괜찮다면, 중요한 문제를 잡지 못한 것입니다. 중요한 문제를 설정했다면(비즈니스와 잘 정렬된 문제를 찾았다면) 성능을 0.01% 올리는 것이 중요해야합니다. 회사의 경영진이든, 연구자든 아래와 같은 질문을 하시는 분들이 종종 있습니다.
제품에 기여하는 AI 조직에서는 한 문제를 깊이 있게 고민할 시간은 부족한 것 아닌가요? 빠르게 되는 방법론 하나 찾아서 적용하고 다음 문제로 넘어가는 게 중요할 것 같아서요.
비즈니스와 잘 정렬된 AI 문제를 찾지 못했기 때문에 이런 말씀을 하시는 것이라 생각합니다. 비즈니스와 잘 정렬된 중요한 문제를 찾지 못했다면 문제 정의부터 제대로 해야 합니다.
솔루션을 만들어냈다면 그 이후엔 결과를 봐야합니다. 학계에서는 벤치마크 데이터 셋에서의 결과를 주로 보지만, 회사에서는 회사의 데이터 셋에서의 오프라인 결과와 새 모델을 실제로 올렸을 때 변화하는 온라인 지표 2가지를 봅니다. 벤치마크 데이터 셋에서의 결과물은 저희 조직에서는 중요하게 생각하지 않습니다.
새 모델을 제품에 올려서 좋은 결과를 만들어 냈다면, 이 모델을 올리면서 진행한 실험을 통해 어떤 도메인 지식을 얻었는지 회고하고 다음 액션은 무엇을 할 지 논의합니다. 이 과정은 결론에 대한 토론과 미래 연구 방향을 제시하는 논문의 파트와 정확히 일치합니다.
Hyperconnect AI 조직은 연구의 전 과정을 테크 스펙의 형태로 기록하고 있습니다. 테크 스펙이 완성되면 이 연구의 결과물을 논문, 특허, 혹은 테크 블로그 등 어떠한 형태로 공개할지 결정합니다. (저희 팀에서 공개하기로 결정된 연구들은 많지만 아직 공개하지 못한 것들이 많습니다.) 당연히 모든 연구가 공개되는 것은 아닙니다. 공개하지 않는 것이 매치그룹에 이득이라고 판단하면 공개하지 않기도 합니다. 혹은 공개하는 파트를 결정해서 일부만 공개하기도 합니다. 회사의 AI 관점에서의 해자는 기술보다는 제품 그 자체나 데이터인 경우가 많기에 제품의 유저들이 역이용할 가능성이 있거나 법적인 문제가 있는게 아니면 적극적으로 공개하는 것을 장려하고 있습니다.
제품에 기여하는 AI 조직에서는 연구가 반드시 필요합니다. 특히, 업계를 리딩하는 제품을 운영하는 회사라면 벤치마크할 회사가 없기 때문에 더 깊이 있는 연구가 필요합니다. 비즈니스와 잘 정렬된 문제를 찾았다면 성능을 극한으로 끌어올리기 위해 연구를 해야 하고, 아직 비즈니스와 잘 정렬된 문제를 못찾았다면 비즈니스와 정렬된 문제를 찾기 위해 연구를 하거나 직관을 통해 좋은 문제를 찾아야 합니다. AI 조직이 성숙해질수록 연구의 비중이 늘어나야 합니다. 현재 Hyperconnect AI 조직은 이 관점에서는 꽤 성숙한 조직이라고 판단합니다. 깊이 있게 문제를 풀고 창의적인 솔루션을 내며 비즈니스 임팩트를 내고 싶은 분들을 모시고 있습니다. 연락주세요!