반복 테스트를 넘어, 추론하는 QA

nunu.ai 사례로 본 AI 에이전트의 등장

Oct 10. 2025

AI 에이전트의 등장

1. QA와 AI의 만남

게임 QA는 반복적이고 시간이 많이 드는 업무가 많다. 최종 버전 빌드를 배포하기 전에 매번 동일하게 수행하는 Sanity와 같은 테스트는 QA라면 누구나 해본 경험일 것이다.
전통적으로 자동화 테스트는 스크립트를 기반으로 했지만, 스크립트는 UI가 조금만 바뀌어도 깨지고 유지보수가 어렵다는 문제가 있었다. 최근에는 대규모 언어모델(LLM)과 비전 인식 기술을 결합한 AI 에이전트가 이런 문제를 해결할 수 있는 대안으로 주목받고 있다. 나도 최근 모 콘퍼런스에서 해당 ai를 듣고 조사하여 여기 소개글은 남긴다.

2. nunu.ai 기업 소개

해당 기업 소개에 따르면, nunu.ai는 모든 게임을 테스트하고 플레이하도록 특별히 설계된 최초의 다중 모드 AI 에이전트를 개발하여 게임 분야에서 인공지능을 적용하여 해당 산업 최전선에 나서겠다는 포부를 가지고 있다.

해당 회사의 사명은 품질 보증(QA) 초기 단계부터 복잡한 실시간 플레이어 시뮬레이션 및 협력 과정에 이르기까지 첨단 AI를 통합하여 게임 경험과 개발 프로세스에 혁신을 가져오는 것이라고 표현한다. 가상 세계에서 플레이어 경험을 증강하는 에이전트를 개발하는 것이 자신들의 목표라고 전달한다.

nunu.ai는 게임 산업을 새로운 차원으로 끌어올려 더욱 풍부하고 몰입감 넘치며 완벽하게 제작된 가상 경험을 제공하는 데 전념한다. 게임에서 AGI(Aggregation-In-Global Intelligence)를 향한 발판을 마련하고자 한다며 소개를 마친다. 자세한 건 글 말미에 있는 홈페이지를 참고하는 것을 추천한다.

3. 현재 제공되는 기능

그렇다면 현재까지 제공되는 기능은 무엇이 있을지 알아보겠다. 우선 가장 큰 특징은 "자연어 사용"이다. 사용자가 명령어를 자연어로 사용하면 AI 에이전트가 해당 행위를 사용한다는 것이다. 예를 들어 "튜토리얼 완료"를 프롬프트로 사용하면, 해당 AI가 게임의 튜토리얼을 완료시킨다. 놀라운 점은 별도로 사전에 입력한 내용이나 스크립트가 없어도 동작한다고 전한다. 첨부된 영상이나 홈페이지 내용으로 미뤄보면 에이전트는 화면을 보고 판단해 마우스·키보드·컨트롤러 입력을 실행하는 것으로 보인다. 사실상 인간 QA 없이 AI가 그 역할을 수행했다. 다만, 현시점에서는 완전히 자유롭게 테스트한다기보다 체크리스트를 만들어서 기본적인 행동의 방향은 알려줘야 한다. 그럼에도 테스트 과정에서의 추론, 입력 로그, 실패 원인을 분석한 결과를 제공하는 수준에 있다고 하니 무섭지 않을 수 없다.

4. 실제 적용 사례

해당 회사에서 제공하는 유튜브에는 호그와트 레거시를 활용한 알파 테스트 영상이 있다. 아래 링크에 있고 튜토리얼은 약 30분에 걸쳐 완료했다고 한다. (영상 자체는 30분이 아니다.) 다만 중간중간에 캐릭터가 NPC 주변을 어색하게 돌거나 이상한 경로로 가기도 한다.

5. QA에 도움 될 실질적인 것

사실 수년 전부터 자동화 테스트는 QA 업무에 점점 큰 영역을 차지하고 있었다. 그러나 이것은 단순한 작업 또는 UI 변경이 크지 않는 영역 등 다소 제한적인 환경에서 활용되었다. 그러나 AI 에이전트가 등장함으로써 이 범위가 더 확대될 수 있게 되었다. 물론 해당 회사 ai 및 기술이 어느 정도까지 실제로 동작하는지는 알 수 없다. 다만 산업이 가는 방향을 이를 통해 볼 수 있었다. 이러한 기술 덕분에 QA 인력이 더 창의적이고 탐색적인 테스트에 더더욱 집중할 수 있게 될 것이다.

6. 한계와 리스크

놀라운 수준의 기술이지만 아직은 한계와 리스크가 클 것이라고 본다. 우선 게임은 여러 장르로 정의될 수 있지만 그 종류나 형태가 너무 다양해서 범용성이 떨어질 가능성이 높다. 장르마다 기본적인 UX 틀은 있겠지만 모두가 동일하게 동작하지는 않는다. UI 종류도 그만큼 많고 세부 규칙도 다르다. 또한 플랫폼 측면도 살펴볼 수 있다. PC와 모바일, 콘솔도 있고 그 사이에 크로스 플랫폼을 제공하는 게임들도 있다. 이 형태를 모두 커버가 가능할지는 지켜볼 일이다. 또한 테스트는 필히 보안을 염두해야 한다. 게임 회사의 가장 큰 재산이 게임인 만큼 사전에 유출되거나 어떠한 방식으로도 AI에 학습이 되는 걸 감안할 회사는 많지 않을 것이다. 끝으로 실질적인 효과가 얼마나 있을 것인가는 검증해봐야 한다. 실제 업무 시간을 얼마나 줄여줄지, 그 줄여주는 시간만큼 테스트 결과를 신뢰할 수 있을지 확인이 필요하다. 기존 자동화 테스트에 유지, 보수 시간이 과도하게 들어가면 '그 시간에 내가 하면 더 빠르다.'와 같은 딜레마가 발생한다. AI 에이전트를 사용한다고 해도 이와 같은 상황이 나타날 수 있다.

7.AI와 QA의 현재 위치

AI는 이미 QA 업무의 일부를 실질적으로 대체할 수 있는 단계에 도달했다. 개발의 영역을 물론 QA까지 말이다. nunu.ai 같은 회사들이 보여주는 사례는 “반복과 확장”은 AI에게 맡기고, “창의적 탐색과 품질 판단”은 사람 QA가 맡는 새로운 협업 모델을 예고하고 있다.

QA는 사라지지 않는다. 오히려 AI를 활용할 줄 아는 QA가 앞으로 더 중요한 역할을 맡게 될 것이다. 실제 프로젝트에서 자동화 스크립트 유지보수에 쏟은 시간이 떠올랐다. nunu.ai 같은 시도가 바로 그 피로를 덜어줄 수 있을까? QA로서 기대와 경계가 동시에 든다.

<출처: https://nunu.ai/>

<유튜브: https://youtu.be/GHgmBQAy-yI? si=mCfUPanUAEY04 Th2>

keyword

Brunch Book 금, 토, 일 연재

연재 버그를 찾아서

전체 목차 보기

이전 05화사람이 아닌 버그에 대한 냉소버그의 도서관에서 우린 무엇을 봤을까다음 07화