brunch

라이킷 19 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by being cognitive Jun 05. 2024

2024 AI 키워드, Agentic Workflow

에이전트 기반 워크플로우, 그리고 Image-to-Music

[ 2024 AI 키워드 중 하나인 Agentic Workflow에 대해서 알아봅시다~]

올해 Andrew Ng교수님이 주로 말씀하시는 키워드가 Agentic Workflow인데요,
최근 deeplearning.ai에 관련 short-course들이 올라왔기에, 수강하면서 느낀점들을 까먹기 전에 공유하고,

여기에 영감을 받아서 후다닥 만든 Image-to-Music 사례도 공유해보고자 합니다.

0. 배경 : 백스페이스를 한번도 쓰지 않고 글을 쓰는 LLM

Andrew Ng 교수님이 "Agentic Workflow" 설명할 때 사용하는 비유가 있는데요,

현재의 LLM이 글을 쓰는 방식은, 사람으로 치면 백스페이스를 한번도 누르지 않고 에세이를 작성하는 것과 같다고 표현합니다. (Auto-regression을 쉽게 표현하시려 한 것.)

(*물론 LLM은 백스페이스 없이 일필휘지로 써야만하는 제약 조건에도 불구하고 제법 잘 동작하긴 하지만) 이러한 제약으로 인해, Prompt Engineering에 아무리 공을 들여도 결과물이 아쉬울 때가 많이 있습니다.

앞으로 계속 빠른 속도로 기술이 발전하면서 모든 면에서 성능이 좋아지겠지만, AGI가 단일 모델로 나올 때까지 기다리는 것 대신에, 지금 수준의 AI로도 여러 AI를 조합하여 Agentic Workflow (에이전트 기반 워크플로우)를 사용함으로써 우리가 기대하는 성과를 내보자는 취지입니다.

(* 이는 작년에 센세이셔널한 반향을 일으켰던 AutoGPT, HuggingGPT등의 연장선에 놓여있다고 생각합니다.)

1. Agentic Workflow란 무엇인가?

위에 설명한대로, 하나의 AI에게 한번의 결과를 기대하는 대신에,

"여러" 역할로 정의된 AI"들"을 바탕으로 워크플로우를 구성해서, 그 협동의 결과를 얻어내는 방식을 의미합니다.

e.g. "AI가 음악산업에 미칠 영향에 대해서 글을 쓴다"라는 Task가 있다면,

[ A. 전체 관리자 AI Agent ] --> [ B. Writer AI ] <-> [ C. Critic AI ] 와 같이 구분된 역할을 부여하여,

사람은 태스크를 A.에게만 지정하면, A는 계획을 세워서 B에게 작업을 시키고, B는 C에게 리뷰 의견을 구하고, B가 재작성하면, A가 그 전체 품질을 다시 평가하는 방식이 되어, AI로 팀 하나를 꾸려서 일을 진행시킬 수 있게 되는 것이죠.