검색에서 질문으로, 인공지능 리서치

편집부원 강재현, 편집장 정연우, 수습부원 강민수, 수습부원 이상민

by 상경논총
그림 1.png [그림1] LLM 모델의 대표주자인 구글 Gemini와 OpenAI의 ChatGPT (출처: Google, OpenAI)


과거 과제를 할 때 주제 선정부터 결론까지 모두 직접 리서치를 수행하였다. 어떻게 보면 비효율적이었지만, 창작의 고통을 통해 리서치 역량과 작문 능력이 향상되었다. 그러나 지금은 창작의 고통을 생성형 AI가 대신 해주는 시대이다. 내가 주제를 고민하고, 주제와 관련된 내용을 리서치하고, 리서치한 내용을 세련되게 문장으로 녹여내기 보다 AI에게 프롬프트를 더 명확히 제시하는 역량이 중요해졌다.


대학교 1학년때 글쓰기 시간에 10페이지 분량을 쓰기 위해 이틀을 꼬박 투자했다. 지금은, 10페이지 분량의 유사한 글을 쓴다고 할 때 일정 수준의 배경지식만 뒷받침되면 GPT와 함께 2시간, 3시간이면 작성할 수 있다. 생성형 AI가 나타나기 전에는 상상조차 할 수 없는 일이다.


이제, 내가 스스로 검색을 통해 정보를 찾는 시대는 황혼기에 다다랐다. ChatGPT에게, Gemini에게 더 명확한 질문을 제시해야 하는 시대가 시작되었다.


리서치는 이제 포털 검색보다 AI에게 질문 한 줄으로 시작된다. 그렇다면 AI에게 어떤 질문을 해야 할까? 동일한 주제의 질문이라고 해도 질문 방식이 달라지면 AI의 출력 결과가 극적으로 달라진다는 것이 핵심이다. 생성형 AI를 활용한 리서치의 결과는 어떤 프롬프트를 입력하는지에 달려있다. 결국, 이용자의 프롬프트 설계력이 리서치 결과의 질을 좌우하는 것이다. 작은 프롬프트 차이가 AI가 제공하는 정보의 깊이와 정확도, 그리고 구조를 어떻게 바꾸는지 구체적인 사례를 통해 알아보자.


‘한국 경제 전망’이라는 주제를 AI에게 물어보고 싶다고 가정하자. 가장 단순한 방법은 프롬프트에 “한국 경제 전망 알려줘.”라고 입력하는 것이다. 이 경우에 이용자의 프롬프트가 단순하기 때문에 생성형 AI의 종류와 상관없이 구체적인 답변을 기대하기 어렵다. 필자들이 실제로 이 프롬프트를 입력했을 때, ChatGPT와 Gemini 모두 주제와 관련있는 단편적인 정보들을 제공하는 데 그쳤다. 사실 이 정도의 정보는 기존의 포털 검색으로도 충분히 찾을 수 있는 정보이고, 포털 검색에 걸리는 시간을 생성형 AI를 활용하여 크게 아꼈다고 볼 수 없다. 생성형 AI를 제대로 활용하려면 단순한 프롬프트보다는 구체적인 프롬프트를 입력해야 하고, 맥락을 포함하고 역할을 부여하며 조건을 명시하는 구조화된 질문을 할 필요가 있다.


이제부터 앞서 제시한 프롬프트(“한국 경제 전망 알려줘.”)를 개선해 보겠다. 우리의 목표는 구조화된 프롬프트(structured prompt)를 만드는 것이다. 구조화된 프롬프트란 AI가 이해하기 더 쉽게, 목적·조건·절차가 명확히 드러나도록 프롬프트를 틀에 맞게 작성하는 것을 말한다. 현재의 AI는 인간보다 문맥을 추론하는 능력이 제한적이기 때문에 이용자의 요청을 역할-목표-조건-출력 형식과 같이 구조화해주면 이용자가 원하는 방향으로 정확하게 답할 확률이 높아진다. 기존의 프롬프트를 개선하여 “2025 한국 경제 전망을 성장률·물가·금리·환율·대외 리스크로 나눠서 bullet으로 요약해줘.”라는 프롬프트를 입력했다면, 구조화된 프롬프트를 입력한 것일까?


이 프롬프트는 기존의 것보다 구체화되었고 출력 형식의 구조화를 제시하였다. 프롬프트를 입력받은 AI도 이용자가 지정한 5가지 항목을 bullet 형식으로 정리해주기 때문에 이전의 출력과는 차이가 존재한다. 이전의 출력은 포털 검색과 큰 차이가 없는 개념들과 수치의 나열이었다면, 이번의 출력은 바로 갖다 쓸 정도는 아니지만 어느정도 현황을 알려주는 보고서의 형식을 갖추었다. 포털 검색을 통해 정보를 수집했다면, 5가지 항목 각각에 대해 검색하고 여러 출처들로부터 온 정보들을 스스로 수합해야 했을 것이다. 하지만, 생성형 AI에 한 번 구조화된 프롬프트를 입력하면 걸리는 시간이 크게 줄어든다. 정보 수집부터 수합 및 정리까지 생성형 AI가 대신 해주기 때문이다.


아래와 같이 지금보다 더 구체적이고 더 구조화된 프롬프트를 구상할 수도 있다.


그림.png


이 프롬프트에는 구조화된 프롬프트의 핵심 구성요소가 대부분 들어가 있다. 먼저 KDI 연구원이라는 ‘역할’을 지정했는데, 이는 답변의 톤, 관점, 깊이를 조정하고 특정 분야의 사고방식을 모방하도록 유도하여 불필요한 설명을 줄이고 핵심만 답하게 만든다. 다음으로 2025 한국 경제 전망을 분석 보고서로 작성하는 ‘목표’를 제시했다. 이는 이 프롬프트의 최종 목적이 무엇인지 명시하여 전체 응답의 방향성을 결정하고 과도한 서술이나 엉뚱한 요약을 방지한다. 그리고 IMF·OECD·KDI 자료를 기반으로 하고 각 단락마다 출처를 포함하게 하여 구체적인 ‘제약 조건’을 제시했다. 이용자의 의도에 부합하게 AI가 반드시 지켜야 하는 사항들을 지정한 것이다. 마지막으로 6단락 분석 보고서, 마지막에 대안 시나리오 2개 제시처럼 ‘출력 형식’을 정해준다. 결과가 어떤 형태로 나오길 원하는지 구체적인 구조를 제시함으로써 의도에 더 가까운 출력을 얻을 수 있다. 이외에도 배경 정보나 상황을 제공하는 ‘맥락’을 통해 AI가 문제를 잘못 해석하는 오류를 줄일 수 있고, AI가 해야 할 행동, 분석, 생성 작업 등을 구체적으로 지시하는 ‘작업 설명’을 언급하면서 작업 결과를 더 정확하게 제어할 수도 있다.


이렇게 구조화된 프롬프트에 다양한 구성요소를 추가할수록 출력값의 정확성·일관성·재현성·제어 가능성이 올라간다. 우리가 궁금한 ‘한국 경제 전망’이라는 주제에 대한 답변도 잘 구조화된 프롬프트를 통해 물어보면, 깊이 있는 답변을 얻어낼 수 있는 것이다. 지금까지 프롬프트의 구조적인 차이가 어떻게 답변의 깊이와 정확도를 결정하는지를 알아보았다. 그런데 한 가지 의문이 들 수도 있다. 구조화된 프롬프트를 가장 잘 이해하는 생성형 AI는 무엇일까?


이제 ChatGPT와 Gemini를 비교할 때에는 단순히 어떤 것이 성능이 더 좋다, 나쁘다로 비교하는 것은 큰 의미가 없다. 실제 업무나 리서치에서 활용할 때 중요한 것은 ‘같은 프롬프트를 던졌을 때, 두 AI가 어떻게 다르게 해석하고 응답하는가’ 이다. 동일한 프롬프트가 주어젔을 때 두 AI가 해석하는 결과를 비교한다면, 각 AI가 어떤 능력에 더 특화되어 있는지를 알 수 있기 때문이다. 그리고 각자가 어떤 능력에 더 특화되어 있는지를 알게 되면 우리는 AI를 상황과 필요에 맞게 효율적으로 사용할 수 있다.


우선 두 AI에게 동일하게 입력한 프롬프트는 “한국 경제 전망 알려줘.”이다.


먼저 ChatGPT의 경우, ‘한국 경제 전망’이라는 넓은 범위의 개념을 성장률, 고용, 물가, 수출, 리스크 등의 개념으로 세분화하여 글의 기본 구조를 형성한다. 글의 구조 또한 위 개념들을 중심으로 서술형 형식의 체계를 갖추고 있으며, 각 문단의 분량도 비슷하게 제공되기 때문에 글의 구조가 굉장히 정리되어 있다는 인상을 받을 수 있다.


반면 Gemini의 경우, ‘한국 경제 전망’ 이라는 주제를 GPT처럼 세분화한다기보다는, 공신력 있는 기관들이 최근에 발표한 숫자나 데이터들을 인용하는 방식으로 답변을 제공한다. 답변을 제공한 날짜의 가장 GDP 수치를 반영하여 글을 만든다는 점, 그리고 KDI·IMF·OECD·한국은행 등이 발표한 실시간 최신 데이터를 인용한 점에서 알 수 있듯이 Gemini는 GPT에 비해 훨씬 더 최신의 정보를 제공하는 데에 능숙하다. 또한 기관들의 공식적인 최신자료 뿐 아니라 최근 뉴스를 기반으로 답변의 내용을 업데이트하기 때문에 글의 내용에 시사성을 갖추기 위해 Gemini가 제공하는 자료나 데이터를 참고하면 보다 Gemini를 더 효율적으로 사용할 수 있다.


이번에는 두 AI에게 “성장률·물가·금리·환율·대외 리스크 bullet로 요약”이라는 프롬프트를 입력했다.


우선 ChatGPT의 경우, 사용자가 지정한 5개의 항목을 정확하게 bullet로 나누었고, 각 bullet 안에서도 하위 bullet을 균형 있게 구성하여 전체적인 답변의 구조를 간결하게 정리했다. 따라서 글의 구조가 전체적으로 매우 안정적이며, 사용자가 제시한 프롬프트에 알맞게 구조에 충실한 답변을 제공한다는 점을 알 수 있다.


반면 Gemini는 bullet의 형식을 따르긴 하지만 형식적인 보고서의 구조를 따르기보다는 최신 데이터를 기반으로 하는 현황 보고 스타일에 맞춰졌다. 답변에서도 2025년 11월 기준 데이터를 기반으로 답변 내용을 제공한다는 점을 명시한다는 점에서, Gemini는 가장 최신 발표 내용에 맞춰진 정보를 전달한다는 것을 알 수 있다. 그러나 답변의 전체적인 구조는 ChatGPT보다 덜 정제되었다.


마지막으로는 훨씬 구체적인 프롬프트로 두 AI의 차이를 살펴보았다. 이번에 두 AI에게 동일하게 입력한 프롬프트는 “너는 KDI 연구원이다. 6단락 정책 보고서를 작성하고, 각 단락에 출처를 포함하라”이다.


먼저 ChatGPT의 경우, 글의 전체적인 구조와 형식의 일관성이 매우 돋보인다. 우선 프롬프트의 요구대로 글을 정확히 6개의 단락으로 구성하고, 각 단락의 분량 또한 거의 동일하다. 또한 각 단락에는 “IMF(2024), OECD(2024)”처럼 형식적으로 정리된 출처를 표기하고 있으며, 마지막에는 대안 시나리오를 제시하는 등 전형적인 정책 보고서의 구조와 매우 유사한 것을 알 수 있다. 즉, ChatGPT는 주어진 프롬프트의 구조를 충실히 따르는 답변을 제공하는 데에 능숙하다.


반면 Gemini의 경우, ChatGPT와 다르게 글의 구조나 형식의 일관성이 상대적으로 부족하다. 프롬프트가 제시한 6개의 단락이라는 형식을 갖추긴 하지만, 각 단락의 분량에 큰 차이가 있으며 글의 구조 또한 GPT에 비해 덜 정돈되어 있기 때문에 형식 측면에서는 ChatGPT에 비해 아쉬운 모습을 보인다.


그러나 위에서 확인했다시피 Gemini가 강점을 보이는 지점은 정보의 최신성이다. 출처를 명시할 때, 단순한 형식적 인용이 아니라 기관들의 최신 발표를 실시간으로 반영해 작성한다. 예를 들어 KDI의 11월 경제전망, IMF WEO의 최신 발표 등 GPT보다 최신 정보를 찾는 데에 더 능숙한 모습을 보인다. 따라서 정확한 형식을 갖춘 보고서를 작성한다기보다는, 가장 실시간의 정보를 제공하여 보다 뛰어난 시사성을 가진 보고서를 작성하는 데에 특화되어있다는 것을 알 수 있다.


따라서 이제 AI를 활용한 리서치에서 도구 선택보다 중요한 것은, 프롬프트를 어떻게 조정해서 각 AI로부터 최선의 답변을 유도하는지다. ChatGPT같은 경우에는 정해진 역할이나 형식 내에서 서술형 기반의 구조화된 답변을 제공하는 데에 최적화되어있다. 따라서 형식이나 구조가 어느정도 완결된 상태의 글로 구성된 답변이 필요하거나 형식에 충실한 답변이 필요하다면 ChatGPT를 사용하고, 최신 뉴스와 데이터를 기반으로 답변의 내용과 근거 및 시사성을 풍부하게 추가하려면 Gemini를 적재적소에 활용함으로서 프롬프트 조정을 통해 사용자가 원하는 답변을 얻을 수 있다.


생성형 AI의 확산은 리서치 방식 자체를 바꾸어 놓았다. 이제 정보의 양보다 중요한 것은 어떤 프롬프트를 어떻게 설계하느냐이며, 동일한 질문이라도 구조화의 정도에 따라 답변의 깊이와 방향이 크게 달라진다는 사실이 확인되었다. 단순한 질의는 피상적인 설명을 불러오기 쉽지만, 역할, 조건, 출력 형식을 명확히 제시한 구조화된 프롬프트는 훨씬 높은 정확성과 일관성을 보여준다. 이는 리서치 과정에서 ‘질문 설계력’이 핵심 역량으로 자리 잡고 있음을 의미한다.


앞으로의 리서치는 이러한 방향 위에서 크게 재편될 것이다. 기술 자체의 성능보다 프롬프트 설계 능력과 모델 활용 전략이 리서치의 성패를 좌우할 것이며, 상황에 따라 적절한 AI 모델을 선택해 조합하는 역량 역시 필수 요소가 된다. 생성형 AI가 리서치의 많은 단계를 자동화하더라도, 질문을 정의하고 문제를 구조화하는 책임은 여전히 인간에게 남아 있기 때문이다.


AI가 보편화되는 환경에서 우리는 어떻게 더 효과적으로 이 도구들을 활용할지 계속 고민하게 될 것이다. 이 글이 그 변화 속에서 방향을 잡는 데 참고가 되기를 바란다.

이전 15화한미 관세 협상, 이익과 안보의 줄다리기