brunch

You can make anything
by writing

C.S.Lewis

by 게으른 개발자 Jun 07. 2024

멀티모달의 시대에 대비해야 할 자세

기계만 멀티모달이 될 순 없죠

알파고와 이세돌의 바둑 경기, 그 후 바둑 시장은 어떻게 되었을까요. 그렇다면 지금은 어떤 시대에 와 있고, 앞으로는 어떻게 될까요?



2016년, 전 세계는 알파고와 이세돌 9단의 바둑 대국에 열광했습니다. 이 대국은 인공 지능과 인간 지능의 경쟁을 보여주며 바둑 시장과 인공지능 분야에 큰 변화를 가져왔습니다. 


알파고와 이세돌의 대국 이후 바둑 시장은 기술 발전과 함께 빠르게 변화하고 있습니다. 전통적인 바둑 기사들은 새로운 전략과 기술을 배우기 위해 AI에 의지하고 있으며, 경기뿐만 아니라 연구와 훈련에도 AI를 적극적으로 도입하고 있습니다. 또한, AI의 발전으로 바둑 시장은 전 세계적으로 주목받으며 바둑의 인기가 급증하고 있습니다.


하지만 알파고와 이세돌의 대국이 바둑 시장에 미친 영향은 바둑 시장을 넘어섰습니다. 이 대국은 인공지능의 잠재력을 보여준 전환점이 되었고, 이후 다양한 분야에서 활용되고 있습니다. 이를 계기로 AI 산업은 빠르게 성장했습니다.



그리고 2022년 겨울 등장한 것이 바로 LLM(Large Language Model). 즉 채팅으로 사람처럼 대답을 해주는 ChatGPT입니다(이후로는 이러한 종류를 모두 통틀어 LLM이라고 하겠습니다).


궁금한 것을 물어보면 대답해 주고 환상(진실이 아닌데도 그럴싸하게 지어내는 현상)이라는 단점이 존재했지만 OpenAI에서는 계속된 발전을 거듭해 그 단점을 최소화했습니다.


그리고 이제는 멀티 모달의 시대가 왔습니다. 이전처럼 텍스트로 대화하는 것이 아닌 음성을 인식하고, 이미지 파일을 분석합니다. 이제는 이 인공지능은 거대한 자동사전처럼 변했습니다.


과거처럼 검색어를 입력하고 원하는 결과물이 나올 때까지 링크를 하나씩 눌러보는 것이 아닌, 원하는 결과물을 잘 정리해서 전달해 줍니다.


그래서 어떤 사람들은 앞으로 이러한 기술이 일자리를 뺏어갈 것이라고 이야기합니다.


이 말이 완전한 사실은 아닙니다. 만능처럼 보이는 LLM 도 한계는 분명 있습니다. 그렇지만 이들이 가지는 장점 역시 무시할 수 없을 것입니다. 


지난번에는 LLM을 잘 다루는 방법에 대해 소개했다면 이번엔 LLM에 대해서 파악해 보고 우리가 어떤 자세를 취해야 하는지 살펴보도록 하겠습니다.


인간과 LLM 공통의 어려움

그러려면 이미 많이 겪으셨던 문제부터 생각해 봐야 합니다. 먼저 인간은 백지에서 새로운 걸 창조하는 것을 어려워합니다.


그리고 이것은 LLM 역시 마찬가지입니다. 우리는 늘 문제를 해결할 때 몇 가지 단계를 거칩니다. 그런데 그 단계를 잊어버리곤 합니다. 다음은 우리가 자주 잊어버리는 문제 해결의 단계입니다.


문제 발생 - 원인 파악 - 자료 조사 - 실행 - 문제 해결 여부 파악


여기서 LLM의 도움을 받는 부분은 어디일까요? 바로 원인 파악과 자료 조사입니다. 이 부분만 해도 엄청난 도움을 받는 것입니다. 하지만 우리는 나머지 부분을 과소평가하는 경향이 있습니다.


'문제'가 무엇인지 확인하고 해결하기 위한 시도를 하고 결과가 어떤지 알아내야 하는 것은 온전히 인간의 몫입니다. 이 부분이 바로 아직까지 LLM이 할 수 없고 앞으로도 넘어야 할 큰 산인 것입니다.


자신이 해결해야 할 어떤 과제가 있는지 생각하고, 그 과제를 어떻게 해결해야 할지 물어보는 것이 LLM의 시작이듯이 이 "과제"를 생각하는 것은, 즉 "질문"을 던진다는 것은 생각보다 어려운 일입니다.


우리가 '일'을 하는 이유

일을 하는 이유는 무엇인가요?


'돈을 벌기 위해서'가 가장 먼저 떠오르시나요? 물론 이것도 맞는 말입니다. 그렇지만 조금 더 깊이 있게 생각해 봅시다. 그럼 돈은 왜 벌려고 하는 것인가요?


단순히 먹고살기 위함은 아닙니다. 이것은 기본적인 의식주의 해결과 함께 우리의 기본적인 욕구, 그리고 자아실현까지 하기 위한 길고 지루한 과정을 어떻게든 해나가기 위해 돈을 벌고 있는 것입니다.


당장의 현실이 그렇지 않더라도 언젠가는 그곳에 다다르고 싶다는 생각과 함께요.


그럼 이번엔 좁은 범위에서 생각해 봅시다. 무슨 일을 어떻게 하고 계신가요?


대부분의 경우는 혼자서 다양한 분야의 일을 하고 있는 것이 아닌 각자가 가진 재능을 발휘해서 전문적인 한 가지의 일을 하고 있을 가능성이 높습니다. 그것은 저 또한 마찬가지입니다.


그리고 그렇게 '일'을 하는 이유는 그러한 방식이 지금까지는 잘 유지되어 왔고 효율적이기 때문이었습니다. 사람들은 꽤 다양한 모습을 가지고 있고 제각기 가지고 있는 재능이 모두 다릅니다.


그리고 여기서 인공지능의 '도움'을 받는 사람의 범위가 넓어지기 시작합니다. 좁은 범위와 넓은 범위의 일이 이제는 조금씩 흔들리기 시작할 때가 되었습니다.


사고의 확장

이번엔 일이 어떻게 동작하는지 살펴보겠습니다. 저는 개발자이니 쇼핑몰을 운영하는 한 회사가 있다고 생각해 보겠습니다.


쇼핑몰은 아래의 그림처럼 여러 분야에 거쳐 운영됩니다.


쇼핑몰 회사의 대략적인 구조도


이것은 생략이 많은 아주 대략적인 구조도이며 이 외에도 인사 관리 등 회사가 커지면 커질수록 굉장히 많은 업무 분야가 생기게 됩니다. 특히 상하에 대한 개념은 운영하는 회사마다 그리고 어떤 사업을 목표로 하느냐에 따라 다르므로 너무 구조도를 깊게 보실 필요는 없습니다. 예를 들어서 웹디자인의 경우 디자인 파트가 분리되어 있는 경우도 많습니다.


회사의 규모가 작을수록 한 사람이 여러 일을 맡아서 하게 되며 규모카 클수록 더 많은 가지들이 생겨나며 각각의 분야에서 업무를 하게 됩니다.


그럼 사고의 확장은 무엇일까요? 이제 이 LLM과 멀티 모달의 도움을 통해 사람들은 곧 "자신이 아는" 분야의 업무량이 늘어날 수도 있습니다. 즉 이 구조도에서라면 운영, 기획, 개발의 세 사람만으로 구성될 수 있다는 것입니다.


하위의 업무는 상위로 통합될 수 있습니다.


대체 왜 이런 일이 벌어질까요?


사고의 확장이란 우리가 이미 알고 있는 부분부터 지식을 얻기 때문입니다. 발전될 LLM일수록 우리는 "인공지능아 네가 스스로 해봐"가 아닌 인간에게 더 좋은 교육자가 될 가능성이 높습니다.


왜냐하면 아무리 품질 좋은 결과라도 방향만큼은 사람이 지도해줘야 하며 이것은 아직 인공지능이 스스로 할 수 없기 때문입니다. 그리고 그런 일들이 반복될수록 각 부서의 업무를 담당하던 사람들은 마치 스스로가 관리자가 되면서 인공지능을 컨트롤하는 모양새가 될 것입니다.


그런데 사고의 확장 이란 말답게 자신의 파트가 아닌 전혀 모르는 사람들의 경우에는 이 인공지능을 다룰 수 없습니다. 최소한 그 분야의 업무가 어떻게 돌아가는지 이해하기 전까지는요. 그렇기 때문에 아직은 인공지능이 일자리를 대체할 수는 없습니다.


그러나 인공지능을 사용하지 않는 사람은 대체될 가능성이 높습니다... 안타깝지만 이 부분이 직업이 사라지는 분야에서 가장 먼저 일어나는 일일 거라고 장담할 수 있습니다.


결국 인간도 멀티모달이 되어야

결국 인공지능을 사용하는 사람들은 자신의 업무 분야 외에 더 많은 분야를 배워야 할 것 같습니다. 어차피 아예 모르는 분야를 배우는 것이 아닌 자기 자신이 하던 것에서 더 확장(사고의 확장)되는 것이기 때문에 시작하기가 어렵지는 않을 것입니다.


이제 다시 '일'을 하는 이유에 대해서 돌아와 볼까요? 우리가 일을 하는 이유는 결국 자기 자신의 자아실현에 도움이 되는 수단으로써 사용하고 있는 것입니다. 


결국 지금의 일자리 위협 걱정은 생각보다 복잡한 것이 아닌 지금의 구조에서 인공지능을 그 수단으로 하나 더 끼워 넣는 것뿐입니다. 물론 이게 더 편하고 쉬운 길이라고는 이야기하지 않겠습니다. 산업 혁명을 생각해 보면 사람들은 더 쉴 수 있던 것이 아닌 더 바빠졌을 뿐이기 때문입니다.


개발자와 LLM

제가 개발자이므로 이쪽 분야에 대해서 조금만 사족을 더 붙여보겠습니다. 사실 굉장히 복잡한 문제에 대해서는 인공지능도 해결을 하지 못합니다. 그렇기에 저는 오늘 이러한 글을 써 볼 수 있었습니다.


예를 들어 개발적으로 이러한 질문은 우리도 결과물에 놀랍고 만족하면서 인공지능도 잘 해낼 수 있습니다.


"국가 코드가 포함된 휴대전화 번호를 제거하고 하이픈 역시 제외해 주는 파이썬 코드를 만들어줘. 예를 들어 +82-10-1234-5678은 01012345678이 되어야 해"


이렇게 예시를 들어주면 사실상 오해의 소지가 더 줄어들기 때문에 거의 문제가 발생하지 않습니다. 그러나 아래와 같은 질문에 대해서는 정답을 제시하지 못합니다.


"현재 진행 중인 프로젝트를 마이크로 서비스 아키텍처로 변환하는 것을 고민하고 있어. 그중에서도 트랜잭션을 어떻게 처리해야 할지 좋은 방법이 있다면 알려줘"


사실 이 부분에 대해 조금 아시는 분들이면 눈치를 챘을 수 있습니다. 위와 같은 질문은 정답이 없습니다. 이러한 류의 질문은 수준이 높은 LLM 인 경우 굉장히 많은 해결책을 제시합니다. 그럼 다음 단계는 어떻게 해야 할까요?


각각의 해결 방법에 대해서 학습해야 합니다. 학습 없이는 그러한 업무 방향성을 고려해야 하는 부분에서 섣불리 시도할 수 없기 때문입니다. 그리고 그러한 부분은 사실은 스스로 정답을 알아낼 때까지 LLM에 질문할 수 없습니다.


역설인 것이죠.


LLM 은 결국 질문자가 아는 부분에 대해서만 대답하는 것입니다. 모르는 부분은 질문을 하지 못하므로 질문할 수 없습니다. 


그렇기 때문에 개발자는 LLM의 도움을 받아 새로운 키워드에 대한 정보를 얻고 그것을 학습하고 방향을 결정해야 합니다.


그리고 그러한 것을 반복하다 보면 어느새 자신의 사고도 확장되어 있다는 것을 느낄 것입니다. 예전에는 이 분야밖에 못했는데 조금만 더 잘 다듬어서 물어보면 이 부분도 할 수 있겠는데? 하는 자신감이 생기는 것입니다.


시간이 지날수록 이렇게 되는 개발자는 점점 늘어날 것이고, 이 분야 외에도 다른 분야 역시 마찬가지로 자신의 할 수 있는 업무 범위가 늘어나게 될 것입니다. 그리고 그런 사람들에게 뒤처지지 않으려면 결국은 또 끊임없는 공부를 해야 할 것 같습니다..


결국 경쟁의 대상은 인공지능이 아닌 사람입니다.













브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari