아직 좀 애매하게 똑똑하긴 하다.
AI가 놀라울 정도로 똑똑해졌다는 이야기, 엄청나게 빠르게 발전하고 있다는 이야기는 유튜브를 통해서 엄청나게 많이 들을 수 있다. 그런데 막상 ChatGPT를 켜보고 질문 이것저것 해보고 나면 큰 도움 안 되는 답변만 한다.
모든 사람에게 AI가 큰 도움이 되려면 어떻게 되어야 할까? 뻔한 대답이 아닌 전문가적인 대답을 하고 결과에 대해 책임을 질 수 있어야 할 것이다. 내가 직접 하거나 전문가를 고용해서 하는 것보다 더 좋은 답을 해 주어야 할 것이다. 그렇지만 지금은 교묘하게 AI가 할 수 있는 것과 잘 못하는 것을 파악해서 어렵게 어렵게 써야 하는 상황이다.
자율주행을 예로 들어보자.
70%의 경우에 완벽하게 자율 주행을 하고 30%의 경우 실수를 하는 자율 주행차는 웬만한 사람들은 이용하기 힘들다. 모든 케이스를 실험해 보고 어떤 경우에 실수를 하는지를 파악하고, 안전하다고 검증된 경우에만 활용해야 하는데 일반인에게는 "차라리 내가 하고 말지"의 영역에 들어간다. 결국 전문가만, 쓸 줄 아는 사람만 쓰게 된다.
97%의 정확도로 작동하는 자율 주행 자동차는 어느 정도 AI를 파악하고 신뢰할 수 있는 사람은 자유롭게 활용할 수 있다. 적은 수의 AI가 잘 못하는 영역만 파악하면 된다. 그렇지만 이 경우에도 얼리어답터들만 쓸 수 있을 것이다. 그리고 잘 쓰는 사람은 운전을 거의 하지 않는 삶을 살게 될 것이다.
100% 자율 주행차가 나오면 이는 안 쓰는 사람이 오히려 위험한 운전자인 상태가 된다. 모든 사람들이 실수를 안 하고 표준적인 방법으로 운전을 하는데, 사람이 운전하는 차만 이상한 짓을 할 것이다.
지금 ChatGPT를 비롯한 AI는 70%~80%의 경우에 좋은 대답을 하는 상태라고 할 수 있다. 전문적으로 AI의 능력을 시험하는 사람, 시간과 노력을 들여서 AI를 활용법과 프롬프트 꼼수들을 만들어낸 사람만 잘 쓸 수 있는 상황이다.
최근 Google Deepmind의 논문 Levels of AGI: Operationalizing Progress on the Path to AGI (https://arxiv.org/pdf/2311.02462.pdf)에서 일반 인공지능 레벨을 0~5 레벨로 정의하였다.
레벨 0: No AGI: 인간 중심 컴퓨팅, 예를 들어 아마존 메카니컬 터크와 같은 플랫폼.
레벨 1: 초기 AGI: ChatGPT, Bard, Llama 2와 같은 진화하는 AI 시스템.
레벨 2: 유능한 AGI: 아직 달성되지 않음.
레벨 3: 전문가급 AGI: 아직 달성되지 않음.
레벨 4: 거장급 AGI: 아직 달성되지 않음.
레벨 5: 인공 초지능 (ASI: Artificial Super Intelligence): 아직 달성되지 않음.
일반 인공 지능(AGI)의 레벨은 아직 레벨 1에 머물러 있다. 아직 갈 길이 엄청 멀고, 뛰어난 AGI는 아니라는 뜻이다. 그리고 이 논문에는 하나의 표가 더 있다. 바로 각 레벨에 따라 사람과 인공지능이 어떻게 상호작용을 할 수 있는지에 대한 이야기이다.
자율성 레벨 0: No AI
인간이 모든 작업 수행
예시: 종이에 연필로 스케치, 텍스트 에디터로 타이핑
위험: 없음 (기존 위험)
자율성 레벨 1: AI 도구로 사용
인간이 작업을 완전히 제어하며 AI를 이용해 단순 작업 자동화
예시: 검색 엔진을 이용한 정보 탐색, 문법 검사 프로그램 이용
위험: 기술 의존, 산업 변화
자율성 레벨 2: AI 컨설턴트 - We're here.
AI가 중요한 역할을 하지만 인간의 호출 시에만 활동
예시: 문서 요약을 위한 언어 모델 사용, 코드 생성 모델을 이용한 프로그래밍 가속화
위험: 과신, 급진화, 표적 조작
자율성 레벨 3: AI 동료
인간과 AI의 동등한 협력, 목표와 작업의 상호 조정
예시: 체스 AI와의 상호작용을 통한 훈련, AI 생성 인물과의 사회적 상호작용
위험: 인간화(예: 패러소셜 관계), 사회적 변화
자율성 레벨 4: AI 전문가
AI가 상호작용을 주도하고 인간은 지도 및 피드백을 제공
예시: AI를 이용한 과학적 발견(예: 단백질 접힘)
위험: 사회적 무기력, 대규모 노동 대체, 인간 예외주의 감소
자율성 레벨 5: AI 대행자
완전히 자율적인 AI
예시: 자율적인 AI 구동 개인 비서(아직 미실현)
위험: 목표 불일치, 권력 집중
현재 AGI는 사람에게 도움이 되는 수준이 레벨 2에 와 있다고 할 수 있다. 지금까지 인간이 가질 수 있던 도구 중에 가는 가장 똑똑한 도구이고 특정 업무에서는 나보다 낫기도 하지만 대부분의 일반적인 업무의 경우 나보다 상당히 못한다. 영작은 나보다 훨씬 잘 하지만 한국어 글쓰기는 확실히 잘 못한다. 이 글을 쓰는 일도 이미지 생성과 테이블 자료 정리를 제외하면 내가 쓰는 것이 AI에게 맡기는 것보다 편하다. 내가 그림을 잘 그리는 사람이었으면 이미지 생성도 맡기기는 힘들었을 것 같다.
회사에서 동료로 활용할 수 있으려면 레벨 3는 되어야 한다. 레벨 2의 AI를 가지고 있다는 것은 공부 열심히 한 대학생 인턴을 가진 정도라고 보면 될 것이다.
현재 덜 똑똑한 AI를 활용하기 일반인이 자유롭게 활용하기 힘든 상태이고, 조금만 노력하면 그들이 쉽게 쓸 수 있게 할 수 있기에 많은 스타트업이 이 갭에 뛰어들고 있다. 그리고 AI기업에서 다음 레벨의 AI를 내놓으면 속절없이 쓸려나가고 있다.
인턴 1명이 나에게 왔을 때 나의 퍼포먼스는 어떻게 될까? 대부분의 경우 퍼포먼스가 떨어지게 된다. 내가 혼자서 금방 하던 일을 하나하나 설명해 주어야 하고 설명해 주어서 결과를 받아 봤자 내가 한 것만 못하다.
이것이 지금 AI를 사용하여 일을 하는 경험이다. 내 일을 AI가 이해할 수 있는 형식으로 바꾸기도 어렵고 바꿔 줘 봤자 만족할만한 결과가 나오지 않는다.
그런데 나에게 인턴 100명이 주어진다면 어떻게 될까?
중학생 인턴이라도 100명을 10분씩만 활용하여 작은 단순 업무를 시키면 엄청난 효과를 볼 수 있다. 물론 그들이 무료 거나 엄청 저렴하다는 전제 하에서. 그들이 진짜 사람 중학생은 아니라는 전제 하에서. (생각만 해도 아찔하다.)
AI에게도 작은 일을 엄청 많이 시키고 결과에 대한 기대치를 조금 낮추거나 내 퍼포먼스 기준이 아닌 100명 인턴의 기준으로 맞추면 엄청나게 많은 일들을 해낼 수 있다. 아, 그리고 $20을 아끼지 말자. 무료 버전 GPT 3.5는 중학생 인턴 수준, GPT-4는 대학생 인턴 수준이다. 아직 직장 동료 수준은 아니지만 대학생 인턴을 무한대로 가질 수 있다는 것은 엄청난 파워를 제공할 수 있다. 반면 중학생 인턴 무한대는 더 골칫거리일 수도 있다.
그런데 인턴 100명을 잘 활용하려면 가져야 하는 중요한 자세의 변화가 있다. 바로 내가 "일하는 사람"이 아닌 "매니저"가 되어야 한다는 것이다. 일하는 사람은 내가 열심히 일을 할수록 성과가 올라가는 사람이지만 매니저는 내가 직접 일을 하지 않고 다른 사람들이 일을 더 잘하게 할수록 성과가 올라가는 사람이다.
인턴 100명을 매니지하는 매니저가 되는 것도 풀타임으로 해야 하는 어려운 일일 수 있다. 그렇지만 그 임팩트는 내가 혼자 하는 일에 비해 100배는 안 되어도 60배는 될 것이다.
물론 이 모든 것이 AGI가 인턴 수준이 아니라 직장 동료, 나보다 뛰어난 전문가, 나아가 슈퍼휴먼이 된다면 사라질 문제일 것이다. 내가 엔지니어인데 CTO레벨의 AI에게 일을 시킬 수 있다면 그냥 난 놀면 된다. CTO 레벨은 일을 정의하는 것도, 시스템을 설계하는 것도 필요 없다. 그냥 내가 이루고 싶은 미션만 주면 알아서 해 낼 것이니까.
그때까지 우리에게 주어진 것은 전문성이 부족하고 신뢰도는 80% 정도 수준이고 기억력도 없지만, 사람이 하루종일 걸릴 일을 5분 만에 하는, 세상 모든 책을 다 읽은 슈퍼 인턴 100명이다. 지금도 "내가 일하는 사람"이 아니라 "매니저"가 되면 이들을 활용하여 어나더레벨의 삶을 살 수 있다.
실리콘밸리에서 AI가 직원의 수를 줄이고 있는 이유도, 한명의 직원을 AI가 1:1로 대체해서가 아니라 80% 수준의 AI를 무한대로 활용하기 때문이다.
그리고 매니저에게는 리더십이 필요하다. 리더는 팀원들의 부족함을 팀워크와 코칭으로 보완하여 최고의 성과를 내는 사람이다. 덜 똑똑한 AI 인턴들을 리드하는 리더십이 능력이 되는 시대이다.