AI, 현실 세계에 본격적으로 진입한다
* 이 글은 AI 전문 뉴스레터 '튜링 포스트 코리아'에 게재한 글의 일부입니다. AI 기술, 스타트업, 산업과 사회에 대한 이야기에 관심이 있으시면 '튜링 포스트 코리아' 구독해 주세요.
며칠 전, 스탠포드에서 ‘State of AI 2025’라는 이름으로 다양한 관점에서 AI 기술과 산업, 시장의 현황을 조사 분석하고 지수화한 최신 보고서를 발간했습니다. 456페이지짜리 방대한 보고서네요. ^.^;
보고서의 서두에 12가지 핵심 사항이 요약되어 있고, 저희 FOD에서도 중요하다고 생각하는 내용을 말씀드리지만, 한 번 시간을 내서 쭉 보시기 바랍니다. 이 보고서를 살펴보는 몇 가지 방법이 있을 텐데요:
목차를 보면 R&D, Technical Performance부터 Education, Public Opinion까지 총 8개의 챕터로 구성이 되어 있습니다. 특별히 관심있는 영역이 있으시다면 해당 챕터로 이동하셔서 자세한 내용을 보시는 방법이 있겠구요.
‘클래식하게’ Ctrl+F (맥에서는 Cmd+F)를 사용해서, 관심있는 ‘키워드’ 기반으로 검색, 해당 내용을 전후로 살펴보시는 겁니다. ‘Hallucination’으로 검색해 봤더니 17개 검색 결과가 나오네요.
저희가 권해드리는 방법은 이겁니다: Gemini 2.5에 보고서 PDF를 업로드 - Gemini 2.5의 컨텍스트 윈도우가 엄청 커서, 456페이지 짜리 보고서를 실제로 업로드할 수 있습니다 - 하시고, 질문 답변을 계속해서 쭉 이어서 하면서 보고서 내용을 확인하고 궁금한 걸 해소하는 겁니다. 그러고 보면, 이 보고서가 Gemini 2.5 모델을 테스트해 보기 좋은 문서이기는 하네요 - 밀도가 높은 다양한 관점의 내용을 포함하고 있으니까요. 몇 번 테스트를 해 보니, 이렇게 하는 방식이 그냥 Back-to-Back으로 읽는 것보다 오히려 더 구체적인 내용을 잘 이해하고 통찰력을 얻을 수 있는 가능성도 높다 싶습니다. 사실 이 보고서가 문학 소설은 아니잖아요? 꼭 Back-to-Back으로 읽을 필요도 없습니다.
어쨌든 좋습니다. 중요한 건, 이 방대한 스탠포드의 AI Index Report 2025에 기록되어 있는 ‘AI의 현황’은 어떤 모습일까요?
이전 몇 년의 기록이 ‘AI의 눈부신 잠재력’에 대한 것이었다면, 2024년은 AI가 제대로 우리의 일터에 모습을 드러내면서 우리 경제와 일상 생활에 깊이 뿌리내리기 시작한 해라고 이야기하고 있습니다. 물론, 그 ‘진입’이 그저 순탄하지만은 않습니다. 촛점없이 뿌옇게 미래를 바라보는, 과장된 Hype은 이제 그만 잊으세요. 여기서 가장 흥미로운 이야기는, ‘AI 기술 발전과 도입의 맹렬한 가속화’, ‘엄청난 자원 요구량에 대한 걱정과 대응’, 그리고 ‘대중의 인식이 변화하는 과정과 충돌’이라고 생각합니다.
가장 두드러진 변화라면, ‘AI가 실질적으로 경제 활동의 주체들과 통합되어간다’는 겁니다. 국가별로, 영역별로 물론 차이는 있습니다 - 꽤 크죠. 그렇지만 전반적으로, 기업들은 초기의 실험 단계는 넘어서고 있는 걸로 보여요. AI 채택율이 극적으로 증가하면서 78%의 기업이 AI를 사용한다고 이야기하고 있고, 생성형 AI 기술의 채택은 단 1년 만에 두 배 이상 증가했습니다.
AI는 틈새 (Niche)를 공략하는 도구에서 이제 ‘핵심적인 비즈니스 동력’으로 자리를 차지하기 위해 이동하고 있습니다. 수많은 연구 결과가 연구실을 벗어나서 현장에서 실질적인 생산성 향상에 기여하고 있구요. 재미있는 건, 이전의 예상과는 다르게 ‘비교적 낮다고 평가되었던, 육체적인 기술을 가진 노동자들보다도 지식 노동자들의 업무에 영향이 큰 것으로 나타나고 있어서, ‘자동화의 종말’에 대한 서사는 생각보다 많이 복잡해지고 있습니다.
위 그림은 2019년 공학한림원에서 선정한 ‘40년 후 세상을 지배할 미래 10대 기술’ 관련한 삽화인데, 인공지능을 탑재한 로봇이 수많은 일을 하지만 대부분 ‘육체적인’ 일을 나타내죠 - ‘가사일 90% 담당’, ‘제조업 100% 담당’ 처럼 말이죠. 하지만, AI가 마케팅 카피를 작성하고, 법률 판례를 조사하고, 신약이나 신물질 발견 과정을 지원하는 등, 지식 노동자들의 업무에 오히려 더 큰 변화가 나타나고 있습니다.
이렇게 AI 기술이 엄청나게 빠르게 발전하면서 우리의 일상과 일터에 통합되는 과정에서, 최첨단에서의 경쟁은 역설적으로 더욱 치열해지면서도 집중화되고 있습니다. SOTA 모델들 간의 성능 격차는 줄어들면서 Commodity화 되어가고, 오픈웨이트 모델들이 독점적인 거대 모델들을 빠르게 따라잡고, 중국은 성능 벤치마크에서 미국을 따라잡는 놀라온 속도를 보여주고 있습니다.
문제는, 이런 최첨단의 우수한 성능을 얻어내려면 기하급수적으로 증가하는 자원이 필요하다는 건데요. AI 모델의 트레이닝에 필요한 컴퓨팅 파워는 5개월마다 2배로 증가하고, 전력 소비는 매년 두 배씩 증가하고, 트레이닝 비용은 수조원은 우습다는 듯이 엄청난 수치에 도달하고 있습니다. GPT-4의 경우에 이미 10억 달러짜리 규모의 트레이닝 실험이 진행 중이구요. 이런 엄청난 비용 때문에, AI의 사용 자체를 위한 추론 (Inference) 비용이 저렴해지는 와중에도, 주로 미국의 산업에 최첨단의 개발 능력을 집중시키게 됩니다. 이건 단순히 ‘누가 더 빠른 칩을 만드느냐’의 문제가 아닙니다 - 매 순간 더 벌어지고 있는 국가 간 자원의 격차를 봐야 합니다.
이 보고서에서 가장 덜 논의되고 제대로 다루어지지 않았다고 생각하는 건 두 가지입니다. 지속 가능성 (Sustainability)과 AI의 리스크에 대한 사회적인 토론과 준비, 거버넌스 문제입니다.
지속 가능성의 차원에서는, ‘탄소 비용’보다 중요한 게 ‘데이터의 부족' 문제입니다. 우리가 사용하는 오픈 웹의 ‘공개된 데이터 자원 (Data Commons)’은 빠르게 줄어들고 잇습니다 - 일부는 스크래핑의 제한을 하기도 하고, 컨텐츠에 접근을 막기도 하고, 사라지는 정보들도 있죠. 어떤 전문가는, 2026이면 우리가 보유하고 있는 데이터의 한계에 부딪히게 될 거라고 이야기하기도 합니다. 이제, ‘규모’, ‘스케일링’에 의존하는 방식은 더 이상 작동하지 않을지도 모릅니다. 합성 데이터가 앞으로의 길일까요? 아니면 새로운 모델 아키텍처가 필요한 걸까요? 이게 바로 우리가 탐구하고 대답해야 할 질문일 겁니다.
지난 3년간, AI 리스크와 거버넌스에 대한 논의의 시간은 ‘허무맹랑한 터미네이터식 멸망의 날’에 대한 내러티브, 그리고 실질적이지 못한 수준의 윤리/정책 등에 대한 탁상공론으로 허비되었습니다. 어떤 컨퍼런스를 가든, 어떤 웨비나를 보든, 지겹게도 똑같은 이야기의 반복일 뿐입니다. 우리가 현재 예상할 수 있고 실질적인 AI의 리스크를 대상으로, 경제적으로 가능한 (Economically Viable), AI와 우리가 마음 편히 공존할 수 있는 ‘사회 경제적 메커니즘’에 대한 논의를 지금부터라도 시작해야 합니다.
그런 의미에서, 어제 The Information에서 커버한 ‘Revenue Lags at AI Evaluation Startups’라는 제목의 기사는 시사하는 바가 큽니다 - 일반적인 AI 스타트업들과 이 AI Evaluation들의 성과의 격차가 바로 우리 ‘인식의 격차’를 보여주기 때문이죠:
(AI와 같은) 새로운 기술이 파도가 들이치듯이 사회에 충격을 주면, ‘기술의 진보’ 편에 있는 그룹 vs. ‘그 흐름에 저항’하는 편에 있는 그룹 간의 줄다리기는 항상 생기기 마련입니다. 과학적 성과는 ‘날마다’라고 해도 과언이 아니라 정도로 우리를 놀라게 하고, 이 성과에 기반한 ‘상업적 시도’는 계속해서 늘어나고 있지만, 그 이면에서 AI와 관련된 사고, 편향성 이슈, 대중의 불신 등도 고개를 숙이지 않으니까요. 기업들은 이미 그 위험을 알고 있습니다 - 그래서 몸을 사리고 빨리 움직이지 않는 측면도 있을 겁니다. 정부나 규제 기관도 나름대로 투자와 조정을 하는 등 노력은 하지만, 너무나 변화의 속도가 빠르고, 결국 여론은 낙관론, 지역적 균열, 직업에 대한 불안, 데이터 처리의 관행에 대한 낮은 신뢰 등을 키워드로 분열됩니다.
스탠포드의 ‘Status of AI 2025’ 보고서에서 가장 중요한 것은 ‘가속화 (Acceleration)’가 아닙니다. 그 ‘가속화’가, 우리가 사는 유한한 세게에서 거의 무한한 자원과 관심의 투입을 요구한다는 점입니다. 이제 우리는 혁신과 절제, 속도와 책임을 조화시킬 수 있을지에 대한 전세계적인 시험에 직면하게 되었습니다. 그런 ‘긴장 관계’ - 자원, 안전성, 신뢰를 둘러싼 긴장 관계 - 가 결국 어떤 리더보드보다도 우리가 만들어야 할 중요하고 의미있는 AI의 유산 (Legacy)을 만들어내게 될 겁니다.
스탠포드 AI 보고서만으로도 충분히 많은 내용이지만, 이 보고서도 한 번 확인해 보세요: ‘Anthropic Education Report: How University Students Use Claude’ - 대학생들이 Claude를 어떤 분야의 작업에 어떤 목적으로 사용하고 있는지 ‘추정’해 볼 수 있는 자료입니다. 아직 성급한 결론을 내기는 이르다고 생각합니다.