“트랜스포머의 등장 ― 기계가 언어를 이해하기 시작한 순간”
“AI가 세상을 바꾼다.” 요즘 이 문장을 하루에도 몇 번씩 듣습니다. 그런데 정작 ‘인공지능이란 무엇인가요?’라는 질문을 받으면, 대부분의 사람들은 막연하게 “컴퓨터가 사람처럼 생각하는 거?” 정도로 답합니다.
AI는 분명 우리 곁에 있지만, 그 원리를 이해하는 사람은 아직 많지 않습니다.
‘인공지능(Artificial Intelligence)’이라는 말은 1956년, 미국 다트머스 대학에서 열린 여름 학회에서 처음 등장했습니다. 당시 연구자들은 “기계가 언젠가 인간의 학습과 추론을 모방할 수 있을 것이다”라는 가설을 세웠습니다. 이후 반세기 동안, AI는 여러 번의 ‘겨울(침체기)’과 ‘봄(부흥기)’을 반복했습니다.
컴퓨터가 말을 알아듣지 못하고, 이미지를 인식하지 못하던 시절에는 “AI는 실패했다”는 이야기도 많았습니다. 하지만 2010년대 들어, 상황이 급변합니다. 이른바 딥러닝(Deep Learning) 이라는 기술이 등장하면서, 기계가 스스로 데이터를 통해 패턴을 학습하기 시작한 것입니다. 이후 AI는 장기판을 두고, 번역을 하고, 사람의 목소리를 듣고, 이제는 문장을 쓰고 대화하며 그림을 그리는 존재로까지 진화했습니다.
AI의 발전을 한 문장으로 요약하자면 이렇습니다. “규칙을 따르던 기계가, 학습을 통해 의미를 이해하기 시작했다.” 초기의 AI는 사람이 직접 입력한 규칙을 따라 움직이는 단순한 프로그램이었습니다. ‘만약 A라면 B를 수행하라’는 식의 구조죠. 이 방식은 빠르고 정확했지만, 새로운 상황에는 완전히 무력했습니다.
반면 지금의 AI는 수많은 데이터를 스스로 보고, 그 안에서 관계와 패턴을 찾아 **‘스스로 규칙을 만들어내는 존재’**가 되었습니다. 예를 들어, 수백만 장의 고양이 사진을 보여주면, 어떤 것도 ‘고양이’라고 가르치지 않아도 스스로 고양이를 구분해냅니다. 이게 바로 기계학습(Machine Learning) 의 힘입니다.
그리고 언어의 영역에서는, ‘트랜스포머(Transformer)’라는 혁신적인 구조 덕분에 기계가 단어와 문장 사이의 관계를 이해하게 되었습니다. 이것이 지금의 GPT나 Claude 같은 언어모델(LLM) 의 기초가 되었습니다.
2017년, 구글 브레인 연구진이 발표한 논문 하나가 AI 역사를 완전히 바꿔놓습니다. 제목은 〈Attention Is All You Need. 이 논문에서 제시된 구조가 바로 트랜스포머(Transformer) 입니다.
그 이전까지의 인공지능은 문장을 앞에서부터 한 단어씩 읽으며 이해했습니다.
예를 들어 “고양이가 쥐를 잡았다”라는 문장을 처리할 때, 기계는 ‘고양이가’ → ‘쥐를’ → ‘잡았다’ 순서로 차례대로 단어를 받아들였습니다. 그런데 문맥은 단순한 순서의 문제가 아닙니다. ‘잡았다’는 단어를 이해하려면, 앞의 ‘고양이’와 ‘쥐’ 모두와의 관계를 동시에 봐야 합니다.
트랜스포머는 바로 그 문제를 해결했습니다. 이 구조는 “모든 단어가 문장 안의 다른 모든 단어와 관계를 맺는다”는 혁명적인 아이디어를 도입했습니다. 즉, AI가 문장을 읽을 때 각 단어가 서로를 바라보며, 어떤 단어가 더 중요하고 어떤 의미로 연결되는지를 스스로 판단하는 것입니다. 이 기능을 어텐션(Attention) 이라고 부릅니다. 말 그대로 ‘주의를 기울인다’는 뜻입니다. 기계가 문장 속에서 의미의 중심을 찾아내고, 그 중심을 따라 이해하는 능력을 갖게 된 것이죠. 이후 등장한 모든 대형 언어모델(LLM) ― GPT, Claude, Gemini, Grok, Mistral ― 모두 이 트랜스포머 구조 위에 세워졌습니다.
오늘날의 AI는 여전히 ‘인공 지능’이라기보다는 ‘인공 언어능력’에 더 가깝습니다. 스스로 생각하고 판단하는 단계는 아니지만, 대화와 글쓰기, 분석, 생성 같은 영역에서는 이미 인간의 영역을 넘어서고 있습니다. 우리가 매일 사용하는 검색, 이메일, 문서 작성, 디자인 툴 속에는 보이지 않게 수많은 AI가 작동하고 있습니다. 즉, AI는 어느 날 갑자기 등장한 낯선 기술이 아니라, 이미 우리의 삶 속에서 일상화된 인프라가 된 셈입니다.
AI의 가장 흥미로운 점은, 이 거대한 기술의 핵심이 ‘언어’를 이해하는 데 있다는 사실입니다. 언어는 인간의 사고를 표현하는 가장 압축된 도구입니다. 그 언어를 배운다는 건, 인간의 사고 구조를 배운다는 뜻이기도 하죠. AI는 이제 단순한 계산기가 아니라, 인간의 언어와 사고를 반영하는 거울이 되었습니다.
다음 편에서는, “기계가 어떻게 학습하는가?”를 다룹니다. 머신러닝과 딥러닝의 원리, 그리고 AI가 세상을 이해하는 방식을 함께 살펴보겠습니다.