[인물 추적 02] 픽셀의 침묵을 깨우는 설계자,

트웰브랩스 이재성

Mar 25. 2026

세상은 온통 영상으로 가득 차 있다. 1분마다 수백 시간의 영상이 유튜브에 업로드되고, 인류의 시선은 액정 화면 속 움직이는 이미지에 고착되어 있다. 그러나 역설적이게도 우리는 인류 역사상 가장 거대한 ‘정보의 암흑시대’를 지나는 중이다. 텍스트는 단어 하나로 수조 개의 문서 속 문장을 찾아내지만, 영상은 그 내부의 사건을 기계가 읽어낼 수 없는 ‘침묵의 데이터’로 남겨두었기 때문이다.

이 거대하고 막막한 픽셀의 바다 위에 검색 가능한 ‘언어의 등대’를 세우는 인물이 있다. 2026년 현재, 실리콘밸리가 가장 주목하는 한국인 기업가이자 영상 이해 AI 분야의 글로벌 표준을 재정의하는 트웰브랩스(Twelve Labs)의 이재성 대표다. 그를 추적하는 일은 단순히 유망한 스타트업의 성공 서사를 읽는 작업이 아니다. 인류가 시각 정보를 지식으로 변환하는 방식, 즉 ‘기억의 구조’를 근본적으로 바꾸는 현장을 목격하는 일이다.

변방의 언어를 거부한 ‘본토의 승부사’

이재성 대표를 2026년의 상징적 인물로 만든 동력은 기술력 그 자체보다, 한국이라는 지리적 한계를 지우고 처음부터 글로벌 표준을 정조준한 그의 전략적 대담함에 있다.

실리콘밸리의 관문인 UC 버클리에서 기술 패권의 흐름을 목격했던 그는, 한국 테크 기업들이 흔히 따르는 ‘국내 검증 후 해외 진출’이라는 관성을 과감히 탈피했다. 영상 AI의 주도권 싸움이 치열한 미국 본토에서 첫걸음을 뗀 것이다. 엔비디아(NVIDIA)와 인텔 등 글로벌 테크 거인들이 앞다투어 트웰브랩스에 투자한 이유는 명확하다. 이재성이 제시한 ‘영상 언어 생성 모델(VLM)’이 기존 거대 언어 모델(LLM)의 한계를 돌파할 유일한 열쇠라고 판단했기 때문이다.

그는 기술자의 언어를 비즈니스의 언어로 번역하는 데 탁월했다. “영상판 구글을 만드는 대신, 세상의 모든 영상에 ‘인덱스(색인)’를 붙이는 인프라를 구축하겠다”는 그의 비전은 투자자들을 설득하기에 충분했다. 이는 남이 만든 운동장에서 빨리 달리는 법을 연구하는 ‘패스트 팔로워’를 넘어, 운동장의 규격 자체를 설계하는 ‘퍼스트 무버’의 길을 택한 결과다.

픽셀에 생명을 불어넣는 ‘디지털 독해’의 시대

이재성이 이끄는 모델은 일종의 인류학적 번역기다. 인간의 뇌가 영화를 볼 때 표정, 앵글, 선율, 침묵을 동시에 처리하듯, 그는 AI가 이 미묘한 시각적 경험을 ‘언어’로 치환하도록 설계했다. 영상 속의 움직임은 동사가 되고, 사물은 명사가 되며, 분위기는 형용사가 되어 데이터의 격자 위에 정렬된다.

2026년 현재, 이 기술은 특정 장면을 찾는 기능을 넘어 산업의 지형을 바꾼다. 방송국의 방대한 기록을 단 몇 초 만에 찾아내고, 자율주행차가 도로 상황을 스스로 ‘추론’하며, 보안 시스템이 사고의 ‘전조’를 포착한다. 이는 인류가 시각 정보를 다루는 패러다임을 단순한 시청(Watching)에서 독해(Reading)로 전환시킨 사건이다. 이재성은 영상이라는 거대한 심연 위에 사방으로 뻗은 고속도로를 놓은 셈이다.

‘기억의 외주화’가 가져올 서늘한 미래

우리는 이재성이라는 가늠자를 통해 우리 사회의 양면성을 읽어내야 한다. 기술이 선사하는 편의성 이면에는 우리가 놓치고 있는 사유의 비용이 잠복해 있기 때문이다.

요약된 진실, 편집된 세계: 이재성의 기술은 정보를 극도로 효율화한다. 2시간짜리 영상을 1분으로 요약해 주지만, 그 ‘의미’를 결정하는 알고리즘의 주체는 누구인가 하는 질문은 남는다. AI가 요약해 준 세상만을 소비하는 대중은, 행간에 숨겨진 진실이나 의도된 침묵을 읽어낼 동력을 잃어갈지도 모른다.

감시와 투명의 경계선: 영상이 언어로 검색된다는 것은 ‘숨겨진 구석’의 소멸을 의미한다. 동선과 습관, 심지어 감정의 변화까지 데이터화되어 검색 대상이 되는 시대. 이재성은 우리에게 묻는다. “당신은 더 안전한 세상을 위해 당신의 비밀을 기꺼이 데이터화할 준비가 되었는가?”

기술은 통찰을 대신할 수 없다

이재성 대표는 스스로를 리더보다 ‘문제를 해결하는 사람’으로 규정한다. 그는 늘 강조한다. “AI가 영상을 이해하는 목적은 인간의 시간을 아껴주어, 인간이 더 본질적인 가치에 집중하게 하는 것”이라고.

2026년을 살아가는 우리에게 그가 주는 교훈은 명확하다. 기술이 복잡한 정보를 정리할수록, 그 정보들을 연결해 ‘새로운 서사’를 엮어내는 인간의 상상력은 더욱 귀해진다. AI가 영상의 줄거리를 요약할 수는 있어도, 그 영상이 주는 감동의 근원을 해석하고 눈물을 흘리는 것은 여전히 인간의 몫이기 때문이다.

그는 우리에게 ‘비디오 퍼스트’ 시대의 새로운 문해력을 요구한다. 기계가 읽어주는 세상을 수동적으로 수용하는 대신, 찾아낸 데이터들 사이에서 시대의 맥락을 짚어내는 날카로운 시각. 그것이 바로 이재성이라는 길라잡이가 안내하는 2026년의 생존 전략이다.

다시, 질문하는 인간으로

최세훈이 AI를 통해 ‘예술의 본질’을 물었다면, 이재성은 ‘정보의 체계’를 다시 쓰고 있다.

그의 전략대로 세상의 모든 영상이 언어로 치환되는 시대, 우리는 그 목소리들 사이에서 무엇을 들어야 할까. 이재성이라는 가늠자는 2026년의 우리에게 예보한다. 우리가 영상을 검색하는 것이 아니라, 영상이 우리를 검색하는 시대가 오고 있다고.

그때 우리는 기계 앞에 서서 어떤 당당한 서사를 내놓을 수 있을까. 픽셀의 침묵을 깨운 이 냉철한 설계자의 궤적 끝에는, 결국 ‘인간답게 세상을 바라본다는 것’에 대한 가장 무거운 숙제가 남아 있다. 이제 우리는 이재성이 열어젖힌 투명한 영상의 시대를 지나, 다음 인물이 기다리는 사회의 또 다른 급소를 향해 걸음을 옮겨야 한다.

keyword

Brunch Book 화, 금, 일 연재

연재 시대의 지문 Fingerprint

전체 목차 보기

이전 02화[인물 추적 01] 0과 1의 캔버스 위에 새긴 '인간[인물 추적 03] 아날로그의 영혼을 디지털로 번역하는다음 04화