brunch

Meta Superintelligence 인물과 업적

Meta의 AI 드림팀. 인물 및 업적 분석

by 이호준 변리사

안녕하세요. AI 전문 이호준 변리사입니다.


최근 AI 업계의 가장 큰 화두 중 하나는 단연 Meta의 공격적인 인재 영입입니다. 이는 단순히 인력을 보강하는 차원을 넘어, 미래 AI 기술의 패권을 장악하기 위한 전략입니다.

최근 SNS에서 Meta의 Superintelligence 팀에 합류한 주요 인물들의 명단이 유출되었습니다.

본 블로그에서는 Meta의 Superintelligence 팀에 합류한 주요 인물들의 면면과 그들의 기술적 성과를 통해 Meta의 큰 그림을 심도 있게 분석해 보겠습니다.

GwOzzRqbAAA3XIh?format=jpg&name=4096x4096 https://x.com/deedydas


1. 비전 및 제품 설계 (Product & Vision)

냇 프리드먼(Nat Friedman, 前 GitHub CEO) & 대니얼 그로스(Daniel Gross, 前 Apple AI 리더)

GitHub-CEO-Nat-Friedman_With-GitHub-momentum-statistics.jpg
Daniel Gross_TechCrunch_Disrupt_San_Francisco_2018_-_day_2_(43613758885).jpg
Nat Friedman (우), Daniel Gross(좌)

핵심 역할: 이들은 AI 기술을 실제 제품으로 구현하는 데 검증된 리더들입니다. AI 생태계의 중심인물로서, 두 사람이 공동 운영하는 벤처 캐피털 NFDG를 통해 퍼플렉시티 AI(Perplexity AI), 캐릭터닷AI 등 유망 스타트업에 투자해왔습니다.

Meta의 전략: Meta는 두 사람을 영입하며 그들의 펀드(NFDG)에 소수 지분을 투자했습니다. 이는 단순한 인재 영입을 넘어, 유망 기술 스타트업과의 네트워크 및 생태계에 직접적인 영향력을 확보하려는 전략적 포석입니다.



2. 원천 기술: 굳건한 기술적 기반 구축

모든 기술은 근본이 되는 원천 기술 위에 세워집니다. Meta는 현대 AI의 근간을 다진 인물과 차세대 비전 기술을 이끄는 핵심 그룹을 동시에 확보하여 기술적 정통성과 미래 경쟁력을 모두 강화했습니다.

컴퓨터 비전의 선구자: 얀 르쿤 (Yann LeCun)

250px-Laura_Chaubard_%26_Yann_Le_Cun_-_2024_%2853814052697%29_%28cropped%29.jpg Yann LeCun

주요 업적:

합성곱 신경망 (CNN): 현대 컴퓨터 비전의 핵심 기술인 CNN을 개척한 튜링상 수상자입니다.

역전파 알고리즘 (Backpropagation): 박사 논문을 통해 오늘날 딥러닝 모델 훈련의 표준인 역전파 알고리즘의 초기 형태를 제안했습니다.

르넷 (LeNet): AT&T 벨 연구소에서 CNN을 적용하여 손글씨 숫자를 성공적으로 인식하는 모델 LeNet을 개발, 신경망의 상업적 가능성을 최초로 증명했습니다.


3. 컴퓨터 비전 및 멀티모달 인텔리전스 (Vision & Multimodal Intelligence)


3.1. 비전 트랜스포머 (Vision Transformer) 그룹

구글에서 영입된 이들은 컴퓨터 비전의 패러다임을 바꾼 비전 트랜스포머(ViT) 개발의 주역들입니다.

알렉산더 콜레스니코프(Alexander Kolesnikov), 샤오화 자이(Xiaohua Zhai), 루카스 바이어(Lucas Beyer)

Alexander Kolesnikov.jpeg
Xiaohua Zhai.jpeg
Lucas Beyer.jpeg
Alexander Kolesnikov, Xiaohua Zhai, Lucas Beyer

주요 프로젝트:

- ViT (Vision Transformer): 이미지를 16x16 단어처럼 패치로 나눠 처리하는 기념비적인 논문.

- ViT-G/14: ViT를 20억 파라미터까지 확장하여 이미지넷(ImageNet) 정확도 90.45%를 달성한 연구.

- Big Transfer (BiT): 대규모 사전 훈련 모델의 뛰어난 전이 학습 성능을 입증한 연구.

- SigLIP / LiT: 기존 방식보다 효율적인 비전-언어 모델 사전 훈련 및 제로샷 학습 기법을 제안.


3.2. 이미지 분할 (Image Segmentation) 전문가

보웬 쳉 (Bowen Cheng)

images?q=tbn:ANd9GcQCEwj-XawOTpS_fxYUUvIxV2Q_el9_wW887x4MIFEVCU_hMY3Z Bowen Cheng

주요 업적 :

- MaskFormer, Mask2Former : 이미지 분할 문제를 '마스크 분류(mask classification)' 문제로 재정의하여, 시맨틱 분할과 인스턴스 분할을 하나의 프레임워크로 통합했습니다.

- 산업 기여: Tesla의 완전자율주행(FSD) v12 및 OpenAI의 GPT-4o 개발에 핵심적으로 기여했습니다.


3.3. 생성형 모델 및 멀티모달 지능 전문가


지아후이 유 (Jiahui Yu)

Jiahui Yu

Google DeepMind의 Gemini 멀티모달 팀과 OpenAI의 인식(Perception) 팀을 공동으로 이끌었던 핵심 리더. GPT-4o의 연구 리더였습니다.


춘위안 리 (Chunyuan Li)

Chunyuan Li

오픈소스 멀티모달 모델 LLaVA의 핵심 개발자. Microsoft 재직 시절 GroundingDINO, GLIP 등 중요 프로젝트를 이끌었습니다.


후이웬 창 (Huiwen Chang)

Huiwen Chang

Google 출신의 다작 연구원. MaskGIT, Muse 등 텍스트-이미지 생성 모델과 Palette, Imagic 등 다수의 중요 논문에 기여했습니다.


3.4. 비전 중심 도메인 전문가

페이 선 (Pei Sun)


Waymo 출신의 베테랑. LiDAR와 카메라 데이터 융합을 통한 3D 객체 탐지 전문가입니다.


앨런 자브리 (Allan Jabri):

Allan Jabri

UC 버클리 AI 연구소(BAIR) 출신. 레이블 없는 비디오 데이터로부터 시각 정보를 학습하는 자기 지도 및 비지도 학습 전문가입니다.


청쉬 주앙 (Chengxu Zhuang)

스탠포드 출신의 계산 신경과학 전문가. AI 모델과 인간의 뇌를 연결하는 연구에 집중합니다.


4. 언어 추론 및 실체화된 AI (Reasoning & Embodied AI)

안톤 바흐틴 (Anton Bakhtin)

복잡한 협상 게임 '디플로머시(Diplomacy)'에서 인간 수준의 성능을 보인 AI 에이전트 CICERO를 개발했습니다.

트라핏 반살 (Trapit Bansal)

photo.jpg

적은 데이터로 새로운 작업을 학습하는 퓨샷 러닝(few-shot learning) 성능 향상에 기여했습니다.

맷 데이트케 (Matt Deitke)

MattDeitke.jpg Matt Deitke

실체화된 AI(Embodied AI)가 현실에서 작동하는 데 필요한 데이터를 가상 환경에서 대량 생성하는 연구를 주도합니다.


5. AI 효율성, 시스템 및 핵심 이론 (Efficiency, Systems & Theory)

5.1. 효율적인 딥러닝 엔지니어링 그룹

모델을 더 작고, 빠르고, 쉽게 배포하도록 만드는 데 집중합니다.

핵심 인물: 지 린 (Ji Lin), 하오톈 (켄) 탕 (Haotian (Ken) Tang)

Ji Lin.jpg
Haotian (Ken) Tang.jpeg
Ji Lin, Haotian (Ken) Tang

주요 프로젝트:

- AWQ & SmoothQuant: LLM 압축 및 양자화의 핵심 기술.

- TSM (Temporal Shift Module): 효율적인 비디오 이해를 위한 기술.

- BEVFusion: 자율주행을 위한 다중 센서 융합 기술.


5.2. 딥러닝 프로세스 이론가

핵심 인물: 위안지 리 (Yuanzhi Li)

- 주요 업적: 딥러닝의 작동 원리를 이론적으로 규명합니다. 특히, 깊은 신경망이 왜 강력한 특징을 학습하는지 설명하는 역방향 특징 보정(Backward Feature Correction) 이론을 개발했습니다.


6. AI 안전 (AI Safety)

줄리안 마이클 (Julian Michael)

julian-portrait.jpg Julian Michael

고도화된 AI 시스템을 평가하고 인간의 가치에 부합하도록 정렬(align)하는 방법론을 개발합니다. GPQA 벤치마크를 설계했습니다.


서머 유에 (Summer Yue)

d9jeOJng_400x400.jpg Summer Yue

대규모 AI 시스템의 취약점 분석 및 가치 정렬 전문가. Google Brain, DeepMind, YouTube 신뢰 및 안전팀 경험을 보유하고 있습니다.


7. 특정 분야 전문가 (Specialized Domain Experts)

하마드 시드 (Hammad Syed): 30개 이상 언어의 텍스트-음성 변환(TTS) 모델 스타트업 창업자.

1729385759047?e=1756339200&v=beta&t=7ELJ9xPwF3GRV1LK_mvmPUWUQYkm3yTIHnkLzHUP6EU Hammad Syed

슈차오 비 (Shuchao Bi): YouTube Shorts 대규모 추천 및 랭킹 시스템 개발 리더.


핑촨 마 (Pingchuan Ma): 입술 움직임으로 음성을 인식하는 립리딩(lip-reading) 전문가.


칭칭 황 (Qingqing Huang): 텍스트로 음악을 생성하는 MusicLM 개발에 기여.


8. Meta의 채용 전략 분석


- 바벨 전략: 장기적 기초 연구(이론)와 즉각적 제품화(상용화)라는 양극단에 동시에 투자합니다.

- 연구 유닛 단위 영입: 검증된 협업 역동성을 가진 연구 '팟(pod)'을 그대로 영입하여(예: ViT 팀) 개발 속도를 극대화합니다.

- 데이터 엔진 중시: 모델 개발자뿐만 아니라, AI 발전의 동력인 '데이터 및 시뮬레이션 엔진' 구축 전문가(예: 맷 데이트케)에 적극 투자합니다.

결론적으로, Meta는 멀티모달 비전, 생성 모델, 효율적 시스템, 전략적 추론, AI 안전, 딥러닝 이론 등 현대 AI의 거의 모든 핵심 분야에 걸쳐 세계 최고 수준의 전문가들로 '드림팀'을 구성했음을 명백히 보여줍니다.


Meta의 Superintelligence 팀의 주요 인물들과 이들의 기술적 업적을 분석해보았습니다. Meta의 Superintelligence 팀은 AI 연구에서 패러다임의 전환을 이끈 연구자들이 다수 포함되어 있습니다.

이제껏 주로 Google 연구진의 이름으로 발표되던 패러다임 전환을 이끈 논문들(ViT 라던지)이 Meta의 이름으로 발표 될 것 같은 예감이 듭니다.


저자 소개 | 이호준 변리사

저자 소개 : 이호준 변리사


이호준 변리사는 기술의 가치를 이해하고, 그 가치를 지키는 최상의 전략을 제시하는 것을 목표로 합니다. 특히 AI, cloud computing, Date center, 소프트웨어와 같은 첨단 기술 분야의 특허 전략 수립에 많은 경험과 전문성을 가지고 있습니다.

또한 벤처캐피탈의 이사로도 활동하고 있으며, 타트업의 보육과 투자를 담당하고 있습니다.

ABC특허법률사무소

Series A 부터 IPO 까지 성장의 모든 단계의 전략적 파트너

keyword
작가의 이전글AI 언어 모델의 속도 한계를 돌파한 Mercury