AI과학자가 이야기하는 AI의 미래
인공지능의 선도적인 인물 중 한 명인 메타의 최고 AI 과학자 얀 르쿤과의 깊이 있는 대화를 여러분께 전합니다. 그의 딥러닝과 신경망 분야에 대한 중요한 공헌은 오늘날 AI 기술의 기반을 형성했습니다.
인스타그램을 통해 접수된 350개 이상의 질문 중에서 가장 주목할 만한 질문들을 선별하여 답변을 공유합니다. 이 인터뷰는 EvolveAI에서 제공한 독점 콘텐츠입니다.
Q: 간단한 자기소개 부탁드립니다.
A: 제 이름은 얀 르쿤이며, 메타에서 최고 AI 과학자로 활동 중이고 뉴욕 대학교에서도 교수로 재직 중입니다.
Q: 메타에서 근무한 기간은 얼마나 되나요?
A: 10년이 조금 넘었습니다.
Q: 메타에서 일하면서 가장 마음에 드는 점은 무엇인가요?
A: 그곳의 개방성이 가장 마음에 듭니다.
Q: AI가 우리 사회와 글로벌 커뮤니티를 형성하는 데 어떤 역할을 할 것이라고 보십니까?
A: 단기적으로 AI의 영향은 예측하기 쉬우나, 장기적으로는 예측하기 어렵습니다. 제 비전은 AI 비서가 우리의 거의 모든 상호작용을 중재하게 될 것입니다. 우리는 스마트 안경과 스마트폰을 통해 그들과 소통하게 될 것이고, 그들은 우리의 지능을 향상시키면서 지속적으로 도움을 줄 것입니다. 이는 마치 가상 전문가 팀을 두고 있는 관리자가 된 것과 같으며, 이러한 AI 비서들이 실행과 세부 사항을 처리하게 됩니다. 이것은 인류 수준에서 큰 변화를 가져올 수 있으며, 인쇄술 발명 이후의 사회 변화와 유사한 변혁이 일어날 수 있습니다.
Q: 일상적인 작업에서 AI의 통합이 인간의 창의성을 증진시키거나 저해할 것으로 보십니까?
A: AI는 분명히 창의성을 증진시킬 것입니다. 예를 들어, 이제 사람들은 악기를 연주할 줄 모르더라도 컴퓨터와 디지털 오디오 워크스테이션을 사용하여 음악을 제작할 수 있습니다. 디지털 아트 분야에서도 AI는 기술적 제한을 넘어서 창작을 가능하게 합니다.
Q: 회사에서 진행 중인 가장 흥미로운 프로젝트는 무엇인가요?
A: 저는 차세대 AI 시스템 개발에 초점을 맞춘 장기 프로젝트들에 참여하고 있습니다. 앞으로 몇 년 안에 우리는 질문에 답하고 일상적인 작업을 도와줄 수 있는 AI 비서를 통해 다양한 콘텐츠를 생성하는 시스템을 개발할 것입니다. 이러한 시스템은 물리적 세계를 이해하고, 지속적인 기억을 유지하며, 복잡한 계획과 추론을 수행할 수 있게 될 것입니다.
Q: 언어 모델은 구체적으로 어떻게 작동하나요?
A: 언어 모델은 텍스트에서 일부 단어를 제거하고 큰 신경망을 사용하여 누락된 단어를 예측하여 훈련됩니다. 훈련이 완료된 후, 이 모델들은 언어, 문법, 의미론을 이해하게 되며, 특정 작업에 대해 미세 조정될 수 있습니다. 이들은 이전 단어를 기반으로 한 단어씩 텍스트를 생성하여 지속적으로 텍스트를 생산할 수 있으나, 이 과정에서 부정확성이 발생할 수 있습니다.
Q: 언어 모델과 관련된 도전은 무엇인가요?
A: 텍스트를 예측하는 과정은 잠재적인 단어들에 대한 확률 분포를 생성하는 것을 포함합니다. 예를 들어, 주방에서 고양이가 무언가를 쫓을 때 '쥐'라고 추측하는 것처럼 말입니다. 그러나 비디오 예측—예를 들어 비디오 속에서 고양이의 행동을 예상하는 것—은 훨씬 더 많은 가능성으로 인해 더 복잡합니다. 컴퓨터는 고려해야 할 변수가 너무 많기 때문에 이 문제를 해결하는 데 어려움을 겪습니다. 모든 픽셀을 예측하는 대신, 시스템이 비디오의 내용에 대한 추상적 표현을 학습하고 이 수준에서 예측하는 것이 실행 가능한 접근 방식입니다. 이는 생성 모델이 아니며, 흥미롭게도 현재의 추세와 반대되는 비생성적 AI의 미래를 제시합니다.
Q: AI가 지속적으로 발전함에 따라, AI의 위험을 관리하고 인간 지능에 맞먹거나 이를 초과하기 시작할 때 그 발전에 비판적으로 참여하는 방안에 대해 어떻게 제안하시나요?
A: 현재 우리 시스템은 인간 지능에 비해 상당히 뒤처져 있습니다. 특히 LLM 같은 경우 새로운 것을 발명할 수 없습니다. 이는 오직 언어에만 기반하여 훈련되기 때문에, 인간 지식의 아주 작은 부분만을 대표합니다. 대부분의 초기 인간 학습과 같이 동물의 학습도 비언어적입니다. 예를 들어, LLM은 약 10조 개의 토큰에 대해 훈련되며, 이는 20조 바이트에 해당합니다. 이를 읽는 데는 100,000년이 걸릴 것입니다. 이는 모든 공개 인터넷 텍스트를 포함합니다. 이와 대조적으로, 4세 아동은 16,000시간의 각성 시간 동안 시각적으로 초당 약 20메가바이트를 처리하여, 단지 300시간 만에 LLM을 50배 이상 초과합니다.
인간 지능은 주로 물리적 세계와의 상호 작용에서 비롯되며, 언어는 중요하지만 2차적인 요소입니다. 텍스트만으로 인간과 유사한 지능을 가진 AI를 개발하는 것은 어려워 보입니다. 이 수준을 달성하기 위해서는 기본적인 동물과 같은 AI에서 시작해 보다 정교한 시스템으로 점진적으로 발전해야 하며, 실제 세계 상호작용의 안전장치를 포함해야 합니다. 인류에게 위협이 될 수 있는 고급 AI(AGI)로의 갑작스러운 도약을 기대하는 것은 현실적이지 않습니다.
Q: AGI를 달성하기 위한 주요 과학적 돌파구나 이정표에 대해 어떻게 생각하십니까?
A: 갑자기 일어나지는 않을 것입니다. 기본 개념들은 앞으로 5년에서 10년 사이에 나타날 수 있으며, 지속적인 진전이 있겠지만 갑작스러운 사건은 없을 것입니다. 이는 터보 제트 엔진의 발전과 유사하며, 이는 수십 년에 걸쳐 자주 실패에서 신뢰할 수 있는 장거리 여행까지 발전했습니다. 비슷하게, AI는 수년, 아니면 수십 년이 걸려 진화할 것입니다. 미래의 AI 시스템은 현재의 시스템과 크게 다를 것이며, 계획을 세우고 결과를 상상할 수 있는 능력을 갖추게 될 것입니다. 이러한 목표 지향적인 AI 시스템은 안전을 보장하기 위한 가이드레일로 인도될 수 있으며, 법을 확인할 수 있는 인간과는 다릅니다.
Q: AI가 우주의 이해와 오랜 과학적 미스터리를 해결하는 데 어떻게 기여할 것으로 보십니까?
A: AI는 물리학이나 화학뿐만 아니라 생물학과 사회에서도 다양한 현상을 이해하는 데 초기 성공을 거두었고 희망을 제공합니다. 복잡한 상호작용이 나타나는 곳에서는 전통적인 모델들이 생태학적 특성을 예측하는 데 어려움을 겪습니다. 예를 들어, 특정 각도로 비틀어질 때 초전도체가 되는 그래핀과 같은 물질의 수수께끼 같은 행동은 환원주의 이론을 거부합니다. 여기서 AI는 수소 분리와 같은 과정을 돕기 위해 물 분자가 기판과 어떻게 상호작용하는지와 같은 상호작용을 예측하는 데 도움을 줄 수 있습니다. 이는 지속 가능한 에너지 생산을 통해 기후 변화와 싸우는 데 필수적일 수 있습니다.
Q: 기후 변화와 전쟁과 같은 근본적인 글로벌 문제에 대처하기 위해 AI가 어떤 역할을 할 것이라고 보십니까? A: 연구자들은 리튬과 같은 희귀 원소가 필요한 배터리의 경우 전통적인 방법으로는 어려움을 겪는 촉매 특성을 예측하고 새로운 물질을 발견하는 AI의 잠재력을 탐구하고 있습니다. AI는 대규모로 배터리 효율을 혁신할 수 있습니다. AI는 또한 수십 년 동안 원리를 이해함에도 불구하고 지속된 도전 과제인 융합 반응기의 플라스마를 제어하는 데 도움을 줄 수 있습니다. 탄소 포집이나 그와 같은 것에 도움이 될 수 있을까요? 따라서 재료 과학에서 AI의 사용에 대한 많은 희망이 있습니다. AI는 또한 단백질 간 상호작용과 같은 생물학의 메커니즘을 이해하는 데 의학에서 유망합니다. 이에 대해 일하는 많은 사람들이 있으며, 매우 매력적입니다.
Q: 현재 메타 플랫폼에서 사용할 수 있는 AI 제품 중에서 AI와 상호작용하는 가장 좋은 방법은 무엇이라고 생각하십니까?
A: 미국에서는 메타의 AI가 대화 시스템으로 제공되고 있으며, 아직 유럽이나 영국에서는 제공되지 않고 있습니다. 이는 규제 복잡성 때문입니다. 이 시스템은 저처럼 Ray Ban 메타 안경과 같은 장치를 통해 작동하며, 이 안경은 카메라와 마이크로폰이 장착되어 있어 음성 상호작용을 통한 실시간 정보 제공 또는 번역이 가능합니다. 곧 AI가 중심이 되는 일상적인 상호작용을 가능하게 하는, 'Her' 영화와 유사한 인스턴트 번역 기능을 갖춘 스마트 레터 같은 제품이 시장에 나올 것입니다.
Q: 메타가 오픈 소스 및 대규모 언어 모델에 대해 강한 입장을 취하고 있는데, 그 이유와 이 결정을 비판하는 이들에게 어떻게 답하시겠습니까?
A: 네, 우리 회사는 지난 15년 이상 오픈 소싱에 깊이 참여해 왔습니다. 이는 플랫폼 인프라부터 소프트웨어 및 하드웨어 설계에 이르기까지 광범위하게 이루어졌으며, 널리 사용되는 AI 플랫폼을 포함하고 있습니다. 이러한 접근 방식은 커뮤니티 참여를 장려하여 우리 플랫폼을 개선하고 다양화하는 데 기여하며, 통찰력과 피드백을 공유합니다. 또한, 이는 전체 산업의 성장을 지원하는 생태계를 조성합니다. 예를 들어, 우리의 오픈 소스 LLM인 Lama2의 출시는 언어 적응이나 특정 산업용도로 LLM을 맞춤화하는 많은 스타트업의 부상을 촉발했습니다. 인도에서는 Lama2를 이용하여 그 나라의 모든 22개 공식 언어를 지원하는 프로젝트가 진행 중이며, 이는 상당한 성과입니다.
Q: Llama에 대한 번역 도구를 확장할 수 있습니까?
A: 우리는 기록되지 않은 언어에 대한 번역 프로젝트를 지원하며, 지역 방언을 보존하고 문맹자에게 음성 접근성을 제공합니다. 수백만 명이 우리의 모델을 그들의 언어와 문화에 맞게 적용하여 큰 영향을 미쳤습니다. AI가 모든 디지털 상호작용을 지원하는 미래가 있습니다. 우리는 주요 서구 언어에 중점을 두는 미국 서해안의 몇몇 회사들에 의한 독점을 피해야 합니다. 이러한 제한은 AI의 세계관을 좁힐 수 있으며, 특정 가치 체계와 정치적 견해를 반영할 수 있습니다. 다양한 AI 보조원의 범위는 민주주의와 문화 다양성을 보호하는 데 자유롭고 다양한 언론만큼 중요합니다. 따라서 오픈 소스 AI는 바람직할 뿐만 아니라 필수적입니다. 오픈 소스 AI가 악의적인 개체에 의해 잘못 사용될 수 있다는 우려에도 불구하고, 이러한 위험은 모든 기술에 내재되어 있습니다. 접근을 제한하는 것은 AI의 의견 다양성을 제한함으로써 실제로 위험을 증가시킬 수 있습니다. AI 접근을 차단하는 것은 안전성을 약간 향상시키는 것보다 더 큰 위험을 초래할 수 있습니다.
*아래는 인터뷰 원본 파일입니다. 필요하신 분들은 다운로드하여서 보세요.