Google의 선임 연구 책임자인 더글라스 에크(Douglas Eck)
[테크수다 기자 도안구 eyeball@techsuda.com] 며칠 전 구글 사이트에 올라온 글이 있었는데 이제서야 이곳에 소개합니다.
생성형 AI란 무엇인가요 : Google AI 전문가가 자세히 설명합니다. 라는 글입니다.
What is generative AI? A Google expert explains. (blog.google)
오늘도 deepl.com을 통해 번역했습니다. 오역이 있으니 반드시 원문을 확인해주세요.
최근 제너레이티브 AI와 협업할 수 있는 초기 실험인 Bard에 대한 액세스를 확대했습니다. 바드는 자연스러운 언어를 생성하는 능력으로 유명한 머신러닝 모델의 일종인 대규모 언어 모델을 기반으로 합니다. 그렇기 때문에 "제너레이티브 AI"와 같은 용어로 사용되기도 합니다. 다른 신기술과 마찬가지로 사람들은 제너레이티브 AI가 정확히 무엇인지 등 많은 의문을 품게 됩니다.
제너레이티브 AI, 대규모 언어 모델, 머신 러닝 등에 대한 일반적인 질문에 대해 이야기를 나누기 위해 Google의 선임 연구 책임자인 더글라스 에크(Douglas Eck)와 함께 이야기를 나누었습니다. 더글라스 에크는 AI의 최전선에서 일할 뿐만 아니라 문학과 음악 연구에 대한 배경 지식도 갖추고 있습니다. 기술적인 측면과 창의적인 측면이 결합되어 있기 때문에 제너레이티브 AI의 작동 방식과 기술 및 창의성의 미래에 어떤 의미가 있는지 설명할 수 있는 특별한 위치에 있습니다. 그의 이야기를 들어보세요.
1. 제너레이티브 AI에 대해 자세히 알아보기 전에 AI에 대해 좀 더 폭넓게 이야기할 필요가 있습니다. AI는 흥미롭지만 종종 모호한 용어 중 하나입니다. AI란 정확히 무엇일까요?
AI는 모든 종류의 첨단 컴퓨터 시스템을 설명하는 데 자주 사용되는 광범위한 용어입니다. 저는 "머신 러닝"에 대해 좀 더 구체적으로 이야기하고 싶습니다. 오늘날 우리가 AI에서 볼 수 있는 대부분의 것은 컴퓨터 시스템에 예제를 통해 학습할 수 있는 능력을 부여하는 기계 학습입니다.
예제를 통해 학습하도록 프로그래밍된 기계를 우리는 "신경망"이라고 부릅니다. 신경망이 학습하는 주요 방법 중 하나는 이미지에 무엇이 있는지 알려주는 것과 같이 학습할 수 있는 많은 예제를 제공받는 것인데, 이를 분류라고 합니다. 코끼리를 인식하는 방법을 네트워크에 가르치려면 사람이 코끼리가 어떻게 생겼는지에 대한 수많은 예시를 네트워크에 소개하고 그에 따라 사진에 태그를 지정해야 합니다. 이렇게 하면 모델이 코끼리와 이미지의 다른 세부 사항을 구별하는 방법을 학습하게 됩니다.
언어 모델은 또 다른 유형의 신경망입니다.
2. 언어 모델은 어떻게 작동하나요?
언어 모델은 기본적으로 일련의 단어에서 다음에 나올 단어를 예측합니다. 이러한 모델을 대량의 텍스트로 학습시켜 다음에 어떤 단어가 나올지 더 잘 이해하도록 합니다. 언어 모델을 개선하는 한 가지 방법(유일한 방법은 아니지만)은 우리가 공부하는 자료를 통해 학습하는 것처럼 언어 모델에 더 많은 '읽기'를 제공하거나 더 많은 데이터로 학습시키는 것입니다. "Mary가... 공을 찼다"라는 문구를 입력하기 시작하면 충분한 데이터로 학습된 언어 모델은 "Mary가 공을 찼다"라고 예측할 수 있습니다. 학습이 충분하지 않으면 "둥근 물체" 또는 "노란색"만 예측할 수 있습니다. 언어 모델을 학습하는 데 더 많은 데이터가 포함될수록 미묘한 차이가 생기고, 메리가 무엇을 찼을 가능성이 가장 높은지 정확히 파악할 수 있는 인사이트를 얻을 수 있는 가능성이 높아집니다.
지난 몇 년 동안 언어 모델의 크기를 확장하는 것부터 특정 작업에 필요한 데이터의 양을 줄이는 것까지 언어 모델의 성능을 향상시키는 방법에는 큰 발전이 있었습니다.
언어 모델은 이미 사람들을 돕고 있습니다. 예를 들어 Gmail의 스마트 작성 및 스마트 답장 기능에서 언어 모델을 볼 수 있습니다. 그리고 언어 모델은 Bard에도 적용됩니다.
3. 알겠습니다. 지금까지 AI와 언어 모델을 정의했습니다. 제너레이티브 AI는 어떤가요?
제너레이티브 모델은 표시된 예제에서 학습한 내용을 바탕으로 완전히 새로운 것을 만들어낼 수 있습니다. 그래서 "생성형"이라는 단어가 붙었습니다. 대규모 언어 모델(LLM)은 자연스러운 언어의 형태로 새로운 텍스트 조합을 생성하기 때문에 제너레이티브 AI의 한 유형입니다. 또한 Imagen, AudioLM, 페나키처럼 새로운 이미지, 오디오, 심지어 비디오와 같은 다른 유형의 결과물을 생성하는 언어 모델을 구축할 수도 있습니다.
4. 이는 많은 사람들이 가지고 있는 큰 의문을 불러일으킵니다: 제너레이티브 AI가 크리에이티브 분야와 창의성 전반에 어떤 의미가 있을까요?
저는 크리에이티브 분야에는 엄청난 잠재력이 있다고 생각합니다. 초안 작성과 같은 일상적인 작업의 반복적인 수고를 덜어주고, 타고난 창의력을 침해하지 않는다고 생각하면 됩니다. 음악 연구자로서 저는 제너레이티브 AI를 수십 년 전 드럼 머신의 등장에 대해 생각했던 것과 같은 방식으로 생각합니다. 드럼 머신은 인간 드러머가 연주하는 것과는 다른 리듬을 만들어냈고, 완전히 새로운 장르의 음악에 활력을 불어넣었습니다.
5. 1980년대의 많은 음악이 그러했죠.
브롱크스에서 드럼 머신을 사용하면서 힙합이 어떻게 발전했는지도 마찬가지입니다. 음악의 새로운 백엔드 기술 개발로 인해 전체 장르가 발전한 것이죠. 드럼 머신은 드러머를 대체한 것이 아니라 또 다른 레이어를 추가했을 뿐입니다.
6. 여기에는 분명 기회가 있습니다. 하지만 잠재적인 도전 과제는 무엇일까요?
저는 컴퓨터 공학을 전공하기 전에 두 아이를 키우고 문학 학위를 받았기 때문에 제너레이티브 AI가 8학년 또는 9학년 에세이를 꽤 잘 쓸 수 있는 세상에서 교육자들이 성공을 어떻게 측정할 것인지에 대해 스스로에게 진지한 질문을 던지고 있습니다.
그래프 계산기가 처음 등장했을 때 교사는 학생들이 스스로 수학을 할 수 있는지 어떻게 알 수 있었을까요? 교육은 학생들이 어떤 도구를 사용할 수 있는지 파악하고 새로운 방식으로 '자신의 작업을 보여주도록' 요구함으로써 발전했습니다.
저희를 포함한 기업들은 이러한 모델이 무엇에 도움이 될지, 그리고 이것이 혼란이 아닌 진화가 될 수 있도록 하는 방법을 고민해야 할 책임이 있습니다.
7. 책임감을 언급해 주셔서 감사합니다. Google이 머신러닝을 개발하는 방식에 대해 설명해 주시겠어요?
Google은 시간을 들여 신중하게 접근하고 있습니다. Google은 제품을 개발할 때 도움이 될 수 있고 해를 끼치지 않아야 한다는 확신을 갖고 있습니다. 2018년에 Google은 AI 원칙을 개발 및 발표한 최초의 기업 중 하나이며, 이를 준수하기 위한 내부 거버넌스 구조를 마련했습니다. 현재 Google의 AI 작업에는 Google의 책임감 있는 AI 그룹을 비롯해 편견, 독성 및 기타 피해를 방지하고 새로운 기술을 개발하는 데 중점을 둔 여러 그룹이 참여하고 있습니다.
8. 이러한 큰 기술적 도약이 이미 작고 유용한 방식으로 나타나고 있다고 말씀하시는 것을 들었습니다. 하지만 제너레이티브 AI가 사회에 얼마나 큰 도약을 가져올 수 있을까요?
우리는 이제 기계가 이미지 분류나 문서 생성과 같은 간단한 문제를 해결할 수 있다는 것을 알고 있습니다. 하지만 복잡한 추론이 필요한 문제 해결과 같이 훨씬 더 야심찬 기능을 수행할 준비가 되어 있다고 생각합니다. 현재 생성형 AI는 입사 지원서를 작성하는 데 도움을 줄 수 있습니다. 미래에는 창의적인 워크플로우와 프로세스를 점검하여 새로운 사고방식으로 완전히 새로운 과제를 해결할 수 있는 자유를 줄 수도 있습니다. 시간이 지남에 따라 협업과 실험을 통해 제너레이티브 AI의 더 많은 이점을 발견할 수 있을 것입니다.
#ai #google #bard #openai #chatgpt
[테크수다 기자 도안구 eyeball@techsuda.com]