학습 차원에서 틈틈이 해외 전문가들이 블로그나 미디어 그리고 책에서 쓴 글을 번역 또는 요약 정리하고 있습니다. 이번 포스팅도 그중 하나고요. 거칠고 오역된 부분이 있을 수 있습니다. 제대로 번역되지 않은 부분은 확인 주시면 반영토록 하겠습니다. 번역 과정에서 의미 전달이 애매한 일부 문장은 삭제했습니다. 이번 글은 코히어 블로그에 올라온 글을 정리한 것입니다.
요즘 인공지능의 놀라운 발전을 무시하고 넘어가기는 거의 불가능하다. 차세대 생성 챗봇부터 거의 모든 사진(또는 조만간 동영상)을 생성할 수 있는 모델에 이르기까지, AI 분야 발전 속도는 경이롭기 그지없다. 특히 이미지, 텍스트, 비디오, 음악을 생성할 수 있는 인상적인 생성 모델들이 점점 더 많아지는 생성 AI 분야는 더욱 그렇다.
이러한 발전은 대중의 상상력을 사로잡았고, 기업들은 조직에서 AI를 어떻게 활용할지 고민하고 있다. 기업들은 AI 유니콘을 찾기 위해 제품, 서비스, 프로세스에 AI를 도입하기 위해 서두르고 있다. 이들 기업 중 일부는 AI 사용 방법을 결정하는 데 어려움을 겪고 있고 다른 기업들은 현재 AI 환경이 복잡하고 탐색하기 어렵다는 것을 알게 된다.
이번 시리즈에선 생성 AI 모델이 가진 중요성을 살펴보고 생각하고 배포하는 데 유용한 관점에 대해 논의한다. 첫 번째 글에서는 생성 AI 현재 상태를 소개하고 어떻게 접근해야 하는지 간략하게 설명한다. 다음 글에서는 AI 기술과 가치 스택을 매핑해 생성AI가 어디에 적합한지 보다 잘 이해할 수 있도록 할 것이다. 마지막으로, 차세대 지능형 시스템을 만들기 위해 생성 AI를 더 잘 활용할 수 있는 방법에 대해 논의한다.
생성AI에서 중요한 것은 무엇일까? 미래일까, 아니면 현재일까?
시리즈 첫 번째 글에서는 네 가지 포인트를 다룬다.
1- 최근 AI 개발은 경외심을 불러일으키며 세상을 바꿀 것이다. 하지만 언제일까?
2- 엄선된 인상적인 데모와 시장에 출시할 준비가 된 신뢰할 수 있는 사용 사례 구분
3- 모델을 마인드(mind)가 아닌 지능형 시스템 구성 요소로 생각하라
4- 생성 AI는 빙산의 일각일 뿐이다
이제 각각의 내용을 좀 더 자세히 살펴보자.
1- 최근 AI 개발은 경외심을 불러일으키며 세상을 바꿀 것을 약속한다. 하지만 언제일까?
텍스트 생성: 인간 언어를 조리 있게 생성하는 소프트웨어
논리적인 텍스트를 생성하는 언어 모델 능력은 인간 기술에서 전환점처럼 느껴진다. 기사, 메시지, 문서 등 텍스트 의미와 문맥을 파악해 소프트웨어가 텍스트를 더욱 지능적으로 처리할 수 있도록 하는 언어 모델들 능력도 놀랍다.
우리는 알게 모르게 매일 대규모 언어 모델의 힘을 경험하고 있다. Google 번역, Google 검색, 텍스트 생성 모델들을 생각해보라. 즐겨 사용하는 수천 가지 애플리케이션과 기능은 대규모 언어 모델을 사용해 언어를 그 어느 때보다 더 잘 다루고 있고 매일 더 빠르고 효율적이며 정확해지고 있다.
이들 모델은 새로운 기능과 제품만 가능하게 하는 것이 아니다. 사실, 완전히 새로운 분야 기업들이 이들 기반으로 하고 있다. AI 글쓰기 어시스턴트를 개발하는 기업들이 점점 늘어나고 있는 것이 대표적이다. 여기에는 HyperWrite, Jasper, Writer, copy.ai와 같은 회사들이 포함된다. Latitude, Character AI, Hidden Door와 같은 대화형 경험에 모델 생성을 결합하는 회사들도 있다.
이미지 생성: 사물 이름을 지정하고 눈앞에 나타나는 것을 확인하라.
AI 이미지 생성은 생성 AI 영역의 또 다른 흥미로운 분야다. 이 영역에서는 DALL-E, 미드저니, 스테이블 디퓨전과 같은 모델이 전 세계를 강타하고 있다.
AI 이미지 생성은 특별히 새로운 기술은 아닙니다. 약 9년 전부터 GAN(생성적 적대 신경망)과 같은 모델을 통해 사람, 예술품, 심지어 집 이미지까지 생성할 수 있었다. 그러나 이들 모델은 각각 생성하는 객체 유형에 맞게 학습돼 이미지를 생성하는 데 오랜 시간이 걸렸다.
현재 AI 이미지 생성 모델에선 단일 모델로 많은 이미지 유형을 생성할 수 있다. 사용자가 생성된 이미지를 텍스트로 설명해 제어할 수 있는 기능도 제공한다.
이들 도구가 간단한 텍스트 프롬프트만으로 소프트웨어가 만들어낼 수 있는 것에 대한 기대치를 뛰어넘을 때 흥분을 가라앉히기가 어려울 때가 많다. 모두가 이들 모델을 보면 무언가 바뀌었다는 깊은 느낌을 받는다. 우리가 알고 있는 세상에 어떤 변화가 일어났고 제품, 산업, 경제에 지속적인 영향을 미칠 것으로 보인다. 그 잠재력은 분명해 보인다. 이러한 잠재력이 바로 신중함이 타당성을 갖는 이유다.
신중한 흥분 조절
소셜 미디어에 "모델 X로 불가능한 작업 Y를 수행했다"라고 주장하는 게시물이 넘쳐나기 때문에 이러한 주장들을 걸러낼 수 있는 안목으로 무장하는 것이 중요하다. 중요한 질문 중 하나는 시연되는 모델 역량이 사전에 선별된 사례들인지, 아니면 강력하고 신뢰할 수 있는 모델 동작을 가리키는지 여부다.
신뢰성은 AI 기능이 고객이 쓰는 일부가 되기 위한 핵심 요소다. 예를 들어, 지난 몇 년 동안 대규모 GPT 모델에 적용된 많은 기능들을 생각해 보라.2020년 일부 데모에서 텍스트 프롬프트만으로 웹사이트를 구축하기 위한 코드를 생성하는 모델 기능을 예로 들 수 있다. 3년이 지난 지금 이런 기능들은 웹사이트를 구축하는 방식이 아니다.
언어 모델을 사용한 코드 생성은 소프트웨어 작성 방식을 거의 확실하게 바꿀 것이다.(Replit, Tabnine, 코파일럿 사용자들에게 물어보라.. 하지만 그 시기는 확실하지 않다. 위 트윗에서 '거의'는 2년에서 5년 사이가 될 수 있다. "대부분의 사람들은 1년 안에 달성할 수 있는 것을 과대평가하고 10년 안에 달성할 수 있는 것을 과소평가한다"는 빌 게이츠의 말이 여기에 적용될 수 있다. 새로운 기술에 대한 사람들 기대치도 마찬가지다.
지난번 기술 업계가 딥러닝 열풍에 휩싸였을 때 우리는 2020년까지 자율 주행 자동차가 상용화될 것이라는 약속을 받았다. 하지만 자율주행차는 아직 오지 않았다.
2- 인상적인 엄선된 데모와 시장에 출시할 준비가 된 신뢰할 수 있는 활용 사례들을 구분하라.
대규모 텍스트 생성 모델은 많은 질문에 올바르게 답할 수 있다. 하지만 신뢰할 수 있을까?Stack Overflow는 그렇게 생각하지 않는다. 소프트웨어 개발자들이 질문하는 인기 있는 포럼인 스택오버플로우는 "ChatGPT에서 정답을 얻는 평균 비율이 너무 낮기 때문에" 기계 생성 답변이 사이트에 게시되는 것을 금지했다. 이것은 일부 사람들이 모델이 복잡한 문제 세트에 대해 정확한 정답을 안정적으로 생성할 수 있을 것으로 기대했던 사용 사례다.
현재 신뢰할 수 있는 AI 사용 사례
그러나 이들 모델이 훨씬 더 신뢰할 수 있는 결과를 제공할 수 있는 다른 사용 사례(및 워크플로우)도 있다. 그 중에서도 신경 검색(neural search), 텍스트 자동 분류(분류), 카피라이팅 제안 및 생성 모델에 대한 브레인스토밍 워크플로우가 핵심이다. 놀라운 데모들은 계속 출시될 예정이다. 이들 데모는 이러한 모델의 한계와 새로운 가능성에 대한 커뮤니티 발견 과정의 일부다. 그러나 체리피킹(cherry picking, 유리하던가 좋은것만 보여주던가 고르는 태도)질문을 계속 던지고, 불확실한 타임라인을 인식하며, AI 시스템과 모델의 견고성과 신뢰성에 투자하는 것이 중요하다.
3- 모델을 마인드가 아닌 지능형 시스템 구성 요소로 생각하라.
일관성 있는 텍스트를 생성하는 언어 모델의 능력은 계속 향상될 것이다. 언어 모델이 지각이 있다고 생각하는 것보다 소프트웨어 시스템의 언어 이해 및 언어 생성 구성 요소로 생각하는 것이 더 유용한 프레임워크다. 언어 모델은, 특히 언어와 시각과 관련해 소프트웨어가 기존에 할 수 있었던 것 이상의 지능과 동작을 할 수 있게 해준다.
이같은 맥락에서 언어 이해라는 용어는 인간 수준 이해와 추론을 의미하는 데 사용되지 않는다. 하지만 이들 모델은 텍스트에서 훨씬 더 많은 정보와 그 이면의 의미를 추출하여 소프트웨어 유용성을 높일 수 있다.
모델을 구성 요소로 생각하면 여러 단계 또는 모델을 사용하는 고급 시스템을 구성할 수 있다.
4- 생성AI만으로는 빙산의 일각에 불과하다
기술적인 관점에서 볼 때 텍스트 및 이미지 생성 모델은 고유한 유형이나 'AI' 하위 영역(sub-area)으로 분류할 수 있을 만큼 충분히 구분되지 않는다. 동일한 모델을 거의 또는 전혀 조정하지 않고도 다양한 다른 사례들에 사용할 수 있다. 생성에 대해 임의의 선을 그을 때 우려되는 점은 업계에서 점점 더 많은 시스템을 안정적으로 구동하는 더 성숙한 다른 AI 기능을 놓칠 수 있다는 것이다.
생성 AI는 방대한 데이터셋으로 학습된 더 크고 우수한 모델들을 통해 AI 모델이 텍스트와 이미지를 더 나은 수치로 표현할 수 있기 때문에 가능하다. 개발자들에는 이러한 표현이 생성 외에도 다양한 가능성을 가능하게 한다는 사실을 아는 것이 중요하다. 이러한 주요 가능성들 중 하나는 신경망 검색이다. 신경망 검색은 언어 모델을 사용해 단순한 키워드 검색을 개선하는 새로운 유형의 검색 시스템이다. 의미 별로 검색할 수 있다. 신경망 검색은 텍스트 분류와 함께 많은 업계 사용 사례들(풍자 분류 등 일부 까다로운 영역 포함)에서 AI가 신뢰할 수 있는 결과를 생성하는 사용 사례로 적합하다.