제목: 오픈AI, '스트로베리' 정식 출시...챗GPT에 새 모델 '오픈AI o1' 탑재
요약: 오픈AI가 추론에 특화된 새로운 AI 모델 '오픈AI o1(오 원)'을 출시했다. 이 모델은 코드명 '스트로베리'로 불렸던 것으로, 오늘부터 챗GPT와 API로 서비스된다. 오픈AI는 새로운 모델 '오픈AI o1-프리뷰(preview)'와 '오픈AI o1-미니(mini)'를 공개했다. 두 모델은 유료인 챗GPT 플러스와 팀, 엔터프라이즈, 에듀에서 사용할 수 있다. 오픈AI는 "이 시리즈는 반응하기 전에 생각하는 데 더 많은 시간을 할애하도록 설계, 복잡한 작업을 추론하고 과학, 코딩, 수학 분야의 이전 모델보다 더 어려운 문제를 해결할 수 있다"라고 설명했다. 벤치마크에서는 기존 모델과 차원이 다른 성과를 거뒀다고 밝혔다, o1 모델은 물리학, 화학, 생물학 등 까다로운 벤치마크 과제에서 박사 과정 학생과 비슷한 수준을 보였으며, 국제 수학 올림피아드(IMO) 예선 시험에서 83%의 성적을 받아, 이전 모델인 'GPT-4o'의 13%를 크게 넘어섰다. 코딩 능력을 가리는 코드포스(Codeforces)에서는 89번째 백분위에 올랐다. 안전성도 대폭 강화했다고 소개했다. 가장 어려운 탈옥 테스트 중 하나에서 GPT-4o는 22점을 받았지만, o1-프리뷰는 84점을 기록했다. 미니는 개발자를 위한 비용 효율적인 코딩 전문 추론 모델이다. 즉, 광범위한 지식이 필요하지 않은 애플리케이션에 적합한 모델로, 프리뷰보다 80% 저렴하다. 이번 모델 개발에서 강조한 부분은 '테스트-시간 계산(test-time computation)' 학습법을 도입했다는 점이다. 이는 강화 학습(훈련 시간 컴퓨팅)이 더 많아지고 사고에 더 많은 시간을 할애할수록(테스트 시간 컴퓨팅) 지속적으로 향상된다는 개념으로, 스트로베리 이전 '큐스타' 개발 당시 샘 알트먼 CEO가 "인공일반지능(AGI)으로 가는 방법을 찾았다"라고 밝혔던 내용이다. 특히, 오픈AI는 이 방식이 기존 LLM의 훈련 제약과는 상당히 다르며, 이를 계속해서 조사하고 있다고 밝혔다.
또 '생각의 사슬(CoT)'을 사용해 생각하는 방법을 향상했다고 밝혔다. 이제 이 기능을 자동화해 사용자가 별도의 프롬프트 엔지니어링을 사용하지 않아도, 모델이 스스로 문제를 분석할 수 있도록 했다고 전했다.
https://www.aitimes.com/news/articleView.html?idxno=163388
제목: 오픈AI, 새 모델 'o1'…"논증 능력 대학원생 수준"
요약: 챗GPT 개발사 오픈AI가 ‘스트로베리'라는 이름의 프로젝트로 알려진 모델인 ‘o1’을 내놨다. 이 모델은 기존 LLM 기반 AI 모델의 약점으로 꼽힌 reasoning 능력을 대폭 향상했다. 가격과 속도 등을 중심으로 이뤄지던 생성형 AI 개발이 reasoning 분야로 옮겨가면서 인간의 일을 대신 수행하는 ‘AI 에이전트’의 등장이 빨라질 것이라는 전망이 나온다. 기존 모델과 달리 GPT라는 단어가 빠졌는데, 복잡한 reasoning 작업이 추가된 점을 고려해 카운터를 다시 1로 재설정해 ‘o1’이라는 이름을 붙였다는 설명이다. 물리학, 화학, 생물학 분야 벤치마크 결과 o1은 박사과정 학생과 비슷한 수준의 성능을 보였다. 오픈AI가 새롭게 내놓은 ‘오픈AI o1’의 가장 큰 특징은 ‘생각의 사슬’(chain of thought)이라는 이름이 붙은 reasoning 기능이다. 회사 측은 “대규모 강화학습 알고리즘은 훈련 과정에서 생각의 사슬을 사용해 모델에 생산적으로 사고하는 방법을 가르친다”며 “더 많은 강화학습과 더 많은 사고 시간에 따라 o1의 성능이 지속해서 향상되는 것을 확인했다”고 설명했다. o1은 기본 모델 ‘o1-프리뷰’와 소형 모델 ‘o1-미니’ 두 종류로 출시됐다. o1-미니는 모델 크기가 작아 가격이 저렴한 대신 코딩에 적합하다. 챗GPT 유료 이용자는 이날부터 새 모델을 바로 써볼 수 있다. 아직 웹 검색이나 파일·이미지 업로드 같은 기능은 제공하지 않는다. o1과 같은 논증 기능이 발전하면 생성형 AI가 단순히 답변을 주는 수준을 넘어 명령에 필요한 업무를 수행하는 ‘AI 에이전트’로 진화할 수 있다. 지금은 “휴가 계획을 세워줘”라고 입력하면 추천하는 여행지와 가볼 만한 곳을 알려주는 정도에 그치지만 AI 에이전트가 되면 비행기 티켓 예매와 호텔 예약 같은 업무까지 알아서 할 수 있다.
https://www.hankyung.com/article/2024091386441
제목: 5년 안에 뜨는 AI, ‘멀티모달 생성 AI’와 ‘오픈소스 LLM’
요약: 앞으로 5년 안에 ‘멀티모달 생성형 AI’와 ‘오픈소스 LLM이 기업 환경을 크게 바꿀 것이라는 전망이 나왔다. 가트너는 10일 ‘2024 생성형 AI 하이프 사이클’ 보고서를 통해 향후 AI 시장 전망을 내놓았다. 보고서는 향후 5년 내에 조직에 큰 영향을 미칠 잠재력이 있는 기술로 ‘멀티모달 생성형 AI’와 ‘오픈소스 LLM’을 꼽았으며, 향후 10년 내에 주류가 될 것으로 예상되는 가장 잠재력이 높은 기술로 ‘도메인 특화 생성형 AI 모델’과 ‘자율 에이전트’를 꼽았다. 가트너 수석 VP 애널리스트는 “생성형 AI는 현재 부풀려진 기대의 정점을 지나 기대감과 관심이 급격히 줄어드는 환멸의 골짜기 단계에 있다. 과대광고가 가라앉으면 실질적인 이점이 나타날 것이며, 향후 몇 년 동안 기능이 빠르게 발전해 나갈 것”이라고 전망했다. 가트너 수석 VP 애널리스트는 “오픈소스 LLM은 맞춤화 과정을 통해 혁신 잠재력을 높이고, 개인정보 보호 및 보안에 대한 더 나은 통제, 모델 투명성, 협력적 개발 활용, 공급업체 종속성을 줄일 수 있는 가능성을 제공한다”며 “이는 궁극적으로 기업에게 더 작고 훈련이 쉽고 비용이 적게 드는 모델을 제공한다"고 전했다. 자율 에이전트는 인간의 개입 없이 정해진 목표를 달성하는 결합 시스템이다. 이는 다양한 AI 기술을 사용해 환경 패턴 식별, 의사결정, 행동 실행, 결과 생성 등 일련의 업무를 수행한다. 또한 환경으로부터 학습하고 시간을 거치면서 개선할 수 있는 잠재력을 가지고 있기에 복잡한 작업을 처리할 수 있게 한다. 브레테누 수석 VP 애널리스트는 “자율 에이전트는 AI 역량에서 큰 변화를 의미한다. 독립적인 운영 및 의사결정 기능을 통해 비즈니스 운영을 개선하고, 고객 경험을 향상시키며, 새로운 제품과 서비스를 가능하게 한다”며 “이는 비용을 절감함으로써 경쟁 우위를 확보하고, 조직 내 인력의 역할을 단순 업무 수행에서 감독 역할로 전환하는 데 도움을 준다”고 설명했다.
https://it.chosun.com/news/articleView.html?idxno=2023092123179
제목: 오픈AI가 세일즈포스·워크데이 같은 유력 SaaS도 대체?...도발적인 화두 탄력
요약: 오픈AI로 대표되는 LLM 기반 생성형AI 기술이 세일즈포스와 워크데이 같은 엔터프라이즈 SaaS 업계에 위협이 될 것이란 관측이 일각에서 나오고 있는 가운데, 후불 결제(buy now, pay later: BNPL) 핀테크 기업 클라르나가 이를 행동에 옮겨 눈길을 끈다. 클라르나의 세바스티안 스미아코스키 CEO는 최근 투자자들에게 클라르나가 세일즈포스 CRM과 워크데이 HR 솔루션을 포함해 많은 엔터프라이즈 애플리케이션 사용을 중단하고 있다고 밝혔다. AI로 똑같이 만들 수 있다는 이유에서였다. 라르나의 행보는 LLM 기반 생성형AI가 확산되면서 일부 B2B SaaS 업체들에게는 위협이 될 수 있다는 일부 전망과 연결돼 있다. 이론적으로 보면 생성형AI를 통해 기업들이 필요한 앱을 이전보다 쉽게 만들 수 있는 환경이 확산되면서 앱을 사지 않고 만들어쓰는 흐름이 확산될 수 있다는게 위협론의 골자다. 단순한 소스코드 작성을 넘어 배포부터 테스트까지 지원하는 AI 코딩 틀은 이미 빠르게 확산되는 상황이다. 이를 통해 기업들이 맞춤형 앱을 직접 만들어 쓰는 흐름이 탄력을 받을 수 있다는 얘기다. 하는 일 대부분이 기업 데이터를 관리하는 앱들이라면 특히 그럴 것이란 전망도 있다. 미아코스키 CEO 외에 다른 일부 엔터프라이즈 소프트웨어 전문가들은 앱 개발이 상대적으로 단순한 일이 되는 것은 불가피하다고 보고 있다. 클라우드 기반 데이터 플랫폼 업체인 스노우플레이크는 대화형 AI 덕분에 고객들이 비즈니스 분석을 시작으로 다양한 종류 앱들을 구축할 수 있다는 얘기를 공개적으로 밀고 있다고 디인포메이션은 전했다. 이미 여러 스타트업들이 오픈AI 및 오픈소스 LLM 기반으로 구축된 CRM 및 HR 앱을 기존 제품들보다 저렴하게 판매하려 하는 것으로 전해진다. 이들 중 어떤 서비스가 인기를 얻고 있는지는 아직은 파악되지 않고 있다고 디인포메이션은 전했다.
https://www.digitaltoday.co.kr/news/articleView.html?idxno=533665
제목: "메타도 GPU 10만개 클러스터 구축 중...연말 '라마 4' 훈련에 투입"
요약: 메타도 GPU 10만개로 구성된 슈퍼컴퓨팅 클러스터 구축을 앞둔 것으로 알려졌다. 이제 GPU 10만개 클러스터는 AGI 경쟁에 뛰어든 몇몇 기업의 필수조건이 됐으며, 이를 통해 100만개 GPU 클러스터 구축에도 도전할 것이라는 예측이다. 메타가 미국 모처에 엔비디아 'H100' 10만개 이상을 투입한 슈퍼 컴퓨팅 클러스터를 구축 중이다. 칩 구입에만 20억달러(약 2조7000억원)가 넘는 비용이 들어갔다. 10~11월 중 완공 예정으로, 메타의 '라마 4' 개발에 활용될 예정이다. 이에 앞서 지난 3일에는 일론 머스크 CEO가 '그록 3'를 훈련하기 위한 10만개 GPU 클러스터 '콜로서스'가 완성됐다고 밝힌 바 있다. 이는 현존 최대 규모의 슈퍼컴퓨팅 클러스터다. 그러나 일부 전문가들은 기술의 한계로 인해 머스크 CEO의 주장이 과장 일 가능성이 크다고 짚었다. 10만개의 GPU를 하나로 연결하는 데 필요한 네트워킹 기술이 아직 성공을 거둔 일이 없다는 근거에서다. 전력 공급도 문제로 꼽았다. 메타도 이 점이 똑같이 지적됐다. 이에 대해 메타는 이전에 엔비디아의 족점 네트워킹 장비를 이용하는 대신, 이더넷 기반 네트워킹으로 전환하고 있다고 밝힌 바 있다. '라마 3'를 훈련하는 데에도 '수렴형 이더넷을 통한 원격 직접 메모리 액세스(RoCE)'라는 고속 네트워크 프로토콜을 사용했다. AI 모델 성능을 높이기 위해서 GPU 클러스터의 크기가 중요하지만, 그게 전부는 아니다. 작은 클러스터로 오랜 기간 동안 훈련을 하면, 큰 클러스터와 맞먹는 모델 학습이 가능하다. 하지만, 문제는 시간이다. 오픈AI나 구글, 메타, xAI 등의 프론티어급 모델 성능이 거의 비슷해지며, 이제는 누가 빨리 모델을 구축하느냐의 싸움으로 변했다는 설명이다.
https://www.aitimes.com/news/articleView.html?idxno=163369