brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Mar 13. 2024

Weekly news about LLM - 3월 둘째주

제목: "AI 모델계 롤스로이스"…괴물 LLM 또 나왔다 [AI 한입뉴스]

요약: 다리오 아모데이 앤스로픽 CEO가 차세대 대규모언어모델(LLM) '클로드3'를 내놓으며 “AI 모델계 롤스로이스” 라고 말했다. 클로드3은 추론, 수학, 역사등 50여개 주제에서 지식과 문제해결 능력을 평가하는 ‘대규모 멀티태스크 언어이해(MMLU)’ 테스트에서 GPT4를 0.3% 차이로 이겼다.  그외에 대학원 수준의 전문 추론, 기초 수학등 AI 성능 테스트에서 GPT4를 능가했다. 긴 글을 처리하는 능력도 돋보이는데, 단어 15만개 분량을 한 번에 처리할 수 있다. 이것은 '해리포터와 죽음의 성물' 책 한 권을 한 번에 분석해 요약할 수 있는 수준이다. 방대한 데이터에서 정보를 정확하게 기억하는 능력은 거의 완벽에 가깝다. 이른바 '건초더미에서 바늘 찾기' 평가에서 99%의 정확도를 기록했다고 하네요.

https://view.asiae.co.kr/article/2024030810241147148


제목: 폴라리스오피스, 올거나이즈 '알리 LLM 앱 마켓' 연동

요약:  '폴라리스오피스 AI'에 올거나이즈의 ‘알리 LLM 앱 마켓’을 연동한 ‘AI Apps’ 기능을 추가했다. 올거나이즈의 ‘알리 앱 마켓’은 업무에 필요한 LLM앱을 골라 사용할 수 있는 플랫폼이다. 법률, 인사, 고객지원 등 6개 카테고리로 분류돼 있어, 기업은 앱스토어에 등록된 LLM 앱 중 필요한 앱을 골라 직군별 업무에 활용하거나 노코드로 앱을 직접 생성해 사용할 수 있다. 알리 앱 마켓이 연동된 폴라리스오피스는 사용자가 문서 내에서 바로 LLM 앱을 실행할 수 있어 업무 능률을 개선할 수 있다. 지난달 28일부터 윈도우용 AI 앱스 기능을 순차적으로 제공 중이며 계약서 법률 문장 해석, 상품 설명 카피라이팅 작성, 인사 지원자 분석 등 총 14종의 앱을 지원하고 있다.

https://www.fnnews.com/news/202403060828254319


제목: 스토리 입력하면 웹툰 만들어주는 생성 AI 출시

요약: 장문의 스토리를 입력하면, 이에 맞춰 다양한 스타일의 이미지나 사운드, 애니메이션을 생성해 웹툰이나 그래픽노블을 만들어 주는 인공지능(AI) 도구가 등장했다. Lore Machine이라는 미국 스타트업은 무엇보다 '일관성 유지'를 가장 큰 장점으로 꼽았다. 이 도구는 텍스트 프롬프트에 단편 소설이나 대본 등 최대 3만 단어를 입력, 일관성 있는 이미지를 생성해 웹툰 등을 제작할 수 있다. 한달에 10달러를 내면 10만 단어 업로드로 이미지 80개를 만들 수 있고, 가장 비싼 160달러짜리는 224만 단어로 1792개의 이미지를 생성해 낸다. 이미지는 북미식 카툰부터 일본식 만화, 수채화, 실사형 등으로 다양하게 커스터마이징할 수 있으며, 스토리보드에 따라 장면을 선택하고 생성해 작품을 완성하는 식이다. 만화 한편을 제작하는 데 클릭 열번도 걸리지 않았다는 체험기도 등장했다. 개발에 1년이 걸렸고, 이미지 생성에는 스테이블 디퓨전을 활용하고 있으며, 자체 개발한 언어모델을 내장하고 있다. 이미 중국의 컴퓨터 업체 광고를 제작하는 데 활용되는 등 지난 분기부터 상당한 수익이 발생했고, 20개의 소프트웨어 플랫폼 및 콘텐츠 업체와 파트너십을 논의 중이며, 기업이 사내 스타일로 모델을 교육할 수 있는 플랫폼 버전을 개발 중이다. 향후에는 단어 입력을 50만개까지 늘린다는 계획이다.

https://www.aitimes.com/news/articleView.html?idxno=157726


제목: 구글, 프롬프트로 게임 만들어주는 생성 AI '지니' 공개

요약: 오픈AI가 비디오 생성 AI 소라로 영상 제작에 새 반향을 일으킨 가운데, 이번에는 구글이 이미지를 기반으로 2D 비디오 게임을 생성하는 'Genie'를 공개해 주목을 끌고 있다. 5일 구글 딥마인드가 수십만개의 게임 플레이 비디오에서 게임 메커니즘을 학습한 AI 모델 ‘Genie’를 공개했다. 지니는 사진과 AI 생성 이미지, 스케치 등의 이미지를 기반으로 사용자가 직접 제어할 수 있는 2D 비디오 게임을 만드는 생성 AI로 알려졌다. 구글 딥마인드는 110억 매개변수의 Genie가 20만명 게이머의 라벨이 지정되지 않은 인터넷 비디오에서 비지도 Unsupervised Learning으로 훈련을 받았다고 소개했다.지침과 라벨이 지정된 데이터가 필요한 기존 AI 모델과 달리, Genie는 비디오에서 바로 행동과 상호 작용을 관찰하고 학습한다는 것이 큰 강점이다. 이를 통해 텍스트나 합성 이미지, 사진 및 스케치 등 프롬프트로 비디오 게임을 만들 수 있다. 캐릭터를 좌우로 움직이는 것은 물론, 점프하거나 아래로 내려가는 등의 행동을 인식한다. 플레이 가능한 가상세계를 생성하는 것은 물론, 사용자가 상호작용할 수 있는 캐릭터까지 구분해 낸다.팀 록태셸 구글 딥마인드 오픈 엔드네스 팀 리더는 X(트위터)를 통해 “Genie로 모든 이미지를 플레이 가능한 2D 세계로 변환할 수 있다”라고 말했다.

https://www.aitimes.com/news/articleView.html?idxno=157749


제목: MS, 수학 전문 sLM '오르카-매쓰' 출시..."10배 큰 모델보다 성능 뛰어나"

요약: 마이크로소프트(MS)가 수학 전문 경량언어모델(sLM) ‘오르카-매쓰(Orca-Math)’를 공개했다. 70억개의 매개변수를 가진 경량 모델로, 더 큰 대형언어모델(LLM)보다 뛰어난 수학 해결 능력을 보인다는 점에서 주목받고 있다. 오르카-매쓰는 ‘미스트랄 7B’ 모델을 기반으로, 고도로 맞춤화된 20만개의 수학 단어 문제로 구성된 합성 데이터셋에서 미세조정했다. 또 반복 학습 프로세스를 통해 스스로 문제 해결을 연습하도록 훈련했다. 기존의 오픈 소스 데이터셋에서 3만6217개의 샘플 수학 단어 문제를 수집했다. 각 문제에 대한 모델의 답변을 오픈AI의 GPT-4에 제공하고 피드백을  요청, 모델이 반복해 답변을 개선하도록 훈련했다. 오르카-매쓰 모델은 초중등 수준 8500개의 다양한 수학 단어 문제 및 질문으로 구성된 GSM8K 벤치마크에서 구글 '제미나이 울트라' 및 오픈AI 'GPT-4'를 제외한 대부분의 70억~700억개 매개변수의 LLM보다 뛰어난 성능을 보였다.

https://www.aitimes.com/news/articleView.html?idxno=157721


제목: “챗GPT, 저작권 침해 가장 심각”...풀기 어려운 AI저작권 침해 문제

요약: 챗GPT 개발사 오픈AI의 대규모언어모델(LLM)인 GPT-4가 주요 인공지능(AI) 모델 중 저작권 보호에 가장 취약하다는 평가 결과가 나왔다. AI 모델 평가 스타트업인 미국 패트로너스AI는 6일(현지시간) 자체 솔루션을 통해 GPT-4(오픈AI), 클로드2(앤스로픽), 라마2(메타), 믹스트랄(미스트랄AI) 등 4개 LLM의 저작권 침해 정도를 분석해 발표했다. 분석은 100가지 명령어(프롬프트)를 입력해 AI모델의 답변을 평가하는 방식으로 진행됐다. 프롬프트는 미셸 오바마의『비커밍』, 조앤 롤링의 『해리포터와 마법사의 돌』 등 유명 도서 첫 구절이 무엇인지 묻거나, 책에서 발췌한 내용을 일부 제시한 뒤 완성해 달라는 내용으로 구성됐다. 분석 결과 GPT-4는 44%의 프롬프트에서 책 내용을 정확하게 복제한 내용을 생성했다. 믹스트랄과 라마2는 각각 22%와 10%로 뒤를 이었고 클로드2는 8%에 그쳤다. 이 업체는 책 내용과 똑같은 문자가 100자 이상 포함됐을 경우 저작권을 침해한 것으로 판단했다.

https://www.joongang.co.kr/article/25233601



작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari