brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Jun 07. 2024

Weekly news on LLM - 6월 첫째주


제목: 너무 솔직해서 문제가 된 '메타 AI'..."유튜브 자료 학습했다" 실토

요약: 메타도 오픈AI처럼 유튜브 동영상을 무단으로 학습한 것으로 밝혀졌다. 그런데 이런 사실을 알려준 것은 바로 메타의 인공지능(AI) 챗봇 '메타 AI'였다. 비즈니스 인사이더는 5일(현지시간) 메타 AI가 훈련 데이터에 유튜브가 포함됐다는 답변을 내놓았으며, 메타도 이를 부정하지는 않았다고 보도했다. 메타 AI는 지난해 9월 메타가 공개한 챗봇이다. 페이스북이나 인스타그램에 포함, 미국과 캐나다 등에서 서비스 중이다. 비즈니스 인사이더는 메타 AI에 어떤 데이터를 학습했고, 어떻게 데이터를 확보했는지 등을 질문했다. 그 과정에서 메타 AI는 수백만개의 유튜브 동영상을 통해 훈련을 받았다고 밝혔다. 또 메타는 메타 스크래핑 및 추출(MSAE)'이라는 자체 웹 스크래퍼 봇을 보유하고 있으며, AI 모델을 훈련하기 위해 웹에서 대량의 데이터를 스크랩한다고 대답했다. 유튜브에 대해서는 좀 더 자세한 대답도 내놓았다. 처음에는 훈련 데이터에 370만개의 유튜브 동영상으로 구성된 '제3자 데이터셋'이 포함돼 있다고 밝혔다. 추가 질문을 통해 제3자가 편집한 600만개의 유튜브 동영상에서 가져온 다른 전사 데이터(대본, 자막 등)가 포함돼 있다고 답했다.

https://www.aitimes.com/news/articleView.html?idxno=160361



제목: "기업 환경에 LLM 특화"…미스트랄AI, 미세조정 SDK 공개

요약: 미스트랄AI가 LLM의 성능을 개선하거나 기업에 특화할 수 있는 SDK인 Mistral-Finetune을 출시했다. 깃허브를 통해 공개된 Mistral-Finetune는 미스트랄의 AI 모델을 워크스테이션, 서버 및 소규모 데이터 센터 노드 등 다양한 인프라에 최적화할 수 있도록 지원한다. 공개된 내용에 따르면 해당 SDK는 다중 GPU 설정에 최적화되어 있지만 미스트랄 7B와 같은 소형 모델을 미세 조정하기 위해 엔비디아 A100 또는 H100 GPU 단일 모델로 설정을 변경하는 것도 가능하다. 예를 들어 오픈AI의 챗GPT를 사용한 140만 개의 대화 모음인 울트라챗과 같은 데이터 세트를 미세 조정하는 과정은 8개의 H100 GPU를 활용해 약 30분 만에 완료할 수 있다.

https://zdnet.co.kr/view/?no=20240606110628



제목: KT, MS와 ‘AI 맞손’…멀티 LLM 전략으로 간다

요약: KT가 마이크로소프트와 AI·클라우드 분야에서 대규모 협력에 나선다. LLM ‘믿음’을 보유한 KT는 ChatGPT 개발사 오픈AI에 투자해온 MS와의 협력을 통해 ‘멀티 LLM’ 전략으로 방향을 선회하게 됐다. 이 협약으로 KT와 MS는 AI·클라우드 연구·개발 공동 프로젝트, 한국형 AI·클라우드·IT 서비스 개발, AI·클라우드 이노베이션 센터 구축, AI·클라우드 인재 양성을 함께한다. AI GPU팜과 이를 위한 데이터센터 구축에도 나선다. 두 회사는 이번 협력에서 ‘소버린 AI·클라우드’ 공동 개발도 강조했다. 정보 주권을 강조하는 ‘소버린(sovereign)’은 자국 문화와 언어에 최적화된 AI 모델과 서비스를 만드는 개념이다. 각종 규제·보안 이슈가 있는 금융과 공공 분야는 해외 기업의 진입이 쉽지 않은 영역이라 MS에서도 국내 파트너를 찾던 것으로 전해졌다.

https://www.khan.co.kr/economy/economy-general/article/202406041412001



제목: ChatGPT, 7시간 동안 먹통 사태…클로드·퍼플렉시티도 일시 중단

요약: 오픈AI의 '챗GPT'에 장애가 발생, 7시간 동안 전 세계적으로 서비스 접속 차질을 빚었다. 비슷한 시간에 앤트로픽의 '클로드'와 퍼플렉시티 AI 웹 검색도 일시 중단된 것으로 알려졌다. 일부 사용자에 따르면 구글의 '제미나이'도 일시적으로 중단됐지만 곧 복구됐다. 오픈AI는 정확한 원인을 밝히지 않았지만, ChatGPT가 서비스 한계 용량에 도달해 중단됐다는 상태 메시지를 로그 기록으로 남겼다. 이번 장애로 인해 API 서비스는 영향을 받지 않은 것으로 알려졌다. 오픈AI에 따르면 챗GPT 주간 사용자 수는 1억명 이상에 달한다. ChatGPT는 지난해 11월과 12월에도 1시간 가량 대규모 접속 장애를 겪은 바 있다. 오픈AI는 11월 장애는 DDoS 공격과 관련있으며 API 서비스에도 영향을 미쳤다고 밝혔다. 최근 들어 가장 주목할만한 장애는 지난달 마이크로소프트 '빙' API 중단으로 인해 사용자가 웹 결과에 액세스할 수 없었던 경우였다.

https://www.aitimes.com/news/articleView.html?idxno=160342



제목: 머스크, 테슬라용 GPU 빼서 xAI에 투입

요약: 일론 머스크 테슬라 CEO가 테슬라에 배치하려던 엔비디아의 AI 칩을 xAI와 X로 빼돌렸다는 의혹에 휩싸였다. 이에 따르면 엔비디아 고위 간부가 지난해 12월 작성한 이메일에는 "머스크는 원래 테슬라에 공급할 예정인 'H100' GPU 1만2000개를 X로 재배정, 테슬라보다 우선 배치하고 있다"라며 "대신 올해 1월과 6월에 예정된 X의 'H100' 1만2000개 주문을 테슬라로 했다"고 쓰여있다. 이는 어렵게 구한 AI 칩을 테슬라보다 X와 xAI에 먼저 투입하는 등 테슬라보다 X나 xAI 쪽 사업에 우선 순위를 두고 있다는 지적이다. 이 경우 테슬라의 자율주행 기능이나 전용 로보택시, 휴머노이드 개발 등에 영향을 줄 수 있다. 이에 대해 머스크는 “테슬라는 엔비디아 칩을 구동할 곳이 없었기 때문에, GPU를 가져와도 창고에 쌓아 놓았을 것”이라며 “텍사스 기가팩토리 확장이 완료됐고, 이 곳에서 자율주행 기능(FSD) 학습에 H100 5만개를 투입하게 될 것”이라고 해명했다. 또 "내가 말한 테슬라의 올해 AI 관련 지출액 약 100억달러 중 절반 가량은 내부 비용으로, 주로 테슬라가 설계한 AI 추론 컴퓨터와 차에 탑재된 센서, 그리고 도조(Dojo)에 사용된다"라고 썼다. 도조는 테슬라의 자율주행 학습용 슈퍼컴퓨터다.

https://www.aitimes.com/news/articleView.html?idxno=160349



제목: 올거나이즈, 한국어에 강한 오픈소스 LLM ‘알파-인스트럭트’ 출시

요약: AI 솔루션 기업 올거나이즈가 한국어 실무에 강한 LLM인 ‘알파-인스트럭트’를 출시한다고 3일 밝혔다. 알파-인스트럭트 모델은 메타의 오픈소스 LLM인 ‘Llama-3’를 기반으로 제작된 파라미터 8B 규모의 경량 LLM이다. 한국어를 잘 이해할 수 있도록 라마3를 개량한 모델과 지시사항을 따르는데 특화된 라마3의 인스트럭트 모델을 병합하는 방식으로 제작됐다. 이후 보편적인 답변 선호도를 반영한 지시사항 데이터셋 2000개를 추가 학습시킴으로써 동일 대답 반복, 불필요한 영어 대답 등의 오류를 최소화했다. 알파-인스트럭트 모델은 오픈소스로 공개해 라이센스 제한 없이 누구나 자유롭게 사용 가능하다. 올거나이즈의 알리 플랫폼 내에서 사용할 수도 있으며, 기업 맞춤형 특화모델로 파인튜닝(미세조정)하거나 LLM을 내부 데이터에 연결해 RAG 솔루션과 자유롭게 결합해 활용할 수 있다.

https://it.chosun.com/news/articleView.html?idxno=2023092116972



제목: "애플, 10일 WWDC서 오픈AI 계약 발표"

요약: 애플이 10일 열리는 연례 세계개발자회의(WWDC) 무대에서 오픈AI와의 파트너십을 공식 발표할 것으로 알려졌다. 그러나 이는 임시방편일 뿐, 애플은 이후 자체 대형언어모델(LLM) 개발에 집중할 것이라는 분석이다. 이에 따라 애플은 전 세계 20억대 이상의 장치에 가장 인기있는 챗봇을 서비스하게 되며, 오픈AI도 이를 통해 확장의 계기를 맞을 것으로 봤다. 애플에 인수되기 전 '시리' 사업을 창립한 기술 베테랑 대그 키틀라우스는 "오픈AI와 애플의 관계는 단기 또는 중기적일 것"이라며 "그동안 애플은 자신의 역량을 키우기 위해 열심히 노력할 것"이라고 말했다. 애플은 '에이잭스(Ajax)'라는 자체 LLM을 보유하고 있으며, 시리의 업그레이드에 이를 투입할 예정이다. 어쨌거나 오픈AI와의 계약 이후에도 애플은 LLM 개발에 박차를 가할 것으로 보인다. 특히 애플은 전기 자동차 개발을 포기한 뒤 차세대 프로젝트로 로봇을 추진 중으로 알려졌는데, 여기에도 강력한 LLM이 필요하다는 분석이다.

https://www.aitimes.com/news/articleView.html?idxno=160371


작가의 이전글 Weekly news on LLM - 5월 다섯째주
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari