brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Apr 22. 2024

Weekly news on LLM - 4월 셋째주


제목: 메타, 최신 LLM '라마 3' 출시…AI 챗봇 '메타 AI'에 탑재

요약: 메타가 새로운 LLM 'Llama 3' 초기 버전을 공개, 자사 AI 챗봇인 '메타 AI'에 탑재한다. 메타는 18일 페이스북, 인스타그램, 왓츠앱 등 자사 소셜 미디어 앱에서 AI 검색을 할 수 있는 메타 AI를 구축하는 데 라마 3를 사용했다고 밝혔다. 자사 서비스에 생성형 AI를 도입하는 것은 이번이 처음이다. 메타는 “메타 AI는 '노을 전망이 멋진 레스토랑을 찾아줘', '이번 주말 어떤 콘서트가 열리는지 알려줘' 등 질문에 대한 실시간 정보를 제공한다”고 설명한다. 메타에 따르면, 라마3는 구글 제미나이, 미스트랄 AI 등 무료로 사용할 수 있는 LLM 중 가장 정교한 모델이다. 라마 3-70B 모델 수학, 물리학 등으로 문제해결 능력을 평가하는 MMLU에서 79.5점으로 구글 제미나이 프로 1.0(71.8점), 미스트랄8x22B(77.7점)보다 앞섰다. 이번에 공개한 라마 3는 8B와 70B 2개 버전의 모델이다.

https://www.etnews.com/20240419000049


제목: 오라클 DB의 아버지, 앤디 멘델손… “굳이 LLM 만들 필요 없어”

요약: 대규모언어모델(LLM)을 개발하기 위해서는 굉장히 많은 비용이 든다. 이미 잘 만들어져 있는 것을 쓸 수 있는데 굳이 만들 필요가 있을까? 시중에 나와 있는 좋은 LLM 모델과 보다 잘 연동될 수 있도록 지원하는 것에 집중하고 있다” ‘데이터베이스(DB)의 아버지’로 불리는 오라클 앤디 멘델손(Andy Mendelsohn) DB 서버 기술개발사업부 총괄부사장이 오라클이 직접 LLM을 개발하지 않는 이유를 설명한 말이다. 오라클의 DB에 LLM을 더함으로써 자연어로 질문하고 답변하는 기능이 더해졌다. 가령 ‘회사의 최근 실적이 어떤가’를 자연어로 물으면 LLM과 연동된 DB가 이에 대한 값을 제시하는 형태다. 오픈AI를 비롯한 주요 LLM 개발 기업과 협력한다. 중요도가 높은 비즈니스 데이터인 만큼 답변의 정확도를 높이기 위해 기업 내부에 있는 데이터를 기반해 답변토록 하고, 필요에 따라 메타 데이터를 더하거나 주석을 덧붙이는 등의 추가적인 기능을 마련했다. 오라클측은  “오픈AI나 마이크로소프트(MS) 등 여러 벤더와 파트너십을 맺어 오라클클라우드에 LLM이 탑재하거나, 오픈AI의 LLM을 이용한 프라이빗 LLM을 만드는 것도 가능할 것”이라며 “AI 커뮤니티에서는 업무별로 특화된 LLM을 만들려고 하는 움직임도 많은데, 이런 기업들과 협력해 특화된 기술을 오라클이 저렴한 비용으로 사용할 수 있도록 하는 방향도 가능할 것”이라고 했다.

https://www.ddaily.co.kr/page/view/2024041613510231515


제목: MS, 사진 한장으로 말하고 노래하는 영상 만드는 ‘바사-1’ 공개

요약: 마이크로소프트가 스틸 사진 한장으로 사람들이 말하고, 몸짓을 하고, 움직이는 실감나는 동영상을 생성할 수 있는 ‘VASA-1’이라는 새로운  AI 프레임워크를 공개했다. VASA-1은 얼굴 스틸 이미지와 음성 오디오 파일을 제공하면 주어진 음성에 맞춰 정확한 입 모양을 생성한다. 특히 감정 스펙트럼, 즉 얼굴의 미묘한 표정과 자연스러운 머리 움직임까지 생성할 수 있다는 것이 장점이다. 더 중요한 것은 사용자가 생성을 직접 제어할 수 있도록 허용한다는 점이다.사용자는 슬라이더 바를 위아래로 움직여 모션 순서, 눈을 응시하는 방향, 머리 거리 및 감정 표현 등을 조절할 수 있다. 또 학습 데이터셋에 포함되지 않은 콘텐츠, 예를 들어 예술 사진이나 노래, 비영어 음성과 같은 것들을 생성해 낼 수 있다. 구글이나 알리바바도 최근 이와 비슷하게 사진 한장으로 동영상을 생성하는 기술을 공개한 바 있지만, MS측은 딥페이크 생성 위험을 고려할 때, 이 기술을 당장 공개할 계획은 없다고 밝혔다. 

https://www.aitimes.com/news/articleView.html?idxno=158962


제목: 한달간 '소라' 테스트한 영화감독 "아직 영화 제작은 무리" 

요약: 오픈AI의 동영상 생성 인공지능(AI) '소라'를 한달간 작업에 사용한 영화감독이 영화 제작에서 사용하기에는 아직 기술이 충분하지 않다는 평가를 내놓았다. 비즈니스 인사이더는 19일 영화감독 폴 트릴로와의 인터뷰를 통해 소라로 영상을 생성한 경험과 장단점 등을 소개했다. 부정적 평가의 가장 큰 이유로 프롬프트 입력의 한계를 꼽았다. 이를 "슬롯 머신같이 아이디어를 뒤섞어 준다"라고 표현했다. 즉 자신이 의도하는 정확한 장면을 만들기에는 텍스트로 설명하는 것이 한계가 있으며, 그 결과도 매번 달라진다는 말이다. 그리고 이미지 생성 AI에서도 공통으로 지적되는 일관성 유지의 어려움도 지적했다. 현실에서 벌어지는 물리적 법칙을 반영하지 않는 점과 이미지 스톡이 다양한 편이 아니라는 것도 문제로 꼽았다.특히 소라로 작업하는 동안 현장에서 배우나 스태프들과 함께 작업하며 느꼈던 긴장감이나 협업 과정이 없기 때문에, 영화 제작 과정을 독특한 경험으로 만드는 가장 중요한 요소가 빠졌다고 밝혔다. 트릴로는 AI와 스마트폰, 드론 등 실험적인 기술로 단편 영화를 제작하는 실험 영화 및 CF 감독이다. 최근 각종 영화제에서 '주목할 만한 감독' 등의 상을 수상했으며, MS와 IBM, 델, 이베이, 토요타, 포드 등의 광고를 감독했다.

https://www.aitimes.com/news/articleView.html?idxno=158946


제목: '챗GPT' 탑재한 이어버드 등장…"음성으로 대화 가능"

요약: '챗GPT' 키를 장착한 마우스에 이어, 이번에는 챗GPT와 대화할 수 있는 이어버드가 등장했다. 'AI폰'이 인기를 끌고 AI 전용 장치가 출시됨에 따라, 기존 제품에 챗봇을 결합하려는 추세가 늘고 있는데, 스마트폰 제조 업체 나싱(Nothing)이 이어버드 신제품 '나싱 이어' 시리즈에 챗GPT를 통합했다. 이어버드 하단부 스틱 부분에 챗봇 전용 버튼을 설치, 음성으로 질문하고 이어버드를 통해 답을 듣는 방식으로, 스마트폰과 이어버드간 ChatGPT기술을 통한 음성 채팅을 제공한다. 가격도 149달러와 99달러로 고가가 아니지만, 이어버드 단독으로 챗GPT를 작동하는 방식이 아니라, 나싱 휴대폰과 함께 사용해야 한다는 게 걸림돌이다. 이를 두고 새로운 장치를 만들어 내는 대신, 기존 제품을 이용해 제품 생태계를 강화하려는 시도라는 분석도 나왔다.한편 전날에는 로지텍이 챗GPT 버튼을 장착한 마우스를 선보였다. 단순 버튼 추가가 아니라, 기존 작업을 방해하지 않고 채팅을 할 수 있도록 작은 보조 창을 띄우는 방식으로 눈길을 모았다. 그외에도 래빗의 ‘r1’과 휴메인의 ‘Ai 핀’도 비슷한 사례로 볼 수 있다.

https://www.aitimes.com/news/articleView.html?idxno=158963


제목: 하루 종일 대화 녹음하고 정리해 주는 14만원짜리 AI 웨어러블 등장

요약: 목걸이처럼 착용하거나 옷에 부착, 하루 종일 대화 내용을 녹음하고 텍스트를 정리하고 요약해주는 AI 웨어러블 장치가 등장했다. 가격은 99달러지만, 월 20달러 구독료가 붙는다.비즈니스 인사이더는 17일 스타트업 리미트리스가 AI 기반 웨어러블 펜던트를 출시했다고 보도했다. 나중에 재생할 수 있도록 하루 종일 회의 및 대화를 녹음하는 기억 보조 장치다. 녹음된 내용을 들을 수 있는 것은 물론, 텍스트로 정리하거나 요약을 생성할 수 있다.

녹음하는 동안에는 LED에 불이 들어온다. 물론 허락 없는 녹음을 방지하기 위해 '동의 모드'를 먼저 작동해야 한다.

즉 음성 식별을 이용, '동의한다'라고 말한 사람의 목소리만 녹음한다. 여러명이 대화를 나눌 경우 동의하지 않은 사람 목소리는 가려낸다. 녹음 내용은 클라우드에 무제한으로 안전하게 저장된다는 설명이다. AI 웨어러블은 등장 초기라, 제품 공개 시 큰 화제를 모을 수 있다는 것이 장점이다. 반면 그만큼 기대로 높아 Ai 핀과 같이 악평에 시달릴 수도 있다는 분석이다.

https://www.aitimes.com/news/articleView.html?idxno=158870


제목: 카카오, 브레인에 360억 투입 'LLM 연구 지원'

요약: 카카오가 인공지능(AI) 사업 자회사 카카오브레인에 360억원대 자금을 지원한다. 지난해 하반기에도 유상증자를 통해 700억원을 투입한 바 있다. 이번 유증으로 투입한 누적 출자액은 2300억원에 육박하게 됐다. 특히 양사가 합병을 검토 중인 가운데 유증이 이뤄졌다는 점에서 이번 절차가 눈길을 끈다. 카카오는 카카오브레인 지분 100%를 소유하고 있다. 카카오브레인은 한국판 챗GPT인 '코GPT2.0'을 개발하고 있다. 이미 내부 개발이 완료된 것으로 알려졌으나 완성도 문제로 시장에 출시하지 못하고 있다. 서비스의 완성도를 높이기 위해서는 추가적인 개발 비용 투입이 필요한 상황이다.

https://www.thebell.co.kr/free/content/ArticleView.asp?key=202404161617115680108076


제목: 코난테크놀로지, ‘혁신 Road 컨퍼런스’서 생성AI 소개

요약: 코난테크놀로지가 지난 16일 광주 김대중컨벤션센터에서 열린 ‘제8회 혁신 Road 컨퍼런스’에서 자체 개발 대규모 언어모델 ‘코난LLM’과 AI 동시통역솔루션 ‘코난 챗봇+’(코난 챗봇 플러스)를 소개하는 부스를 운영했다. 코난 LLM은 보고서 초안생성에 특화된 퍼포먼스로 B2G향 LLM을 지향하고, 디플정위가 강조하는 중앙부처와 공공기관의 업무 및 행정효율 향상과 방향을 같이 하는 점을 강조했다. 'AI동시통역솔루션 Konan Chatbot+'은 다양한 외국어 서비스에 대한 생활 밀착형 수요가 급증함에 따라, 지난해 출시된 코난챗봇플러스는 서울 명동역을 시작으로 주요 역사 및 쇼핑몰, 관광지 등에 설치되며 한국 방문 외국인의 언어장벽 해소를 돕고 관광 편의를 높여주고 있다고 회사 측은 전했다. 

https://www.fnnews.com/news/202404190823264338


작가의 이전글 Weekly news on LLM - 4월 둘째주
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari