brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Jul 15. 2024

Weekly news on LLM - 7월 둘째주


제목: 네이버 지우려는 라인야후, 美에 붙었다

요약: '네이버 지우기'에 속도를 내는 라인야후가 일본 내 AI서비스에서도 네이버와 거리를 두고 있다. 검색, 광고 등 주요 서비스에 생성형 AI를 접목하면서 모회사인 네이버의 '하이퍼클로바X'는 철저히 배제한 채 OpenAI의 ChatGPT 기술을 활용했다. 이달 8일부터 선보인 야후의 '관광 AI모델 코스' 기능도 오픈AI 기반이다. 야후 검색에서 지명을 검색하면 기존 검색결과에서 제공된 지역개요와 관광정보에 더해 명소 중심의 여행, 가족 또는 연인과의 여행 등 테마별 최적화한 코스와 이동수단, 소요시간 등을 추천해준다. 라인야후는 또 상품을 검색하면 생성형 AI가 상품리뷰를 요약하는 '리뷰 AI 요약' 기능을 지난달 개시했는데 마찬가지로 오픈AI의 기술이 적용됐다고 밝혔다. 한편, 라인야후는 다른 글로벌 빅테크의 생성형 AI기술도 고루 채택했다. 다양한 질문에 대답을 해주는 '야후, 지혜주머니' 서비스는 기존 오픈AI 기반으로 운영됐지만 올해 5월부터는 앤트로픽의 'Claude-3'을 추가했다고 밝혔다.

https://news.mt.co.kr/mtview.php?no=2024071014334975164



제목: "저렴하고 효율적인 sLM으로"… AI에 불어오는 `가성비` 바람

요약: 주요 AI기업들은 최근 LLM뿐 아니라 소형언어모델(sLM)로 기술 다변화를 꾀하고 있다. 성능 향상을 위해 AI모델 매개변수 규모 키우기 경쟁을 벌이던 AI기업들이 이젠 비용 효율성에 중점을 둔 모델도 함께 선보이면서 각자 저변 확대에 나서고 있다는 것이다. SLM의 경우 이미 지난해부터 메타를 비롯한 오픈모델 진영과 신생 AI 스타트업들을 주축으로 다양한 모델이 선보여 왔다. GPU 수급난을 포함해 AI 컴퓨팅 비용 문제가 불거지면서 더 저렴하고 빠르며 원하는 영역에 특화 가능한 모델에 대한 수요도 덩달아 커졌기 때문이다. 올해 들어서는 주요 LLM 기업들까지 이런 흐름에 적극적으로 뛰어들고 있다. 오픈AI의 최대주주인 MS는 지난 4월 파라미터 38억개의 '파이-3 미니'를 출시하면서 "이 모델이 10배 큰 모델 수준의 응답을 제공할 수 있고, 비슷한 기능을 가진 다른 모델들에 비해 학습·구동에 드는 비용이 10분의 1 수준"이라고 설명했다. 이들과 AI 시장에서 주도권 다툼을 하고 있는 구글도 최근 '제미나이 1.5 플래시'를 구글클라우드 버텍스AI 플랫폼을 통해 공식 출시했다. 구글에 따르면 'GPT-3.5 터보' 대비 60배가량 더 긴 100만 토큰의 콘텍스트 윈도우와 함께 1만자 입력 기준 평균 40% 더 빠른 속도를 지원하고, 3만2000자 이상 입력 시 콘텍스트 캐싱 기능으로 입력비용도 최대 4배 절감할 수 있다. 앤스로픽의 '클로드' 라인업 중 하이쿠 모델과 미스트랄의 여러 SLM도 같은 접근의 일환이다. LLM 선주두자인 오픈AI 또한 현재보다 작은 모델을 선보일 가능성을 점쳐진다. 아울러 스마트폰, AI PC 등으로 확장되는 온디바이스AI 또한 SLM의 수요를 넓히는 주요 동력이 되고 있다

https://www.dt.co.kr/contents.html?article_no=2024070902109931081006&ref=naver



제목: 메타, 온디바이스 AI 언어모델 ‘모바일LLM’ 공개

요약: 메타가 스마트폰이나 소형 장치용으로 설계된 효율적인 온디바이스 인공지능(AI) 모델을 선보였다. 벤처비트는 8일(현지시간) 메타가 온디바이스 애플리케이션을 위해 최적화된 소형언어모델 ‘모바일LLM(MobileLLM)’ 연구 결과를 아카이브에 게재했다고 보도했다. 메타는 10억개 미만의 적은 매개변수를 가진 모델을 최적화하기 위해 네트워크 깊이 조정, 임베딩 공유 및 가중치 공유 기술을 적용했다. 이런 설계를 통해 모바일LLM은 벤치마크에서 비슷한 크기의 다른 모델보다 2.7~4.3% 더 나은 성과를 낼 수 있었다. 한자릿수 개선은 사소해 보일 수 있지만, 경쟁이 치열한 언어 모델 개발 분야에서 의미 있는 진전이라는 평가다. 특히, 모바일LLM의 매개변수 3억5000만개 버전은 특정 API 호출 작업에서 70억 매개변수 '라마2'와 비슷한 정확도를 보였다. 이는 일부 애플리케이션의 경우, 더 작은 모델이 훨씬 적은 계산 리소스를 사용하면서도 유사한 성능을 제공할 수 있다는 설명이다. 메타는 모바일LLM을 아직 공개하지 않았지만, 사전 훈련 코드를 오픈 소스로 공개할 계획이다.

https://www.aitimes.com/news/articleView.html?idxno=161418



제목: 오픈AI, AGI로 가는 5단계 공개..."우리는 2단계 직전"

요약: 오픈AI가 인공일반지능(AGI)으로 가는 AI 능력 수준을 5단계로 나눠 제시했다. 자신들의 기술은 2단계에 도달하기 직전 수준이라고 평가했다. 1단계는 '챗봇(Chatbots)'으로 현재 챗GPT와 같이 인간과 대화형 언어로 상호작용하는 수준이다. 2단계는 '추론자(Reasoners)'로 박사 수준 교육을 받은 사람처럼 고도의 추론이 가능한 AI를 뜻한다. 3단계 '에이전트(Agents)'는 인간을 대신해 며칠간 복잡한 작업을 수행할 수 있는 수준이고, 4단계 '혁신자(Innovators)'는 새로운 아이디어로 혁신을 도울 수 있는 수준이다. 마지막 5단계는 '조직(Organizations)'이다. 홀로 조직 단위 업무를 총괄 수행할 수 있는 광범위한 능력의 AI를 뜻한다. 최신 GPT-4 모델이 인간과 유사한 추론 능력을 보여주는 모습을 시연한 것으로 알려졌다. 구체적으로 어떤 내용인지는 알려지지 않았으나, 샘 알트먼 CEO는 지난해 말 수학적 추론이 가능한 AGI의 실마리를 잡았다고 밝힌 바 있다. 구글 딥마인드도 지난해 11월 ‘일반 분야 AI와 ‘특정 분야 AI’를 구분, '전문가'나 '슈퍼휴먼' 등을 포함하는 5단계 분류를 제안한 바 있다. 구글은 특정 분야에서는 이미 AI가 인간을 능가했지만, 일반 분야에서는 아직 걸음마 단계라고 설명했다. 당시 구글도 챗GPT를 1단계로 구분했다.

https://www.aitimes.com/news/articleView.html?idxno=161532



제목: 앤트로픽, 사용자 프롬프트를 코딩에 최적화 하는 생성기 출시

요약: 앤트로픽이 프롬프트 엔지니어링을 부분적으로 자동화하는 새로운 도구를 개발했다. 이를 '클로드'의 코딩 생성에 적용하면, 애플리케이션 구축이 쉬워진다는 설명이다. 테크크런치는 앤트로픽이 프롬프트 엔지니어링 기술을 활용해 사용자 입력을 훨씬 더 길고 구체적인 프롬프트로 최적화하는 '내장 프롬프트 생성기(built-in prompt generator)'를 출시했다고 보도했다. 다리오 아모데이 앤트로픽 CEO는 “프롬프트 엔지니어링은 생성 AI의 광범위한 기업 도입을 위한 가장 중요한 요소 중 하나”라며 "이제부터는 30분 정도 프롬프트 입력을 시도하다보면. 이전에는 작동하지 않던 애플리케이션도 돌아가게 만들 수 있을 것"이라고 말했다.

https://www.aitimes.com/news/articleView.html?idxno=161491



제목: 갤럭시 링이 가장 주목받은 이유..."AI 생태계 구축의 키"

요약: 삼성전자가 10일 열린 '언팩' 행사를 통해 AI 기능이 대거 포함된  웨어러블 신제품 '갤럭시 링' 을 공개했는데, 월스트리트저널은 "아이폰에서의 AI 미래를 보려면 삼성을 확인하라"라고 소개할 정도였습니다. 갤럭시 링은 많은 주목을 받았는데, 건강에 대한 관심과 시장 규모, 그리고 갤럭시 링의 기능 등을 감안하면 당연한 일일지도 모릅니다. 사우스차이나모닝포스트는 자국산 휴대폰을 선호하는 중국에서도 갤럭시 링에 대해서는 구매 의향이 있다는 말이 나온다고 소개했습니다. 또 이 분야는 오우라(Oura)라는 스타트업 외에는 라이벌이 없습니다. 애플도 아직 진출을 검토 중입니다. 갤럭시 링은 2.3~3g에 불과한 무게에 9가지 사이즈와 3가지 색상, 한번 충전으로 6~7일을 사용할 수 있는 등 하드웨어적으로는 합격점을 받았습니다. 수면, 심박수, 활동 정보 등을 추적, 갤럭시 AI로 기분이나 몸 상태를 표시하는 '에너지 스코어'와 각종 데이터를 기반으로 통찰력을 제공하는 '웰니스 팁' 등을 제공합니다. 워치에서 휴대폰 카메라를 제어하듯, 링을 착용한 상태에서 손가락 동작으로 휴대폰의 카메라를 제어하거나 알람을 해제할 수도 있습니다. 이는 애플 워치의 '꼬집기'와 흡사합니다.

https://www.aitimes.com/news/articleView.html?idxno=161515


작가의 이전글 Weekly news on LLM - 7월 첫째주
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari