brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Mar 13. 2024

Weekly news about LLM - 2월 둘째주

제목: 오픈AI, AI 에이전트 개발 중...“곧 출시될 모델이 모든 것 바꿀 것”

요약: 오픈AI가 지난 1년동안 2가지 타입의 AI 에이전트 개발에 매달려 왔으며, 이것이 출시되면 모든것을 바꿀것이라고 기대하고 있다. 첫번째 에이전트는 ‘PC용 AI 에이전트’이며 알아서 문서를 분석해서 보고서를 작성하거나 회계 소프트웨어에 입력해준다. 마우스 이동, 클릭, 텍스트 입력들의 사람의 작업을 대신 처리해준다. 두번째는 ‘AI 개인 비서’에 가까운 에이전트이다. 인터넷에서 데이터를 수집하고, 특정 예산에 맞게 여행 일정을 짜고, 항공권을 예약해주는 일을 할 수 있다.

https://www.aitimes.com/news/articleView.html?idxno=157089


제목: 허깅페이스 리더보드 첫 평균 80점 능가 모델 등장...“오픈 소스 급속 발전”

요약: 허깅 페이스 오픈 소스 LLM 리더보드에서 최초로 평균 80점을 넘긴 모델이 등장했다.(평균점수 80.48점) 미국의 스타트업 Abacus AI의 모델인 ‘Smaug-72B’가 1위를 차지했다. Smaug는 작년에 인기였던 알리바바의 오픈 소스 모델 ‘Qwen-72B’를 튜닝한 모델이다. (Qwen은 73.6점) 샌프란시스코에 본사를 둔 Abacus는 AWS에서 AI 부문 총괄이었던 빈두 레디가 이끌고 있고, 구글이나 우버등을 거친 주요 엔지니어들이 포진해 있다.

https://www.aitimes.com/news/articleView.html?idxno=157106


제목: 애플, 이미지 편집 최적화된 생성 AI ‘MGIE’ 출시

요약: 애플이 이미지 편집에 최적화된 AI 모델 ‘MGIE(MLLM-Guided Image Editing)‘를 출시했다. 자연어 명령으로 다양한 이미지 편집이 가능한 획기적인 도구라는 평가다. 이 모델은 포토샵 스타일 수정, 사진 최적화, 로컬 편집 등 다양한 편집을 텍스트 프롬프트로 처리해 낸다. MGIE는 애플과 UC 산타바바라 연구진의 협업 결과이고, ICLR에 발표되었다. MGIE는 멀티모달언어모델을 사용하고, ‘하늘을 더 파랗게 만드십시오’ 라는 명령어를 입력하면 ‘하늘 영역의 채도를 20% 증가시키십시오‘로 변환하여 이미지를 생성할 수 있다. MGIE는 깃허브에서 오픈소스 프로젝트로 제공되며 웹데모를 통해 온라인으로 체험가능하다 (https://huggingface.co/spaces/tsujuifu/ml-mgie)

https://www.aitimes.com/news/articleView.html?idxno=157068


제목: ‘제미나이 AI 생태계’ 구축 나선 구글

요약: 구글이 작년 12월 오픈한 새 LLM인 ‘제미나이‘는 텍스트, 이미지 인식을 넘어 물건의 속성과 특성까지 파악해서 추론까지 가능하다. 구글은 ‘제미나이‘를 중심으로 서비스를 개편하고 있다. 생성 AI 챗봇 바드를 ‘제미나이‘로 전환하고, 고성능 모델인 ‘제미나이 울트라 1.0’을 기반으로 한 유료 모델인 ‘제미나이 어드밴스트‘를 국내에서 월 2만9천원에 서비스하고 있다. ‘제미나이 어드밴스트‘를 활용해 코딩 지원, 맞춤형 개인교사, 아이디어를 프로토타이핑 할 수 있다. 또한, 구글 클라우드내에 ‘듀엣 AI’에도 제미나이를 적용해서 구글닥스, 지메일, 스프레드시트등에서 활용할 수 있도록 했다.

https://www.hankyung.com/article/202402084903


제목: MS, 코파일럿 확대 시동…‘AI 리더’ 입지 다지기

요약: 코파일럿은 MS 소프트웨어 워드와 엑셀, MS365 등에 생성형 AI를 접목한 서비스다. 워드나 엑셀에서 코파일럿을 통해 데이터를 요약하거나 질문에 답을 얻을 수 있다. 작년 11월 월 30달러에 최소 300개이상 구독을 조건으로 기업들에게 코파일럿을 판매했다. 24년 1월부터는 개인 고객 대상으로 월 20달러에 이용할 수 있는 ‘코파일럿 프로‘를 출시 했고, 기업 대상의 최소 구독 수 300개 제한도 해제했다. MS는 코파일럿에 향상된 이미지 편집 기능과 새로운 LLM을 업데이트했다. 개선된 코파일럿 환경에선 새로운 LLM ‘데우칼리온‘을 통해 사용자 답변 정확도를 조정할 수 있다. 생성형 AI 시장은 MS 코파일럿 vs 구글 제미나이 대결로 흐르게 될 전망이다.

https://www.ddaily.co.kr/page/view/2024020903425554745


제목: MS, 정확도 조정 가능한 챗봇 ‘데우칼리온’ 추가...“정확도 낮추면 창의적 글쓰기 가능”

요약: 코파일럿은 ‘빙 챗‘이라는 이름으로 출시된 지 1년을 맞았다. MS는 현재까지 코파일럿을 통해 50억건이 넘는 채팅과 50억개 이상의 이미지가 생성됐다고 밝혔다. 업그레이드된 코파일럿에는 사용자가 답변 정확도를 조정할 수 있도록 새로운 LLM ‘데우칼리온(Deucalion)‘이 도입됐다. 사용자가 챗봇의 답변 스타일을 선택할 수 있도록 ‘창의(Creative)’ ‘균형(Balanced)’ ‘정밀(Precise)’ 등 세가지 옵션을 제공한다. Creative 모드는 구체적인 사실이 아니라 허구의 세계 구축 및 글쓰기, 디자인과 같은 창의적인 업무에 효과적이며, 학교나 직장에서 사용하는 경우에는 ‘Balanced’ 나 ‘Precise’ 모드가 적합하다.

https://www.aitimes.com/news/articleView.html?idxno=157091


제목: ‘생성형 AI’가 바꾼 클라우드 시장 판도… 아마존 추락하고 MS·구글 약진

요약: 한때 점유율 40%에 육박했던 AWS의 점유율이 31%대로 떨어지고, MS(24%)와 구글(11%)은 사상 최대치를 갱신하고 있다. 이는 클라우드 서비스가 단순히 컴퓨팅 인프라를 싸게 이용하는 것을 넘어 AI나 다양한 SW 서비스까지 활용하는것이 대세가 되면서 ChatGPT나 제미나이를 보유하고 있는 MS나 구글의 경쟁력이 커지고 있는것을 의미한다. 참고로 AWS, MS, 구글 다음의 클라우드 시장 점유율은 알리바바 클라우드(4%), 세일즈포스(3%), IBM(2%), 오라클(2%), 텐센트(2%) 순이다.

https://biz.chosun.com/it-science/ict/2024/02/08/UWF2WSQB4VD7TG5FUMIC6F34BQ/?utm_source=naver&utm_medium=original&utm_campaign=biz


제목: 두 발로 움직이는 휴머노이드 로봇노동자, 올해 ‘인력시장‘에 나온다

요약: 미국의 애질리티 로보틱스가 상용화에 성공한 ‘디지트‘는 키 175cm, 65kg의 성인의 체격과 비슷한 휴머노이드이고 대당 가격은 25만달러 수준이다. 아마존의 물류창고에 활용되는 것을 목표로 LLM을 통해 ‘디지트‘에게 다양한 일을 시키는것을 실험중이다. 테슬라의 휴머노이드 ‘옵티머스‘는 빠르면 24년 고객에게 인도될 수 있으며, 전기차 공장에 투입해 차량 가격을 낮추는것을 목표로 하고 있다. 미국의 앱트로닉도 22년 8월 물류’ 창고에서 운반 업무를 하는 아폴로‘를 공개했고, 올해 시판용 로봇 생산을 시작하는 것을 목표로 하고 있다. 한편 중국 정부는 특히 LLM과 같은 인공지능의 최신 기술을 탑재한 휴머노이드 개발을 독려하고 있다.

https://www.hani.co.kr/arti/science/technology/1127626.html


제목: 요즘 대세 ‘온디바이스 AI’, 어디까지 뻗어나갈까

요약: 삼성전자의 자체 on-device LLM을 탑재한 갤럭시S24, 업스테이지의 경량 LLM, ‘Solar’를 탑재하는 LG전자의 노트북, 반도체 기업 딥엑스도 내년 하반기까지 on-device AI를 위한 칩을 개발하겠다고 발표했다. on-device LLM의 장점은 서버의 GPU 가격과 전력 부담을 줄여주고, 네크웍 통신없이 정보처리가 가능하기 때문에 빠르고, 개인정보등 privacy 이슈나 보안 문제에서 자유롭다는 점이다.

https://news.bizwatch.co.kr/article/industry/2024/02/08/0023


제목: 구글 딥마인드, LLM으로 ‘로봇 제스처’ 생성하는 ‘젠EM’ 공개

요약: 구글 딥마인드와 토론토대학교, 로봇 전문 호쿠 랩스 연구진이 대형언어모델(LLM)을 사용해 로봇의 다양한 제스처를 생성하는 솔루션 ‘젠EM(GenEM)’을 공개했다. 연구진은 “핵심은 LLM에서 사용할 수 있는 풍부한 사회적 맥락을 활용, 적응 가능하고 구성 가능한 표현 행동을 생성하는 것“이라고 말했다. LLM에 내장된 지식을 활용하여 특정 상황에서 로봇이 눈을 맞추거나 고개를 끄덕이거나 미소를 짓게 할 수 있다.

https://www.aitimes.com/news/articleView.html?idxno=157076


작가의 이전글 Weekly news about LLM - 2월 셋째주
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari