brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Apr 01. 2024

Weekly news on LLM - 3월 다섯째주


제목: GPT스토어 수익화 가능해진다…오픈AI "사용량 기반 모델 시험 중"

요약: 오픈AI는 28일 X를 통해 “GPT의 사용량 기반 수익화를 시험하기 위해 소규모의 미국 개발자들과 협력 중”이라며 “추가 세부 사항은 프로그램이 완료되면 공개할 것”이라고 발표했다. 이 회사는 GPT스토어에 챗봇을 출시한 일부 개발자들과 협력하고 있는 것으로 알려졌다. GPT스토어는 지난 1월 출시 때부터 수익화 가능성으로 주목받았다. 현재 구글 플레이나 앱스토어 같은 앱 마켓은 수수료 모델로 수익을 분배한다. 사용자가 지불한 사용료를 플랫폼과 개발자가 일정 비율로 나눠 갖는 방식이다. 사용자가 앱 마켓에서 1000원짜리 앱을 구입하면 플랫폼이 300원을 수수료로 가져가고 나머지 700원을 개발자에게 주는 식이다. (현재 결제 수수료는 최대 30%) 오픈AI가 24년 1월에 야심차게 GPT스토어를 내놨지만 아직 기대에 미치지 못한다는 평가가 나온다. 챗GPT 사용 트래픽 가운데 GPT스토어의 비율은 2.7%에 불과하다. 경쟁사에서도 비슷한 서비스를 내놓고 있다. 세계 최대의 오픈소스 AI 플랫폼 중 하나인 ‘허깅페이스’는 지난달 2일 ‘허깅 챗 어시스턴트’를 공개했다. GPT스토어와는 달리 무료로 사용이 가능하다.

https://www.hankyung.com/article/202403283252i


제목: "AI 모델 순위 매기는 '리더보드'는 과장됐다"

요약: 최근 기업들은 자사 LLM이나 SLM 성능이 오픈AI의GPT-4를 뛰어넘었다는 소식을 전하고 있다. 기준은 깃허브나 허깅페이스, 오픈 Ko-LLM 리더보드 순위다. 오픈 Ko-LLM 리더보드는 NIA와 업스테이지가 지난해 구축한 한국어 전용 리더보드다. 특정 작업에서 모델 성능을 비교하는 벤치마크 테스트에 의해서 순위가 결정되며, 점수는 답변 정확성, 속도, 견고성등으로 구성된다. 리더보드 평가의 문제는 개발사가 모델에 학습데이터가 아니라 이미 테스트를 거친 공개 평가데이터를 입력해 점수와 등수를 올리는 부분이다. 그것은 "마치 모델이 시험 답안지를 한번 훑고 문제를 푸는 것과 같은 것"이라며 "당연히 벤치마크 점수와 리더보드 순위가 급상승할 수밖에 없다"  또한, AI 개발사들은 타사 모델이 답했던 데이터를 단순 참고용으로만 활용해야 하는데, 이를 아예 자사 모델에 집어넣는 행태를 취하는 다른 형태의 악용 사례도 있다. "현재 벤치마크 종목도 공개된 상태"라며 "개발사는 평가 데이터를 모델에 넣지 않아도, 벤치마크 종목과 유사한 데이터를 생성할 수는 있다"고 설명했다. 모델이 벤치마크 종목 데이터를 집중 학습함으로써 점수를 올릴 수 있는 셈이다. 개발사들이 자사 모델에 '리더보드 1위' 이름표를 붙이려는 이유는 모델 홍보 효과와 투자 유치에 유용한 수단이기 때문이다. 업계 관계자는 "기업이 자사 LLM을 리더보드 상위권에 올리면 해당 기업 주가도 덩달아 오른다"며 "추후 투자자들에게도 이를 적극 어필한다"고 설명했다. 

https://zdnet.co.kr/view/?no=20240326144716


제목: 오픈AI, GPT-5 앞서 'AI 음성 비서' 출시 예정... '보이스 엔진' 상표 출원

요약: 오픈AI가 AI 음성 비서를 구축하기 위한 'Voice Engine'이라는 상표를 출원했다. 이번 상표 출원은 샘 알트먼 OpenAI CEO가 컴퓨터 과학자 렉스 프리드먼과의 팟캐스트 인터뷰에서 "GPT-5에 앞서 공개할 중요한 것이 있다"라고 밝힌 다음 날 이뤄졌다. 또 음성 비서 이외에도 다른 모들, 예를 들어 자기 OpenAI가 내놓은 적 없는 음악 생성 AI나 기타 모델도 출시할 가능성이 엿보인다.

https://www.aitimes.com/news/articleView.html?idxno=158207


제목: 아마존, 세계 최강 LLM 레이스 직접 가세...올해 중반 '올림푸스' 공개

요약: 세계 최대 퍼블릭 클라우드 서비스를 운영하는 아마존이 올해 코드명 올림푸스(Olympus)로 불리는 자체 LLM으로 생성형 AI 대권 레이스에 본격 가세한다는 소식이다. 아마존 인공일반지능(AGI) 팀은 올해 중반까지 올림푸스를 선보일 예정으로 로 전략적 동맹 관계인 앤트로픽 클로드3를 능가하는 것을 목표로 하고 있다. 올림푸스는 아마존닷컴, 에코 같은 기기들에 탑재된 알렉사 음성 비서, 아마존웹서비스(AWS) 부문에 새로운 기능들을 제공할 수 있을 것이라고 디인포메이션은 전했다.

https://www.digitaltoday.co.kr/news/articleView.html?idxno=511854


제목: 개인정보위, 오픈AI·구글·네이버 등 LLM 사업자에 개인정보 보호 개선 권고

요약: 개인정보보호위원회는 지난 27일 전체회의에서 오픈AI·구글·MS·메타·네이버·뤼튼테크놀로지스 등 6개 사업자에 대해 개인정보 보호 취약점을 보완하도록 개선권고를 의결했다. AI 서비스 제공사업자는 인터넷에 공개된 데이터를 AI 모델 학습데이터로 사용하는 과정에서 주민등록번호·신용카드번호 등 한국 정보주체의 중요한 개인정보가 포함될 수 있는 것으로 파악됐다. KISA에 따르면 지난해 2만999개 페이지에서 주민등록번호, 여권번호 등 개인정보 노출이 탐지됐다. LLM 기반 AI 서비스 제공사업자는 AI 모델이 정확한 답변을 하도록 다수 검토 인력을 투입한다. 이용자 관점에선 본인이 입력한 데이터에 대해 검토 인력이 투입되는 '인적 검토'(processed by human reviewer)' 과정 자체를 알기 어렵다. 중요 개인정보 등 민감한 내용을 입력하거나 AI 서비스 제공자가 개인정보 제거 등 조치 없이 해당 정보를 데이터베이스(DB)화할 경우, 사생활 침해로 번질 위험이 있다. 개인정보위는 AI 모델 등 개선 목적으로 이용자 입력 데이터에 대한 인적 검토과정을 거치는 경우 이용자에게 관련 사실을 명확하게 고지하고, 이용자가 입력 데이터를 손쉽게 제거·삭제할 수 있도록 해당 기능에 대한 접근성 제고를 권고했다.

https://www.etnews.com/20240328000237



제목: 라쿠텐, 최강 일본어 성능 LLM 출시...벤치마크 69점 기록

요약: 일본의 라쿠텐이 매개변수 70억개의 일본어 전문 LLM 제품군인 라쿠텐AI-7B를 오픈 소스로 출시했다.파운데이션 모델인 라쿠텐AI-7B는 방대한 영어와 일본어 텍스트 데이터를 학습했으며, 프랑스 미스트랄 AI의 오픈 소스 모델 가충치를 지속적으로 훈련해 개발됐다. 해당 모델은 일본어 모델 평가 벤치마크 하네스에서 평균 62.83을 기록, 일본어 오픈 소스 모델을 3점차 이상으로 앞지르며 1위를 차지했다. 또 강화학습을 적용한 '라쿠텐AI-7B-인스트럭트' 모델은 68.74점으로, 다른 모델(Youri-7B)보다 2점이 앞섰다.

https://www.aitimes.com/news/articleView.html?idxno=158411


제목:삼성, 28일부터 갤럭시 S23에도 AI 도입...국내 OS 업데이트는 미정

요약: 삼성전자(대표 한종희, 경계현)는 갤럭시 AI를 갤럭시 S23 시리즈, 탭 S9 시리즈, Z 플립p5 및 Z 폴드5에서도 사용할 수 있다고 28일 밝혔다. 더불어 삼성전자는 미국에서 가장 선호하는 갤럭시 AI 기능으로 ▲서클 투 서치 ▲실시간 통화 통역 ▲생성 AI 사진 편집 ▲챗 어시스트(Chat Assist) 등을 꼽았다. 서클 투 서치는 구글이 개발한 검색 방식으로, 휴대폰 화면에서 원을 그리거나 손가락으로 하이라이트해 바로 검색 결과를 확인할 수 있는 AI 검색 기능이다.

https://www.aitimes.com/news/articleView.html?idxno=158355


작가의 이전글 Weekly news about LLM - 3월 넷째주
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari