brunch

You can make anything
by writing

C.S.Lewis

by 김준석 Jul 02. 2024

Weekly news on LLM - 6월 넷째주


제목: AI에 인격 입힌 '페르소나 챗봇', 킬러 서비스될 수 있을까

요약: AI 챗봇에 특정 인격을 입혀, 전문성과 재미를 동시에 추구하려는 페르소나 챗봇이 인기이다. 가장 대표적인 것이 캐릭터닷AI의 챗봇입니다. 소크라테스부터 일론 머스크, 해리포터까지 현실과 가상의 인물이 등장합니다. 최근에는 실제 연예인이나 인플루언서 페르소나 챗봇을 출시하려는 노력이 이어지고 있습니다. 메타에 이어 구글도 이 분야에 뛰어들었다는 소식이 들려왔습니다. 이 외에도 미국에서는 여러 곳에서 이런 분위기가 전해지고 있습니다. 무엇보다 10대를 타깃으로 사용자 저변을 넓히려는 의도입니다. 실제 미국에서는 지난해 한때 캐릭터닷AI의 방문자수가 챗GPT를 위협할 정도였습니다. 숙제를 위해 챗GPT를 사용하던 청소년들이 방학을 맞으며 재미를 위해 캐릭터닷AI로 넘어간 결과입니다. 페르소나 챗봇은 단순한 재미를 위해 만들어진 것이 아닙니다. '맞춤형 챗봇'으로 장점이 확실합니다. 도메인별 전문 모델을 만들면, GPT-4와 같은 범용 모델보다 전문성과 비용 문제에서 효과를 볼 수 있습니다. 과학 문제가 궁금하면 아인슈타인 챗봇을 부르고, 축구에 대해서는 펠레 챗봇과 대화하고, 음식 레시피가 궁금하면 고든 램지 챗봇에 질문한다고 생각하면 됩니다. 각 모델은 인터넷에 있는 모든 지식을 학습할 필요는 없습니다. AI 챗봇은 앞서 전한 대로 음성이나 에이전트 기술 등과 점차 합쳐질 것으로 보입니다. 현재 가장 유력한 킬러 서비스 후보로 꼽아도 손색이 없을 정도입니다. 특히 어린 층일수록 페르소나 챗봇은 강력할 것으로 보입니다. '뽀로로 챗봇'으로 미국 시장 진출에 나선 셀렉트스타도 주목됩니다.

https://www.aitimes.com/news/articleView.html?idxno=161106


제목: "클로드 3.5보다 더 위력적인 '아티팩트' 기능"

요약: 석달 전 '클로드 3' 출시로 오픈AI와 구글을 누르고 세계 최강 대형언어모델(LLM) 타이틀을 차지한 데 이어, 이번에도 앤트로픽의 클로드 3.5 소네트가 'GPT-4o'를 누르고 다시 현재 최고 상능 자리를 되찾았습니다. 모델과 함께 출시한 '아트팩트(Artifacts)' 기능은 일종의 작업 공간으로, 클로드가 생성한 결과물을 실시간으로 확인하며 편집이나 수정할 수 있는 기능입니다. 즉, 과거에는 AI가 출력하는 결과물만 받아 들었지만, 이제는 사용자가 그 과정을 옆에서 보고 조정할 수 있게 된 겁니다. 벤처비트는 그동안 오픈AI와 구글이 첨단 모델의 성능 경쟁에 매달린 사이, 앤트로픽은 AI의 유용성과 사용자 경험에 초점을 맞췄다고 칭찬했습니다. 또 이런 유용한 기능을 다른 회사가 따라 할 것이 틀림없다며, 앞으로 이 분야의 경쟁도 치열해질 것으로 예측했습니다.

https://www.aitimes.com/news/articleView.html?idxno=160912



제목: 오픈AI, 7월부터 중국 내 사용자 접속 차단

요약: 생성형 AI 챗GPT 개발사 오픈AI가 다음달부터 중국 사용자들의 서비스 이용을 엄격하게 차단할 계획이다. AI 등 첨단 기술에 대한 대중 규제를 확대하고 있는 미국 정부의 움직임에 발맞추는 조치로 풀이된다. 현재 오픈AI는 161개 국가에서 챗GPT 등 자사 AI 도구와 LLM을 사용할 수 있게 하는 API 플랫폼을 제공하고 있으나 중국은 이에 포함되지 않는다. 오픈AI의 차단 조치는 미국의 중국에 대한 기술 규제 강화 흐름에 따른 것이라는 분석이 나온다. 2022년부터 AI 반도체의 중국 수출을 통제해온 조 바이든 행정부는 최근 게이트올어라운드(GAA·Gate All Around)와 고대역폭 메모리(HBM) 등과 관련된 최첨단 AI 기술에 대한 추가 규제까지 검토하며 중국 AI 산업의 발전을 견제하고 있다. 오픈AI의 조치로 중국 AI 기업들의 타격이 불가피해지자 바이두 등 현지 IT 기업들은 자사의 LLM을 무료 제공하겠다고 밝히며 대비책 마련에 나섰다.

https://www.segye.com/newsView/20240626516212?OutUrl=naver



제목: 한컴, AI 사업 확장 가속… '한컴어시스턴트' 베타 버전 공개

요약: 하반기 중 정식 출시 예정인 한컴어시스턴트는 사용자가  명령하면 환경에 맞는 AI 모델을 활용해 내용을 이해하고, 사용자 의도를 분석해 목적에 맞도록 문서를 자동으로 작성해 준다. 한컴은 이미 경기도청, 한국전력공사 등과 한컴어시스턴트의 PoC를 진행하고 있으며 앞으로 B2G·B2B 피드백을 토대로 솔루션 경쟁력을 한층 고도화할 예정이라고 설명했다. 한컴어시스턴트는 효율적인 문서 작성을 지원한다는 점이 특징이다. 자연어 명령을 인식해 정확하고 신속하게 문서 작성을 돕는 '챗봇'과 상황에 맞는 문서를 쉽고 빠르게 작성하도록 프롬프트 엔진을 최적화한 'AI 허브', 폐쇄망 환경을 지원하는 문서 작성 특화 LLM인 '한컴 sLLM' 등으로 구성돼 LLM을 단순히 연동하는 다른 서비스와 달리 고도화한 기능을 구현한다. 아울러 기본 정보만 입력하면 문서 초안을 완성하거나 사용자 의도를 파악해 콘텐츠를 자동으로 만들어 준다. 또 주로 쓰는 템플릿을 맞춤형으로 제공하고, 헷갈리는 맞춤법도 자동으로 교정하는 등 문서 작성 시작부터 마무리까지 전 과정이 손쉽도록 돕는다

https://www.newsis.com/view/NISX20240628_0002790475



제목: LG전자, 구글 LLM ‘제미나이’ 탑재한 LG클로이 로봇 공개

요약: LG전자가 구글의 LLM ‘제미나이’’를 탑재한 LG클로이(CLOi) 로봇을 첫 공개했다. 제미나이는 구글의 앱 개발 플랫폼 ‘버텍스 AI’에 탑재된 생성AI 모델이다. 텍스트를 비롯해 음성과 이미지, 코딩 등 다양한 방식으로 명령을 받는 멀티모달리티 성능이 특징으로, 클로이 로봇에 생성AI가 탑재되는 것은 이번이 처음이다. LG전자는 연내 구글의 생성AI를 탑재한 LG클로이 가이드봇을 출시하고 기존 출시된 안내 로봇에도 무선 SW 업데이트를 통해 생성AI 기능을 확대·적용할 예정이다. 생성AI로 언어 능력을 강화한 LG클로이 로봇은 고객과 대화에서 발생하는 각종 유사 질문을 스스로 생성해 커뮤니케이션 기능을 강화하고 돌발 질문에도 검색을 통해 자연스러운 답변이 가능해 고객의 질문에 보다 정확하게 대답할 수 있게 된다.

https://www.itbiznews.com/news/articleView.html?idxno=138266



제목: 허깅페이스, LLM 리더보드 교체..."첫 주 1·2위는 큐원2·라마3"

요약: 허깅페이스가 최근 지적된 벤치마크 실효성 지적에 따라 새로운 오픈 소스 LLM 리더보드를 출시했다. 처음 공개된 순위에서는 중국 모델들이 강세를 보였다. 톰스하드웨어는 27일 허깅페이스가 발표한 새로운 ‘오픈 LLM 리더보드’ 첫 순위에서 중국 알리바바의 '큐원(Qwen)'이 1위를 차지하는 등 중국 모델 4개가 10위 안에 들었다고 보도했다. 허깅페이스의 두번째 리더보드 출시는 최근 벤치마크 데이터셋이 오래되고 모델 성능이 급격하게 향상하는 바람에, 기존 평가 항목으로는 정확한 모델 성능 평가가 어렵다는 지적에 따른 것이다. 클레멘트 델랑 허깅페이스 창립자 겸 CEO는 X를 통해 "이전 벤치마크는 중학교 문제로 고등학생을 평가하는 것처럼 최근 모델 성능에 비해 너무 쉬웠다"라며 "특히 AI 개발자가 일부 주요 벤치마크 성적을 높이기 위해 다른 부분에 대한 성능을 희생하는 사례도 보고되고 있다"라고 교체 배경을 밝혔다. 새 리더보드는 ▲지식 테스트 ▲긴 컨텍스트에서의 추론 ▲복잡한 수학 능력 ▲지시 따르기 등 4가지 과제에 걸쳐 오픈 소스 LLM을 테스트한다. 이를 테스트하기 위해 여섯가지 벤치마크가 사용되며, 테스트에는 ▲1000단어로 구성된 살인 미스터리 해결 ▲일반인이 이해할 수 있는 용어로 박사 학위 수준의 문제 설명하기 ▲가장 어려운 고등학교 수학 방정식 풀이 등이 포함된다. 2위는 메타의 '라마3-70B', 4위는 미스트랄의 '믹스트랄-8x22B', 5위는 허깅페이스의 '제퍼-141B', 6위는 마이크로소프트(MS)의 '파이-3-미디엄', 7위는 중국 01.AI의 'Yi-1.5-34B', 8위는 기존 리더보드에서 최초로 평균 80점을 넘긴 아바쿠사의 '스마우그-72B' 등 기존 주요 모델이다. 이는 라마3가 기존 리더보드의 데이터셋 훈련 비중이 과도했다는 것을 보여주는 것으로, LLM 성능은 결국 훈련 데이터에 달려 있다는 것을 입증한 것이라는 분석이다.

https://www.aitimes.com/news/articleView.html?idxno=161136


작가의 이전글 Weekly news on LLM - 6월 셋째주
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari