brunch

You can make anything
by writing

C.S.Lewis

by florent Dec 10. 2024

24년 12월 10일 흠터레스팅 테크 뉴스

OpenAI, 영상 생성 AI 'Sora' 출시 외 2건


[오늘의 인용글 - 회사의 일원이라는 것의 의미]


회사가 똑똑한 사람들을 고용하는 이유는 그들에게 지시를 내리기 위해서가 아닙니다. 회사가 성공하기 위해 무엇을 해야 할지 제안할 수 있기에 고용하는 겁니다.

- 스티브 잡스

We don’t hire smart people to tell them what to do. We hire smart people so they can tell us what to do. 

- Steve Jobs



(1) AI 벤치마크 테스트 결과의 큰 상승, 하지만 AGI 수준에는 미달

- ARC-AGI(Abstract and Reasoning Corpus for Artificial General Intelligence)는 2019년 Francois Chollet이 개발: AI가 훈련 데이터 밖에서 새로운 기술을 효율적으로 학습할 수 있는지 평가, 현재 AGI에 대한 진전을 측정할 수 있는 유일한 테스트로 간주

- 2024년, ARC-AGI에서 최고 점수는 55.5%로 상승: 2023년 최고 기록보다 약 20% 증가, 하지만 AGI 달성 기준인 85%의 인간 수준에는 여전히 미달

- 성공적인 성과에도 불구하고, 점수 상승이 AGI의 실제 발전을 의미하지는 않음

Francois Chollet의 주장: LLM은 기억에 의존하며, 훈련 데이터에서 벗어난 상황에서의 추론이 부족, 새로운 상황에서 "새로운 추론"을 생성할 수 없음 -> LLM은 기존 패턴을 학습하여 활용하는 통계적 모델로, 진정한 일반화 능력이 없다는 점을 강조

- AGI 정의의 모호성: OpenAI의 일부 직원은 AGI를 “대부분의 인간보다 대부분의 작업에서 우수한 AI”로 정의하며, AGI가 이미 달성되었다고 주장 -> 이러한 정의는 AGI 논의에 혼란을 야기

- ARC-AGI 벤치마크에 대한 비판: AGI와의 직접적인 연관성에 대한 과도한 마케팅 지적, 테스트 자체가 AGI를 평가하는 데 적합하지 않을 수 있다는 의문

- ARC-AGI의 성과는 AGI의 잠재력을 측정하기 위한 중요한 도구로 작용했지만, 현재의 한계는 AI 지능의 정의와 평가가 여전히 복잡하고 논란의 여지가 많음을 시사

https://techcrunch.com/2024/12/09/a-test-for-agi-is-closer-to-being-solved-but-it-may-be-flawed/


(2) 아마존, AI 에이전트 연구소 설립

Amazon은 샌프란시스코에 Amazon AGI SF Lab 설립, AI 에이전트의 핵심 기술 개발을 목표

- AI 에이전트는 디지털 및 물리적 세계에서 행동하며, 복잡한 워크플로를 처리하도록 설계

- 연구소는 Adept 공동 창업자 David Luan이 이끌며, 로보틱스 연구자 Pieter Abbeel과 협력

- 주요 연구 영역: 실제 세계에서의 행동 수행, 인간 피드백을 통한 학습, 자가 수정(self-course-correction) 및 목표 추론 능력 강화 -> 초기에는 Adept 직원들이 중심이 되며, 추가로 금융, 물리학, 수학 분야에서 수십 명의 연구자 채용 예정

- Adept와의 연결: Adept는 자연어를 사용해 소프트웨어 작업을 수행하는 AI 에이전트 개발을 목표로 2년 전 설립, 6월에 Amazon은 Adept와 기술 라이선스 계약 체결 및 Adept의 일부 팀과 기술이 Amazon에 합류, Luan은 Alexa 개발팀 출신 Rohit Prasad의 AGI 팀에서 계속 활동

Agentic AI 시장은 2024년 말까지 310억 달러 규모 도달 예상(Emergen Research), 82%의 조직이 3년 이내 AI 에이전트 도입 계획(Capgemini 조사)

- 주요 경쟁사: OpenAI, Anthropic, Google 등도 AI 에이전트 기술 개발 중, Google은 항공편 예약, 호텔 예약 등의 구매형 AI 에이전트 연구 진행

https://techcrunch.com/2024/12/09/amazon-forms-a-new-ai-agent-focused-lab-led-by-adept-co-founder/


(3) 오픈에이아이, 영상 생성 AI '소라' 출시

- OpenAI는 ChatGPT Pro 및 Plus 구독자를 대상으로 Sora 비디오 생성기를 출시했으나, EU와 영국은 제외 -> Sora Turbo라는 초기 버전이 제공되며, 5초~20초 길이의 클립을 다양한 비율과 해상도로 생성 가능

텍스트 프롬프트 또는 이미지를 활용한 영상 생성, Re-mix 도구를 통한 기존 영상 편집 가능

- Storyboard 인터페이스를 통해 영상 시퀀스 생성

- Blend 도구로 두 영상을 결합해 새로운 영상 생성

- Loop 및 Re-cut 옵션으로 세부적인 편집 지원

- 기본적으로 Sora 생성 영상에는 오른쪽 하단에 워터마크가 포함.

- ChatGPT Plus 구독: 월 1,000 크레딧, 최대 50개의 5초 우선 생성 영상(720p), ChatGPT Pro 구독: 월 10,000 크레딧, 최대 500개의 20초 우선 생성 영상(1080p)

- 성능 및 한계 1 객체 영속성 문제: 영상 내 물체가 비논리적으로 움직이거나 사라지고 재등장, 객체 간의 상호작용(앞뒤 순서 등)이 부자연스러움

- 성능 및 한계 2 다리 문제: 사람이나 동물이 걷는 장면에서 다리의 앞뒤 혼동 발생, 다리 움직임이 해부학적으로 불가능한 방식으로 표현됨

- 성능 및 한계 3 포토리얼리즘 부족: 사실적인 영상 생성에는 부적합하며, 인공지능 생성 영상임을 쉽게 인식 가능, 주로 타이틀 슬라이드, 애니메이션, 추상적 표현에 적합

https://techcrunch.com/2024/12/09/openais-sora-video-generator-might-not-be-available-in-the-eu-at-launch/

https://techcrunch.com/2024/12/09/openais-sora-is-launching-today-heres-highlights-from-the-first-review/


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari