오픈에이아이와 구글 AI, 수학 올림피아드 금메달 점수 받아 외 4건
[오늘의 인용글 - 일하는 시간이 중요한 것이 아니라, 일하는 시간의 밀도가 중요하다.]
일을 무작정 하는 행위에만 힘을 쏟다보면, 건전한 판단력을 유지하기 어렵습니다. 가치관과 의사결정이 점점 비뚤어지고 맙니다. 어디에 더 힘을 쏟아야 할지, 어디서 멈춰야 할지 구분이 안 되기 시작하죠. 결국 남는 건 극심한 피로뿐입니다. 지친 상태에서 날카로운 판단을 내릴 수 있는 사람은 아무도 없습니다.
- 제이슨 프라이드, 리워크
If all you do is work, you’re unlikely to have sound judgments. Your values and decision making wind up skewed. You stop being able to decide what’s worth extra effort and what’s not. And you wind up just plain tired. No one makes sharp decisions when tired.
- Jason Fried, Rework
(1) 오픈에이아이와 구글의 AI, 2025년 국제 수학 올림피아드에서 금메달 수준 점수 받아
- IMO는 전 세계 최고 수준의 고등학생들이 참가하는 가장 난이도 높은 수학 대회 중 하나로, AI 분야에서도 중요한 벤치마크로 여겨짐
- AI 연구자 중 많은 수가 수학 경시대회 출신이기 때문에, IMO 성과는 AI 업계 내 '기술력 상징'으로 인식
- 작년(2024년), Google은 형식적 시스템(formal system)을 통해 IMO에서 은메달 수준의 점수를 획득 => 하지만 인간이 문제를 기계가 이해할 수 있는 형식으로 번역해야 했음
- 올해(2025년)는 OpenAI와 Google 모두 비형식적 시스템(informal system)을 사용해, 자연어로 된 문제를 직접 해석하고 증명 기반 해답 생성이 가능, 두 모델 모두 6문제 중 5문제를 정답 처리, 대부분의 인간 참가자보다 높은 점수 기록
- 기술적 의미: 이번 성과는 “검증 불가능한 영역(non-verifiable domains)”에서의 AI 추론력 향상을 보여주는 사례 -> 기존에는 단순 수학 문제나 코딩처럼 정답이 명확한 문제에만 잘 작동했지만, IMO는 그보다 훨씬 복잡하고 창의적인 사고가 필요한 문제로 구성됨
- IMO 시상식 직후 OpenAI는 토요일 오전에 자사 AI의 금메달 성과를 발표했고 이 채점은 IMO 공식 채점 없는 것이었음 -> Google DeepMind 측은 이에 대해 비판하며, 자신들은 IMO 측과 긴밀히 협력했고, IMO의 공식 채점 가이드라인과 평가를 거쳐 월요일에 결과를 발표했다고 설명
- Google의 Thang Luong 연구원은 “IMO의 공식 가이드라인이 아니면 금메달 수준 성과를 주장할 수 없다”고 지적하며 AI 업계의 윤리적 이미지에 대한 강조하며 업계 리더십을 가져오려는 것으로 보임
- OpenAI는 3명의 전직 IMO 메달리스트를 제3자 평가자로 고용, IMO의 채점 기준을 활용해 점수를 산정했다고 주장, Google은 보다 공식적이고 정통적인 평가 과정을 거쳤다는 점을 강조
- 이번 논쟁은 단순한 기술 경쟁을 넘어, AI 분야에서의 리더십과 ‘분위기 싸움(vibes battle)’으로 이어짐
- OpenAI는 GPT-5 출시를 앞두고 있으며, 여전히 선두라는 이미지를 유지하려 함
- 그러나 이번 사건은 Google과의 기술 격차가 좁혀졌거나, 오히려 양사가 팽팽히 맞서고 있음을 보여주는 신호로 해석될 수 있음
- https://techcrunch.com/2025/07/21/openai-and-google-outdo-the-mathletes-but-not-each-other/
(2) 미국 10대의 72%, AI 컴패니언 챗봇 사용 경험이 있으나 대부분은 정보를 신뢰하지 않아
- AI 컴패니언은 개인적 대화를 중심으로 설계된 챗봇을 의미: Character.AI, Replika, 혹은 ChatGPT, Claude 같은 범용 챗봇도 포함 가능 (사용 목적이 개인적 대화일 경우)
- 미국 10대의 72%가 AI 컴패니언(AI 친구형 챗봇)을 한 번 이상 사용한 적 있음: 52%는 정기적 사용자이며, 이 중, 13%는 매일 대화, 21%는 일주일에 몇 번 사용
- 25%는 사용 경험이 없다고 답변했고, 이 중 남학생(31%)이 여학생(25%)보다 미사용 비율이 높음
- 사용 목적: 오락 (30%), AI 기술에 대한 호기심 (28%), 조언 받기 (18%), 항상 사용 가능하다는 점에 매 (17%)
- AI와 감정적/사회적 관계: 33%는 AI를 '사회적 상호작용 및 관계 형성 수단'으로 인식, 46%는 그냥 도구/프로그램으로 봄, 1/3의 10대는 실제 친구보다 AI와의 대화가 더 만족스럽다고 응답, 반면, 67%는 여전히 실제 친구와의 대화가 더 낫다고 느낌
- 10대의 절반(50%)은 AI의 정보를 신뢰하지 않음: 13~14세는 27%가 신뢰, 17세는 20%만 신뢰
- AI의 정서적 영향력에 대한 우려 증가 중: Character.AI는 10대 자살 사건과 폭력 조장 관련 소송 중
- 80%는 AI보다 실제 친구와 더 많은 시간을 보낸다고 응답 -> 단 6%는 AI와 보내는 시간이 더 많다고 응답
- 조사 기관: Common Sense Media, 연구 수행: 시카고대학교 NORC, 대상: 13~17세 미국 청소년 1,060명, 조사 기간: 2025년 4~5월
- https://techcrunch.com/2025/07/21/72-of-u-s-teens-have-used-ai-companions-study-finds/
(3) 테슬라, 인도 시장 진출 난항
- Vishal Gondal (GOQii CEO) 등 테슬라의 오랜 지지자들은 인도 첫 쇼룸 개장에도 구매 의사 없음 -> 016년 Model 3 예약자였으나 2023년까지 환불에 어려움 겪음, “그 돈으로 주식 샀으면 더 벌었을 것”이라는 반응
- 기술 블로거 Varun Krishnan, Amit Bhawani 등도 수년간 환불 문제로 불만 축적 -> Bhawani는 유튜브 비판 영상으로 주목, 다수의 비슷한 피해자 확인
- 인도 쇼룸 개장(뭄바이 BKC, Maker Maxity Mall) 시 초기 예약자 초대조차 없음, Apple 매장 개장과 비교해 화제성 부족, “9년 기다린 사람들에게 최소한의 배려나 이벤트조차 없었다”는 지적 다수
- 3분기 차량 인도 전 델리·뭄바이에 충전소 8개 구축 예정이나, 규모 부족 우려, 애프터서비스 관련 구체적 계획 전무 -> Krishnan: “브랜드보다는 실용적 문제에 관심이 더 커졌다.”
- 정치·이미지 변화에 따른 호감 하락: Elon Musk의 정치적 발언 및 트럼프와의 관계가 인도 소비자들에게 부정적 인식 유발 -> EV 투자자 Kunal Khattar: “이제 테슬라는 지구 구하는 브랜드가 아님.”, Paytm의 Vijay Shekhar Sharma 등도 초기 지지 철회
- 인도 출시 Model Y 가격: 약 ₹59,89,000 (약 $68,000) -> 미국 판매가($44,990)보다 훨씬 비쌈
- 중국 생산 CBU 방식으로 고관세 포함 → 가격 상승 요인, 현지 공장 없어 인도 특화 모델은 부재
- 인도 프리미엄 세그먼트(₹35L 이상)는 전체 자동차 시장의 1% 미만 (연 5만대 수준) -> EV 비중은 그중 10% 정도
- Tata Motors, MG Motors 등 현지·중국 브랜드와의 치열한 경쟁 -> 전문가들: Tesla 진출 자체가 인도 내 EV 관심은 끌겠지만, Tesla 차량 자체 판매는 많지 않을 전망
- Tesla Club India 창립자 Arun Bhatt: 커뮤니티가 Tesla 중심 → EV/청정에너지 중심으로 전환 중, 예약자 10명 중 8명은 실망 상태.
(4) 윈도우용 자동화 AI 에이전트를 개발하려던 와이컴비네이터 스타트업의 포기
- Pig.dev는 Y Combinator 2025 겨울 배치 스타트업으로, Microsoft Windows 데스크톱을 제어하는 AI 에이전트 기술을 개발 중이었음 -> 그러나 2025년 5월, 창업자 Erik Dunteman은 해당 아이디어를 포기하고 Muscle Mem이라는 새로운 프로젝트로 피벗함
- Pig.dev의 원래 아이디어: Windows 상의 버튼과 UI 요소를 에이전트가 인식하고 제어하도록 설계, YC 파트너 Tom Blomfield는 이를 브라우저 자동화 툴인 Browser Use의 윈도우 버전이라 설명
- Browser Use는 바이럴을 일으킨 중국 AI 도구 Manus에 활용되며 웹사이트 UI를 AI가 이해하기 쉬운 형태로 바꿔주는 역할
- 초기에는 클라우드 API 형태의 AI 자동화 서비스를 기획했으나 고객 반응은 미온적, 이후 개발자 도구(dev tool)로 전환했지만 이 역시 수요 없음 -> 고객들이 원한 건 API가 아닌 “완성된 자동화 결과물” 즉, 컨설팅·SI 형태의 납품
- Dunteman: “사람들은 도구 갖길 원한 게 아니라, 자동화 자체를 대신 해주길 원했다.” -> 결국 방향을 완전히 틀기로 결정
- AI 에이전트가 반복 작업을 캐시하고, 복잡한 추론에 집중할 수 있도록 돕는 시스템 -> 여전히 “컴퓨터 사용 문제(computer use problem)” 해결에 기여하겠다는 철학 유지
- Dunteman: “지금 우리가 만드는 것도 결국 그 문제를 다른 각도에서 푸는 방식이다.”
- Windows 자동화는 여전히 미해결 영역으로 남아 있으며, 완전한 AI 에이전트 실현의 ‘마지막 퍼즐’로 간주됨 -> YC 파트너들은 브라우저/윈도우 자동화 기술을 특정 산업에 적용하는 것이 유망하다고 제안
- Microsoft는 Copilot Studio와 Windows 11에 이미 관련 기능을 실험 중, 2025년 4월 GUI용 자동화 기술을 연구 프리뷰로 공개
- 7월에는 Windows 11에 설정 관리용 에이전트 도입 발표.
- 즉, Pig.dev는 야심 찬 윈도우 AI 자동화 도전을 고객 니즈 불일치로 인해 중단하고, 에이전트 캐시 기술로 전환 -> 이는 스타트업 초기 피벗의 전형적 사례이자, AI 에이전트가 실사용되기 위한 기술·비즈니스 간 간극을 보여줌
- 브라우저/OS 자동화는 여전히 큰 가능성을 가진 영역이며, Microsoft 등 빅테크가 빠르게 선점 중
(5) 넷플릭스, 본격적으로 컨텐츠 제작에 생성형 AI 도입
- 넷플릭스는 자사 콘텐츠 제작에 생성형 AI(GenAI)를 실제 도입했다고 공식 발표
- Ted Sarandos (공동 CEO)에 따르면, 넷플릭스 오리지널 아르헨티나 드라마 “El Eternauta”에 GenAI로 제작된 장면이 포함 -> 건물이 무너지는 장면을 AI를 통해 생성, 기존 VFX 방식보다 10배 빠르게, 더 낮은 비용으로 완성
- Sarandos: “AI는 콘텐츠를 더 저렴하게 만들기 위한 도구가 아니라, 더 좋은 작품을 만드는 창작 도구다.”
- 프리비주얼라이제이션(pre-visualization), 촬영 계획(shot planning), 시각 효과(VFX)에 특히 유용
- 예전엔 고비용 제작물에서만 가능했던 VFX (예: 인물 노화 제거 등)도 이제는 저비용으로 가능 -> 진짜 사람이 하는 창작에 AI가 도구로 보조하는 형태임을 강조
- 그 이외에도 개인화 추천, 검색 기능, 광고 최적화에도 GenAI 활용 중, AI 기반 검색 기능은 이미 출시, 2025년 하반기에는 인터랙티브 광고 출시 예정
- 2025년 2분기 실적: 매출 110.8억 달러 (전년 대비 16% 증가), 순이익 31.3억 달러, 상반기 총 시청 시간 950억 시간 이상, 이 중 비영어권 콘텐츠가 전체의 1/3 차지
- https://techcrunch.com/2025/07/18/netflix-starts-using-genai-in-its-shows-and-films/