AI 합성 데이터 학습, AI 모델 붕괴 가능성 논문 발표 외 2건
(1) AI 합성 데이터의 ‘모델 붕괴’ 논문 발표 ⇒ 합성 데이터가 AI 모델 성능과 질의 붕괴를 일으킬 수 있으며, 일종의 ‘근친상간’적 결과 초래
- https://www.nature.com/articles/s41586-024-07566-y
- AI 모델 붕괴(Model collapse)란, AI 모델이 자체 생성 데이터를 반복적으로 학습할 경우 발생하는 퇴행적 과정 ⇒ 모델이 실제 데이터 분포를 점점 잊게 되어 결과적으로 품질이 낮아짐
- 영국과 캐나다 연구진, 옥스퍼드 대학교의 Ilia Shumailov가 주도한 연구에서 발견 ⇒ 이 논문은 Nature에 발표되었으며, 무차별적으로 다른 모델이 생성한 데이터를 학습하는 것이 주 원인
- 반복적으로 학습된 일반적인 데이터는 모델이 실제 데이터의 다양성을 인식하지 못하게 함
- 이게 왜 문제냐면, 현재 웹에는 AI 생성 콘텐츠가 넘쳐나고, AI 모델들은 이 AI 생성 콘텐츠를 계속해서 학습하고 있음 → 현재 AI 학습 방법론이 미래의 초지능을 만드는 데 적합한지에 대한 의문 제기
- UC 버클리의 컴퓨터 과학자 하니 파리드(Hany Farid)는 “이 문제는 종의 근친교배(inbreeding)과 비슷하다”라고 말함
(2) 틱톡 라이트, 사용자에게 유해한 콘텐츠를 노출 중(Mozilla 연구진 보고서)
- 안전 기능 부족: TikTok Lite는 사용자에게 유해한 콘텐츠를 필터링 도구와 앱 중독을 줄이는 기능 부족
- 경고 라벨 부족: 위험한 장난 영상이나 도전 과제, 선거 관련 허위 정보, AI 생성 콘텐츠 등에 대한 경고 라벨이나 배너가 없음
- TikTok은 보고서가 사실을 왜곡했다고 주장하며, TikTok Lite도 TikTok과 동일한 방식으로 유해한 콘텐츠를 제거한다고 주장
- 하지만 연구진은 TikTok Lite는 안전 기능을 줄여 앱의 대역폭 요구를 낮추다고 하며, TikTok이 의도적으로 안전 기능을 의도적으로 탑재하지 않았다고 주장
(3) 애플, Apple Maps 웹 출시
- 이로 인해 오랫동안 웹에서 사용 가능했던 Google Maps와 직접 경쟁하게 됨
- 현재 웹 버전은 영어로 제공되며 Safari와 Chrome(맥과 아이패드), Chrome과 Edge(윈도우 PC)에서 사용 가능, 앞으로 추가 언어, 브라우저 및 플랫폼 지원 계획
- 개발자들은 웹 버전의 Apple Maps에 링크를 걸어 사용자들이 운전 경로 확인, 상세 장소 정보 조회 등을 할 수 있도록 할 수 있음
[뉴스 출처]
- https://techcrunch.com/2024/07/24/model-collapse-scientists-warn-against-letting-ai-eat-its-own-tail/
- https://techcrunch.com/2024/07/24/tiktok-lite-exposes-users-to-harmful-content-say-mozilla-researchers/
- https://techcrunch.com/2024/07/24/apple-maps-launches-on-the-web-to-challenge-google-maps/