오픈에이아이, AI의 과도한 '아부'로 롤백 조치 외 2건
[오늘의 인용글 - 조직의 민첩성은 위험 선행 대처에 있다.]
추적할 지표를 선정할 때 중요한 것은, 더 늦지 않고 신속하게, 더 나은 의사결정을 내리는 데에 실제로 도움이 되느냐는 점입니다. 앞서 말했듯, 진짜 의미 있는 지표란 행동을 이끌어내야 합니다. 후행 지표든 선행 지표든 모두 행동을 이끌어낼 수 있지만, 선행 지표는 앞으로 어떤 일이 일어날지를 보여주기 때문에 의사결정 시기를 더 빠르게 앞당겨 조직을 더 민첩하게 만들어줍니다.
- 린 애널리틱스
Ultimately, you need to decide whether the thing you’re tracking helps you make better decisions sooner. As we’ve said, a real metric has to be actionable. Lagging and leading metrics can both be actionable, but leading indicators show you what will happen, reducing your cycle time and making you leaner.
- Lean Analytics
(1) 부정행위 돕는 AI 개발사 '클루엘리' 바이럴로 해당 서비스 무력화 제품 출시
- Cluely: AI 기반 부정행위 도구 -> 핵심 기능: 브라우저 내에 숨겨진 창을 통해 면접, 시험, 업무 미팅 등에서 AI로 몰래 도움을 받을 수 있게 해주는 툴
- 자사 주장: “탐지 불가능”, “모든 상황에서 치팅 가능”
- 지난주 온라인에서 큰 주목을 받음 -> 이에 대응하는 스타트업들 등장
- Validia (샌프란시스코 스타트업): 무료 탐지 툴 ‘Truely’ 출시, Cluely 사용 시 알람을 울리는 기능 제공
- Proctaroo (로드아일랜드): 자체 플랫폼을 통해 Cluely 사용자 감지 가능하다고 주장, CEO 왈 “백그라운드 프로세스 포함 모든 실행 앱 확인 가능, Cluely도 예외 아님” -> Cluely의 비즈니스 모델을 “비윤리적”이라 비판
- Cluely CEO Chungin “Roy” Lee 발언: 반부정 소프트웨어는 오래전부터 실패해온 전략이라며 무용론 제기 -> 스마트 안경, 투명 유리 오버레이, AI 목걸이, 뇌 인터페이스 칩 등 하드웨어 개발 가능성 언급, “기술적으로 하드웨어 전환은 사소한 일”이라고 주장 (비록 Humane 등 AI 하드웨어 실패 사례 있음에도)
- 홈페이지 내 메시지 수정: 홈페이지 및 선언문에서 시험/면접 관련 치팅 문구 삭제, 현재는 주로 세일즈 콜, 미팅 등에서의 “AI 활용” 강조
- 목표 시장 재정비 중: “가장 크고 영향력 있는 시장을 공략 후 확장할 것”
(2) 오픈에이아이, 최근 업데이트 후 AI의 과도한 '아부'로 롤백 조치
- GPT-4o 업데이트 이후, ChatGPT가 사용자 의견에 지나치게 동의하고 칭찬하는 응답을 보이기 시작
- SNS에서 밈(meme)화되며 화제 -> 문제적이거나 위험한 발언에도 무비판적으로 동조하는 사례 다수 보고됨
- 4월 27일 CEO 샘 알트먼, 문제 인정 및 “ASAP 조치하겠다”고 발표 -> 4월 29일 GPT-4o 업데이트 롤백 조치, 블로그를 통해 문제 원인 및 개선 방향 공식 발표
- OpenAI는 GPT-4o 업데이트가 의도치 않게 모델의 성격을 비판 없이 무조건 수용하는 방향으로 왜곡시켰음을 인정, 이에 따라 긴급하게 전면 롤백, 이후에는 더 정제된 모델 성격 설계를 통해 개선을 약속
- 문제 원인 분석 (OpenAI 측 설명): 모델 업데이트 시 “단기적 피드백에 과도하게 의존” -> 사용자와의 상호작용이 시간이 지나면서 어떻게 변화하는지 충분히 고려하지 못함, 그 결과, GPT-4o는 “지나치게 지지적이지만 진정성 없는” 태도를 보임, 이는 사용자를 불편하게 만들고, 신뢰도 저하로 이어질 수 있음
- 개선 조치: 모델 훈련 기법 및 시스템 프롬프트(system prompt) 전면 재조정 -> 아부적 반응을 명시적으로 지양하는 방향으로 가이드라인 개선, 정직성과 투명성을 강화하는 안전장치 추가 중, 실시간 사용자 피드백 기능 도입 실험 중
- ChatGPT의 응답에 즉각적인 영향을 주고, 다양한 성격(personality) 옵션을 사용자가 직접 선택 가능하도록 추진
- 향후 방향: 보다 다양한 문화적 가치 반영을 위한 “민주적인 피드백 시스템” 설계 중 -> 사용자가 기본 성격에 동의하지 않을 경우 직접 조정할 수 있는 권한 확대 검토
- 안전성과 실행 가능성 하에서 사용자 맞춤형 AI 경험 강화 목표
- https://techcrunch.com/2025/04/29/openai-explains-why-chatgpt-became-too-sycophantic/
(3) 구글 플레이 내 앱 수, 2024년 초 대비 현재까지 47% 감소
- 2024년 초 대비 현재까지 Google Play 앱 수 47% 감소: 약 340만 개 → 180만 개로 감소 (Appfigures 분석 기준)
- 반면, Apple App Store는 소폭 증가 (160만 → 164만 개)
- 원인 분석: Google의 품질 기준 강화(2024년 7월 발표) -> 단순 오류가 아닌 “기능 부족” 앱들도 차단 대상으로 확대
- 금지 대상 예시: 텍스트만 있는 정적 앱, PDF 뷰어, 단일 월페이퍼 제공 앱, 기능이 없거나 테스트용으로 방치된 앱
- 개발자 계정 등록 요건 및 심사 강화: 신규 개인 개발자 계정에 앱 테스트 필수화, 사기 또는 사용자 기만 목적 앱에 대한 사람 중심 리뷰 확대, AI 기반 위협 탐지 시스템 도입, 프라이버시 정책 강화, 개발 도구 개선 등 병행
- 2024년 한 해 동안: 정책 위반 앱 236만 개 사전 차단, 유해 앱 시도 개발자 계정 15.8만 개 금지, EU ‘상인 정보 공개(Trader Status)’ 규정 영향도 존재 가능성, 2025년 2월부터 개발자 실명·주소 공개 의무화
- 단, Apple도 동일 정책 적용했으나 앱 수에는 영향 없음
- Appfigures는 앱 수 감소가 공식 정책 시행 이전부터 시작되었다고 분석 -> 흥미롭게도 2025년 들어 Google Play 신규 앱 출시 수는 전년 대비 7.1% 증가(총 10,400개)
- https://techcrunch.com/2025/04/29/google-play-sees-47-decline-in-apps-since-start-of-last-year/