학습 차원에서 틈틈이 해외 전문가들이 블로그나 미디어 그리고 책에서 쓴 글을 번역 또는 요약 정리하고 있습니다. 이번 포스팅도 그중 하나고요. 거칠고 오역된 부분이 있을 수 있습니다. 제대로 번역되지 않은 부분은 확인 주시면 반영토록 하겠습니다. 의미 전달이 애매한 문장은 삭제했습니다. 이번에는 플랫포머 창업자 겸 편집자인 케이시 뉴턴의 글을 정리한 것입니다.
오늘은 오랫동안 소문만 무성하던 OpenAI의 ChatGPT 기반 웹 브라우저 'Atlas'에 대해 이야기해 보자. 이 브라우저는 이제 macOS에서도 이용 가능하다. 나는 새로운 거대 언어 모델을 리뷰하기에 최악의 날은 출시 당일이라고 말하곤 한다.: 단 몇 시간 만에 그 성능을 제대로 평가하기엔 너무 어렵고, 경쟁사나 이전 모델과 차이점을 완전히 이해하는 데 며칠에서 몇 주가 걸릴 수 있기 때문이다.
AI 기반 브라우저도 마찬가지다. 퍼플렉시티 브라우저 '코멧'이나 브라우저 컴퍼니 경쟁 제품 '디아'와 마찬가지로, 아틀라스는 크롬 브라우저 기반이 되는 구글 오픈소스 웹 브라우저 '크로미움'을 기반으로 제작됐다. 따라서 아틀라스는 크롬 사용자라면 바로 익숙할 것이다.: 설정 시 기존 브라우저에서 북마크와 주요 설정을 직접 가져올 수 있으며, 새 브라우저를 거의 기존 브라우저와 동일하게 사용할 수 있다. 이러한 친숙함은 장단점이 있다. 긍정적인 측면으로는 Atlas가 사용하기 쉽고, 새로운 작업 방식을 익히거나 기존에 즐겨 쓰던 Chrome 확장 프로그램을 포기할 필요가 없다는 점이다. (Chrome 웹 스토어에서 확장 프로그램을 설치할 수 있으며, 이는 Chrome 자체를 사용하는 것과 동일하다)
동시에 Atlas는 너무 익숙해 보일 수 있어, 왜 누군가가 Chrome에서 전환하려 할지 완전히 명확하지 않다. 6억 1천만 달러라는 기적적인 금액에 아틀라시안(Atlassian)에 매각되기 전까지, 브라우저 컴퍼니(Browser Company)는 사람들이 크롬을 떠나 자사 아크(Arc) 브라우저를 선택할 만큼 매력적인 기능 세트를 찾기 위해 수년간 허둥대며 노력했다. 그러나 사용자 인터페이스 요소를 수년간 재구성하고, 브라우저의 미래에 대한 고민을 담은 블로그 게시물과 유튜브 동영상을 제작했음에도 불구하고, 아크는 겨우 앱 스토어 다운로드 100만 건을 넘겼을 뿐이다.
오픈AI '아틀라스'는 더 좁은 범위의 약속을 제시한다. 구글보다 ChatGPT를 점점 더 많이 사용하게 된다면, 크롬보다 아틀라스를 선호할 수 있다. 크롬이 구글 검색을 포착하고 수익화하며 개선하기 위해 설계된 반면, 아틀라스는 ChatGPT를 위해 동일한 목적을 수행하도록 만들어졌다. 현재로서는, 그리고 대다수 사용자에게는 여전히 그럴 가치가 느껴지지 않을 수 있다. 사람들은 이미 웹, 모바일 앱, 데스크톱 앱, 음성 모드, 타사 브라우저 확장 프로그램 등 브라우저 안팎에서 ChatGPT를 사용할 수 있는 수많은 방법을 갖고 있다.
하지만 구글이 초기에 깨달은 교훈은 사람들이 검색을 더 많이 사용할수록 구글의 영향력이 커진다는 점이었다. 검색은 검색 인덱스와 거대 언어 모델을 개선하는 데 활용될 수 있는 데이터를 생성한다. 광고를 삽입할 수 있는 공간을 만들고, 사람들을 구글 생태계에 묶어두는 고리가 된다. 검색량 증가는 경쟁사가 따라잡기 어렵게 만드는 플라이휠 효과를 창출한다: 가장 많은 데이터를 보유한 기업이 종종 최상의 검색 결과를 제공할 수 있기 때문이다. (구글 반독점 소송에서 승인된 구제책 중 하나가 검색 인덱스 데이터를 경쟁사와 공유하도록 한 이유도 여기에 있다.)
오픈AI '아틀라스'는 바로 이 논리를 AI 시대에 적용한 것이다. 챗GPT는 이미 주간 8억 명의 사용자를 끌어모으고 있으며, 이들 중 상당수는 이미 기존 검색을 대체하는 도구로 활용 중이다. 하지만 이들 대부분은 크롬을 통해 챗GPT에 질의를 입력하고 있으며, 크롬은 시간이 지남에 따라 챗GPT 기능을 점점 더 많이 흡수하려 할 것이다. 아틀라스는 그러한 변화가 일어나기 전에 구글의 시장 점유율을 빼앗기 위한 시도다. 아직 아틀라스를 몇 시간밖에 사용해보지 못했기에, 대부분의 평가는 더 사용해본 후에 내리겠다. 오후 내내 새 브라우저에 대 평가들을 읽었는데, 아틀라스를 써볼지 고민할 때 고려할 다섯 가지 관점을 소개한다.
크롬의 진화 속도가 얼마나 느린지를 꼬집고 있다. 크롬은 지난해 AI 기능을 추가했지만, 그 기능을 말할 수 있나? 말할 수 있다면, 그 기능을 찾을 수 있나? 탭과 대화할 수 있게 해주는 크롬의 ‘제미니 인 크롬’ 기능은 아틀라스나 다른 AI 브라우저와 유사하지만, 경쟁사들에 비해 임시방편적이고 억지로 덧붙인 느낌이 든다.
아틀라스의 핵심은 모든 페이지를 ChatGPT로 둘러싼다는 점이다. 왼쪽 사이드바에는 과거 대화 기록과 다양한 도구, 오른쪽 사이드바에는 열린 채팅창, 그리고 브라우저를 대신 제어하며 작업을 수행하는 에이전트가 배치된다. (이 과정은 지독히 느릴 것이며, 아마도 사용자 요구사항과 다를 수 있다. 하지만 아틀라스에게 인스타카트에서 쇼핑을 부탁하면, 시도해 보려 할 것이다.)
다른 독창적인 기능으로는 '커서 모드'가 있다. 강조 표시된 텍스트 위에 ChatGPT 창을 열어 브라우저가 해당 텍스트를 더 짧게, 더 길게, 스페인어로 변환해 달라고 요청할 수 있다. 메모리 기능은 과거에 열었던 탭에 대해 질문할 수 있게 해주며, 요청 시 아틀라스가 해당 탭을 다시 불러온다. 이러한 기능들이 오픈AI가 광고하는 만큼 훌륭한지 확인하려면 최소 몇 주가 걸릴 것이다. (에이전트 모드의 경우, 최소한 몇 차례의 모델 업그레이드가 더 필요할 것이다.) 하지만 무엇보다도, 누군가가 아틀라스를 사용해야 하는 이유에 대한 이론적 근거 하나는 있다. 그것은 브라우저 형태로 “ChatGPT를 당신의 전체 성격(personality,)으로 만드는 것”이이다.
이는 배포 전략이다. 애널리스트 베네딕트 에반스는 이렇게 말하며, 아틀라스가 데이터 수집 전략이기도 하다고 덧붙인다. 지금까지 OpenAI는 웹, 휴대폰 등 사용자가 이미 있는 곳 어디에서나 ChatGPT를 이용할 수 있도록 하는 데 집중해 왔다. 아틀라스를 통해 OpenAI는 ChatGPT 자체를 하나의 목적지로 만들고자 한다. 브라우저는 컴퓨터에서 가장 많이 사용되는 앱 중 하나다. OpenAI가 브라우저를 장악한다면 자신의 운명을 더 잘 통제할 수 있을 것이다.
보안 악몽. 블로거이자 개발자인 사이먼 윌리슨은 수개월간 AI 에이전트가 프롬프트 주입 공격(사용자를 해치도록 에이전트를 속이는 악의적 입력)에 노출될 위험에 대해 경고해왔다. 웹 페이지에 보이지 않는 명령을 삽입해 에이전트가 사용자의 데이터를 훔치거나 원치 않는 행동을 하도록 유도하는 프롬프트 주입은 심각한 피해를 초래할 수 있다. 윌리슨이 꾸준히 기록해온 바와 같이, 현재 이를 완벽히 막을 방법은 존재하지 않는다.
이러한 이유로 윌리슨은 아틀라스에 대한 열의가 다소 누그러진 상태다. 그는 이렇게 썼다:
“여기에 수반되는 보안 및 개인정보 보호 위험은 여전히 극복하기 어려울 정도로 높게 느껴진다. 보안 연구진들이 이 제품들을 철저히 검증하기 전까지는 어떤 제품도 신뢰하지 않을 것이다.”
프롬프트 주입 공격을 피하기 위해 Atlas가 취하는 단계에 대한 심층적인 설명을 보고 싶다. 현재로서는 주요 방어 수단이 사용자가 에이전트 모드가 항상 무엇을 하는지 주의 깊게 지켜보길 기대하는 것 같다. 공정하게 말하자면, 이는 Anthropic이 Claude for Chrome 브라우저 에이전트 사용자에게 요구하는 주요 방어 수단이기도 하다. AI 기업들은 프롬프트 주입에 대해 높은 경계 태세를 유지하도록 시스템을 훈련시켰다고 말하지만, 심각한 위험은 여전히 남아 있다.
대부분 크롬에 불과하다. OpenAI는 Atlas를 통해 시각적으로 인상적이거나 개념적으로 참신한 무언가를 선보일 기회가 있었지만 제품 첫 버전은 놀라울 정도로 간소하다.: Google 서비스를 제거하고 OpenAI 서비스로 대체한 축소판 크롬에 불과하다. 오픈AI 직원들이 하루 종일 자사 제품을 직접 사용해보는(dogfooding) 환경에서 이 점이 매력적으로 느껴질 수 있다는 건 이해할 수 있다. 하지만 아틀라스는 여전히 '애플리케이션이나 브라우저에서 그냥 ChatGPT를 계속 사용하지 않을 이유가 무엇인가'라는 근본적인 질문에 답하지 못하고 있다.
사람들이 정말 이걸 원하는지 추측하기엔 아직 이르다. 일부 논평가들은 브라우저 전쟁이 재개됐다고 주장하지만, 지금까지 나온 AI 브라우저 중 크롬에 실질적인 타격을 준 사례는 없다고 생각한다. 브라우저에서 많은 연구를 하지 않는 한, “탭과 대화하기”는 문제를 찾아다니는 해결책처럼 느껴질 수 있다. AI 연구 회사들은 사람들이 브라우저에서 하는 일이 휴가 예약이나 식료품 주문뿐이며, 사용자가 직접 하는 것보다 더 느리고 더 못하게 해주는 에이전트를 원한다고 생각하는 것 같다.
동시에, 여기 어딘가에는 분명히 만들어야 할 훌륭한 제품이 존재할 것이다. 온라인에서 사용자의 필요를 예측하고 작업을 지원하며, 그 과정에서 실수로 모든 은행 정보를 유출하지 않는 에이전트는 오늘날의 크롬보다 훨씬 유용할 수 있다. 아틀라스는 그 일반적인 방향으로의 반걸음에 불과하다. 하지만 결승선에 도달하려면 상당한 돌파구가 필요할 것이다.