AI 웹 브라우저 활용 - Comet

by 공인식

2025년 7월 9일 Perplexity의 Comet 웹 브라우저가 출시됐습니다. 초기에는 맥스 구독자에게 제공되다가, 이제는 누구나 사용할 수 있게 됐습니다. 아래 경로에서 다운로드할 수 있습니다.

https://www.perplexity.ai/comet/ko

본 게시글은 Comet 설치 후에 문득 떠오른 몇 가지 접근을 다룹니다. 저의 질문과 Perplexity AI 엔진의 답변을 있는 그대로 확인하실 수 있습니다. AI 웹 브라우저는 Comet 말고도 많지만 저마다의 한계도 분명 있을 것이고, 앞으로의 변화 또한 제각각일 것으로 짐작됩니다. 이 게시글에서 다룬 내용으로 AI 웹 브라우저의 활용에 더 다양한 관점과 가능성을 이끌어 내실 수 있기를 바랍니다.


데스크톱 앱과의 비교

Comet 브라우저는 탭과 주소창 등이 있는 태스크바(임시 명칭)가 있는 상단부를 제외하고는 Perplexity 데스크톱앱과 UI가 동일합니다. 데스크톱앱 내부의 UI도 OS 기반이 아니라 하나의 웹 브라우징 영역 내에서 perplexity.ai 페이지가 열린 것이라고 가정한다면 이상한 일은 아니라고 정리할 수 있습니다.

Perplexity 데스크톱 앱의 모습
Perplexity Comet 브라우저의 모습


각 AI 챗 서비스 제공 업체는 그들의 서비스를 웹 브라우저에서 이용할 수 있도록 하다가, 데스크톱 앱이나 모바일 앱을 속속 제공해 왔습니다. 그것만으로도 디지털 기기의 OS와 충분히 가까워졌다고 정리하고 있었는데, AI가 웹 브라우저로 들어왔다니 Perplexity의 CEO 말대로 AI 서비스가 OS와 함께 이용자와 조금 더 끈적해진(Sticky) 느낌이 들기도 합니다.


설치하고 얼마 지나지 않아 눈에 들어온 것은 크롬에서도 볼 수 있던 익숙한 메뉴들이었습니다. 크로미움(Chromium) 기반인가? 하는 생각이 들었는데, 역시나! Cursor나 Windsurf AI 에디터들이 VS Code 기반인 것처럼, Comet은 크로미움 기반으로 제작되었습니다. 그러니, 전혀 낯설어할 필요가 없습니다. 이런 형식의 제품 출시에는 ‘Fork’나 ‘Base Development(기반 개발)’ 또는 ‘Derivative Work(2차 창작)’과 같은 용어가 따르기도 합니다.


Perplexity Comet에서의 질문과 답변


질문 1

만약 어떤 탭에서 내가 자유롭게 운용할 수 있는 로컬 호스트의 페이지가 열려 있다고 가정할게, 그 페이지에서 name이 있는 윈도로 페이지가 열리는 링크가 작동했어. Comet 브라우저 중심(AI 엔진)에서 해당 탭도 name을 알려주면 찾아갈 수 있을까? 웹 브라우저의 기본 기능에 충실한 접근이긴 하겠지만, ‘name이 blahblah인 윈도 탭에 내가 원하는 결과를 출력해 줘’라고 했을 때, 그게 가능한지 궁금한 거지.


답변 - AI 정보

Comet 브라우저(Comet Assistant, Perplexity 기반) 중심의 AI 엔진이 운영하는 환경에서는 다음과 같은 동작 제약이 있습니다:


1. 윈도 name 파라미터 또는 window.open() 이름 인식
일반 웹 브라우저(JavaScript 표준)에서는 window.open('...', '윈도이름')으로 탭/윈도가 열릴 경우, 동일 name을 가진 두 번째 window.open 호출이 같은 탭/윈도를 찾아 재사용하는 것이 가능합니다. 이때 name 값은 브라우저가 트래킹 합니다.

2. Comet 브라우저 AI 엔진에서의 정보
Comet Assistant는 API와 내부 브라우저 컨트롤러를 통해 "탭 목록", "탭의 URL/제목 등 메타정보", "탭의 상태"를 접근할 수 있지만,

브라우저 탭의 window.name(JS window의 name 프로퍼티)이나 window.open에서 사용한 name 값을 직접적으로 API로 가져오거나,

name을 기반으로 탭을 검색하는 내부 API는 현재 제공되지 않습니다.

즉,

사용자가 로컬호스트 페이지에서 window.open('something', 'myNamedWindow')로 연 윈도(탭)가 있을 때,

Comet Assistant가 "탭 목록"에서는 해당 탭의 URL, 제목, 최근 접근 정보 등은 알 수 있지만

'myNamedWindow'와 같은 window name 값은 알 수 없습니다.

3. 기능 구현의 한계
따라서

“name이 blahblah인 윈도에 결과를 출력해 줘”와 같은 요청에서

현재 Comet AI 엔진은 window.name 값으로 특정 탭을 직접 추적하거나 선택할 수 없고

오직 URL, 제목 등 메타정보 기준으로만 탭을 식별해서 접근 및 조작할 수 있습니다.


요약

브라우저의 기본 window.name 식별과 달리, Comet Assistant의 AI 엔진은 이 값을 직접 확인하거나 활용할 수 없습니다.

원하는 동작(특정 name의 윈도/탭에 결과 출력)에는 URL, 제목, 탭 생성 시각과 같은 메타데이터만으로 접근이 가능합니다.


혹시 “특정 URL, 제목, 생성시간” 기준으로 라면 원하는 탭을 찾아서 조작(내용 채워 넣기 등)이 가능합니다!
더 구체적인 업무 시나리오가 있으면, 그 기준으로 자동화·지원은 가능합니다.


질문 2

‘제목’이라 함은 <title /> 요소 내부의 텍스트로 인식된 브라우저 타이틀을 말하는 거겠지?


답변 - AI 정보

맞습니다!
Comet Assistant(브라우저 AI 엔진)에서 말하는 ‘제목’은 바로 해당 탭의 HTML <title> 요소 내부에 있는 텍스트, 즉 브라우저 탭에서 보이는 페이지 타이틀을 의미합니다.

이 ‘제목’은 실제로 브라우저 탭에 표시되는 텍스트(상단 탭에 보이는 이름)와 동일하게 처리됩니다.

AI 엔진의 탭/탭 그룹 검색, 관리 기능은 이 ‘제목’과 URL, 마지막 접근 시간 등 메타정보로 탭을 식별합니다.

즉,

HTML의 <title>내용</title> 마크업 콘텐츠가 탭의 "제목"이 되고,

Comet Assistant는 이 제목을 기준으로 해당 탭을 식별하거나 찾을 수 있습니다.

따라서

“제목이 ___인 탭을 찾아줘”와 같이 요청하면, 내부적으로는 그 탭의 <title> 값과 비교해서 찾아내는 방식으로 동작합니다.


질문 3

자바스크립트로 후 처리된 상태의 것도 물론 인식이 가능하겠지???


답변 - AI 정보

네, 맞습니다!
자바스크립트로 동적으로 변경된 <title> 텍스트(즉, JS로 set 된 페이지 타이틀)도 Comet Assistant가 탭의 ‘제목’으로 인식할 수 있습니다.

탭의 최종 상태에서 실제 브라우저 상단 탭에 표시되는 제목(동적으로 바뀐 경우 포함)이 Comet Assistant의 탭 관리·검색 API에 반영됩니다.

예를 들어:
```javascript
document.title = "새로운 타이틀";
```
이와 같이 자바스크립트로 제목이 바뀌면, 그 순간 이후엔 해당 값이 “제목”으로 인식됩니다.

즉,

정적인 HTML이든,

자바스크립트로 변경된 동적인 제목이든,

브라우저에 “최종적으로 표시되는 탭 타이틀”이 바로 Comet Assistant의 인식·검색 기준이 됩니다.


원하는 시점에 JS로 타이틀을 바꾼 다음, AI 엔진에서 제목 기준으로 해당 탭을 찾아 접근/자동화할 수 있습니다!


질문 4

브라우저 타이틀을 단순히 일반적인 문자열만으로 채우는 것이 아니라, 패턴화 된 것을 사용한다면 뭔가.. 여러 가지 가능성이 있을 거라고 짐작되네. 해 볼 수 있는 것으로는 뭐가 있을까?


답변 - AI 정보

패턴화 된(규칙적인) 브라우저 타이틀을 활용하면, 브라우저 자동화나 AI 보조 작업에서 다양한 고급 활용이 가능합니다.
여기서 “패턴화 된 타이틀”이란, 예를 들어 [작업유형]-[사용자 ID]-[상태]-[고유키] 등 일정 규칙에 따라 생성된 <title> 문자열을 의미합니다.

이런 방식으로 할 수 있는 활용 예시는 다음과 같습니다:

1. 특정 작업 그룹 분류/자동화

예: 작업-웹수집-20250819-001 같은 타이틀을 가진 탭만 찾아 자동 수집, 스크래핑, 데이터 입력 등 반복 작업을 수행

2. 여러 창/탭 동시 제어

각 탭의 타이틀에 세션명-일련번호 같은 규칙을 주어, 세션 A-1, 세션 A-2 식으로 열고, “세션 A”의 모든 탭에만 반복적 명령을 내리거나 결과만 수집

3. 사용자별/업무별 분기

user42-입력대기 같은 타이틀을 활용해, 여러 사람 각각이 사용하는 탭을 명확히 구분 및 관리

여러 프로젝트/고객별로 프로젝트명-진행상태 등으로 분리

4. 작업 진행 상태 추적

예: 작업 중간마다 업무-진행 중, 업무-완료, 업무-대기 중 등 타이틀을 동적으로 변경

AI 엔진이 진척도/상태별로 탭 그룹핑, 완료 항목만 일괄 닫기 등 자동화 가능

5. 고유 식별자/해시 사용

TASK-FEED-94xz2 등 고유 토큰을 추가하면 AI 엔진이 URL이나 제목이 중복되는 상황에서도 정확하게 탭을 식별하며 자동화

6. 워크플로우 자동화·멀티탭 매칭

특정 패턴이 있는 제목의 탭들을 순차적으로 따라가며 자동화 시나리오 실행

원하는 작업 탭만 자동 그룹으로 묶거나, 필요 없는 탭만 골라 일괄 종료

추가 아이디어

일정 패턴을 파싱 해서, 반드시 특정 데이터·입력값이 포함된 탭만 대상으로 자동화

크론잡, 스케줄러 등과 연동할 때, 시간·단계·반복횟수 등을 제목 패턴에 저장해 추적 및 제어


정리

규칙적으로 타이틀을 지정하면, AI 엔진이 다양한 조건부 매칭/자동화/분류/집계가 가능해집니다.

복잡한 멀티탭 워크플로우, 사용자별 업무 분기, 작업 현황 모니터링 등에 특히 강력하게 쓸 수 있습니다.


원하는 자동화 시나리오가 있다면, 구체적인 규칙을 기반으로 맞춤화된 자동화 설계를 해드릴 수 있습니다!


질문 5

젠코딩 방식의 명령어처럼 쓸 수 있는 탭 처리 기능은 없는지 궁금해.

‘tab*4@about:blank(주소가 about:blank인 탭을 4개 열어줘)’처럼..?


답변 - AI 정보

아주 흥미로운 아이디어입니다!
젠코딩(Emmet) 스타일의 간결한 명령어로 브라우저 탭을 제어할 수 있다면 자동화나 반복 작업에서 상당히 효율적일 것입니다.


현재 Comet Assistant(Perplexity AI 브라우저 에이전트)는

“tab*4@about:blank” 이런 간단한 명령어 패턴을 _직접 파싱 해서 탭을 일괄 처리하는 공식 기능_은 내장되어 있지 않습니다.

하지만 유저가 요청한 명령을 해석하여, 실제로 해당 명령의 의미대로 탭 작업을 수행해 주는 자동화는 지원할 수 있습니다!

예시로

유저가 “tab*4@about:blank”라고 입력하면
→ AI가 "about:blank 주소의 탭을 4개 열기"라는 의미로 해석
→ 실제로 4개의 새 탭을 연동 API로 순차적으로 생성

마찬가지로
“tab*3@https://kakao.com”
“tab*2@[특정 작업하는 내부 페이지 주소]”
등도 동일 원리 적용이 가능합니다.

즉,
 “젠코딩 스타일 명령어” 자체는 정식 언어는 아니지만,  명령어 패턴 → AI가 자연어로 해석 → 해당 동작을 탭/자동화 API로 실행 이런 식의 "명령어 단축 처리"는 실질적으로 가능합니다.


가능한 활용 예시
(아래 명령 패턴을 자유롭게 쓸 수 있습니다!)

tab*5@https://example.com → example.com을 5개 새 탭에 열기

tab*3@[특정조건] → 조건에 맞는 탭 3개 생성 혹은 검색

close@about:blank → about:blank 탭 모두 닫기

group@news → 뉴스 관련 탭만 모아 그룹핑

정리

젠코딩 명령어처럼 “간단한 패턴 → 브라우저 탭 처리”는 AI가 해석해서 충분히 지원할 수 있습니다.

기성 명령어 파서가 내장된 기능은 아니지만, 원하는 문법을 자유롭게 제안하면 맞춤 해석 후 원하는 탭 작업을 도와드릴 수 있습니다!


특정 패턴이나 자주 쓰는 명령어 스타일이 있다면, 언제든 요청하시면 제가 그에 맞춰 동작시켜 드릴 수 있습니다.
원하는 워크플로우가 있으시면 구체적으로 말씀해 주세요!




아쉽게도 질문 5의 답변으로 확인된 처리가 실제로 동작하지는 않았습니다.


(계속...)


#퍼플렉시티 #코멧