보고, 읽고, 생각하고, 스스로 클릭하는 AI 에이전트

AI가 내 브라우저 안에 들어왔다

by SeaWolf

Site Agent가 뭔가요?

지금 보고 있는 네이버 기사, 유튜브 영상, 쿠팡 상품 페이지 — 어디서든 북마크 한 번 클릭하면 AI 어시스턴트가 바로 나타납니다. 그게 SiteAgent입니다.

설치요? 북마크바에 버튼 하나 드래그하면 끝입니다. 3초. API 키도 필요 없고, 회원가입도 없고, 돈도 안 듭니다. 그냥 쓰면 됩니다.

SiteAgent는 단순한 챗봇이 아닙니다. 페이지를 읽고, 분석하고, 클릭하고, 스크롤하고, 검색하고, 이미지까지 만들어주는 진짜 AI 에이전트입니다. 게다가 한국어에 완벽하게 최적화되어 있습니다.


Site Agent 무료 서비스 링크

https://siteagent.ginigen.ai/

SiteAgent - AI 웹 어시스턴트 - a Hugging Face Space by ginigen-ai.png


SiteAgent - AI 웹 어시스턴트 - a Hugging Face Space by ginigen-ai (1).png


12가지 AI 도구, 전부 내장

SiteAgent 패널 하나에 12가지 도구가 들어있습니다. 별도 설치나 설정 없이 버튼 하나로 바로 씁니다.


요약 — 긴 기사도 3줄로 정리해줍니다.


분석 — 페이지가 어떻게 구성되어 있는지, 뭘 말하고 있는지 심층적으로 파헤칩니다.


번역 — 영어, 일본어, 중국어, 뭐든 자연스러운 한국어로 바꿔줍니다.


검색 — 궁금한 걸 물어보면 Brave Search로 최신 정보를 찾아서 정리해줍니다.


여기까지는 다른 도구들도 할 수 있죠. SiteAgent가 진짜 다른 건 여기서부터입니다.


딥분석 (MARL) — 단순한 답변이 아니라, AI가 가설을 세우고, 추론하고, 스스로 검증하고, 반론까지 만든 다음 최종 답을 내놓습니다. 5단계 메타인지 파이프라인을 거친 답변은 차원이 다릅니다.


아이디어 (MARL) — 발명, 창작, 신약, 유전체, 화학, 생태, 법률 등 9개 전문 분야의 창발 엔진이 내장되어 있습니다. "새로운 비즈니스 아이디어 좀 내줘"가 아니라, 각 분야의 전문 지식 5,538개 데이터를 기반으로 진짜 쓸 만한 아이디어를 만들어냅니다.


금융 — TradingView 기반 실시간 글로벌 시장 대시보드. 주식, 환율, 암호화폐를 한눈에.


X-Ray — 지금 보는 사이트의 SEO 점수, 보안 상태, 기술 스택, 리소스 현황을 AI가 진단합니다.


날씨 — 서울, 부산, 대구 등 한국 주요 도시 실시간 날씨. ⏱ 타이머 — 뽀모도로 타이머부터 커스텀 시간까지.


이미지 생성 — 텍스트로 설명하면 Grok Imagine AI가 이미지를 만들어줍니다.


이미지 편집 — 기존 이미지를 올리고 "배경을 바꿔줘" 하면 AI가 편집합니다.


SiteAgent - AI 웹 어시스턴트 - a Hugging Face Space by ginigen-ai (2).png


MARL — 이게 핵심입니다

다른 AI 에이전트들은 질문하면 바로 답합니다. 한 번에. 틀려도 그냥 그대로 나옵니다.

SiteAgent는 다릅니다. MARL(Metacognitive Amplification & Reasoning Layer)이라는 메타인지 미들웨어가 탑재되어 있습니다. 쉽게 말하면, AI가 답을 내놓기 전에 스스로 의심하고, 검증하고, 틀린 부분을 고쳐서 다시 쓰는 구조입니다.

어떻게 동작하냐면, 하나의 질문이 5단계를 거칩니다. 먼저 가설을 설계합니다. 다음으로 심층 추론을 합니다. 그 결과를 감사합니다. 그리고 일부러 반론을 만들어서 적대적 검증을 합니다. 마지막으로 이 모든 걸 종합해서 재합성합니다.

이건 우리가 만들어낸 주장이 아니라, 데이터로 증명된 사실입니다. FINAL Bench에서 GPT-5.2, Claude Opus 4.6, Gemini 3 Pro 등 현존 최강 모델 9종을 1,800건 평가한 결과, 메타인지 구조를 적용하면 최상위 난이도 문제에서 성능이 70% 이상 향상되었고, 그 효과의 94.8%가 자기 교정에서 발생했습니다. FINAL Bench는 HuggingFace 데이터셋 글로벌 인기 5위를 달성했고, 서울신문·아시아경제·IT조선 등에 보도되었습니다.


SiteAgent - AI 웹 어시스턴트 - a Hugging Face Space by ginigen-ai (3).png


4가지 에디션으로 제공됩니다

북마클릿 — 지금 바로 쓸 수 있습니다

설치가 뭐가 필요해요. 홈페이지에서 버튼 하나 드래그하면 끝입니다. 어떤 브라우저에서든 동작하고, 12가지 AI 도구를 전부 무료로 씁니다. API 키? 필요 없습니다.


크롬 확장 — 스토어 심사 후 공개 예정

크롬 웹 스토어에서 1클릭으로 설치하는 버전입니다. 북마클릿의 모든 기능에 더해서, 페이지를 이동해도 AI가 자동으로 따라오고, Gmail로 자동 로그인되며, 모든 활동이 DB에 기록됩니다. 관리자 대시보드도 제공됩니다. 현재 심사 진행 중이며, 얼리 액세스를 등록하시면 출시 시 가장 먼저 알려드립니다.


서버사이드 — 기업이 직접 운영하는 B2B 솔루션

쿠팡 상품 자동 비교, 코레일 예매 자동화처럼 특정 웹사이트에 AI 에이전트를 심어서 운영하는 엔터프라이즈 버전입니다. 기업 IT팀이나 SI 파트너가 자사 서버에 배포하여 고객응대, 커머스, 교통 등 도메인에 특화된 자율 에이전트를 구축할 수 있습니다.


워크시트 — 사무직을 위한 B2C 자동화

구글 시트 위에서 돌아가는 AI 자동화 도구입니다. 재무 분석, 세무 신고 도우미, 법률 검토, 차트 생성, 카카오톡 메시지 자동화까지 8개 전문 탭으로 구성되어 있습니다. 사무직 종사자나 1인 사업자가 API 키 하나만 넣으면 바로 업무에 활용할 수 있습니다.


SiteAgent - AI 웹 어시스턴트 - a Hugging Face Space by ginigen-ai (4).png


경쟁사들은 왜 SiteAgent를 못 따라오나


Alibaba Page Agent — 좋은 시도, 하지만 한계가 뚜렷합니다

Page Agent는 알리바바가 만든 오픈소스 인페이지 에이전트입니다. 개념은 SiteAgent와 비슷하지만, 실제로 써보면 차이가 확연합니다. 가장 큰 문제는 패널을 드래그로 이동할 수 없다는 것입니다. 화면 하단에 고정되어 있어서, 패널이 페이지 내용을 가리면 어쩔 수가 없습니다. SiteAgent는 패널을 자유롭게 드래그하고, 크기도 조절하고, 최소화도 됩니다.

또한 Page Agent는 X(트위터)처럼 content-editable을 사용하는 웹앱에서 텍스트 입력이 실패합니다. GIGAZINE 리뷰에서 공식 확인된 한계입니다. 이미지도 인식 못 하고, 키보드 단축키도 못 씁니다. 한국어 UI는 아예 없고, 무료 데모는 Qwen과 DeepSeek만 됩니다. 그리고 가장 중요한 차이 — MARL 같은 멀티턴 추론 엔진이 없어서, 모든 응답이 단일 LLM 호출 한 번으로 끝납니다.


OpenClaw — 강력하지만, 보안이 심각합니다

OpenClaw는 2026년 초 가장 화제가 된 오픈소스 AI 에이전트입니다. 깃허브 스타 175,000개를 넘기며 React를 제쳤죠. 하지만 그 인기만큼 보안 문제도 심각합니다.

보안 감사에서 CVE 512건(그중 8건 치명적)이 발견되었고, 스킬 마켓플레이스 ClawHub에서는 악성 스킬 820건 이상이 적발되었습니다. Microsoft, Kaspersky, CrowdStrike, Cisco, Trend Micro — 글로벌 보안 기업들이 전부 경고를 발표했습니다. API 키와 비밀번호를 평문으로 저장하는 바람에 RedLine, Lumma 같은 인포스틸러의 표적이 되었고, 인터넷에 노출된 인스턴스가 30,000개를 넘었습니다.

SiteAgent는 근본적으로 다릅니다. 브라우저의 DOM에만 접근하고, 시스템 파일이나 터미널 권한은 아예 요청하지 않습니다. 설치에 Node.js도 필요 없고, 터미널을 열 일도 없습니다.


OpenAI Operator — $200/월, 그리고 종료

OpenAI가 만든 Operator는 CUA(Computer-Using Agent) 모델로 브라우저를 스크린샷 찍어가며 조작하는 방식이었습니다. 개념은 인상적이었지만, 월 $200 구독이 필요했고 미국에서만 사용 가능했습니다. 캘린더 관리나 슬라이드 제작 같은 복잡한 작업에서는 자주 실패했고, 스크린샷 기반이라 반응 속도도 느렸습니다. 결국 2025년 8월에 서비스를 종료하고 ChatGPT Agent로 통합되었습니다.


Gemini, Claude — 훌륭하지만 에이전트가 아닙니다

Google Gemini와 Anthropic Claude는 뛰어난 AI 모델이지만, 지금 보고 있는 페이지를 직접 분석하거나 조작하는 에이전트 기능은 없습니다. URL을 복사해서 붙여넣어야 하고, 별도 웹사이트에서만 대화할 수 있습니다. 월 $20 이상의 구독도 필요합니다. 금융 대시보드, X-Ray 분석, 이미지 생성(Claude는 불가) 같은 내장 도구도 없습니다.


승차권 예매_예매_승차권_코레일 승차권예매.png


3초면 시작할 수 있습니다

1) SiteAgent 홈페이지에 접속합니다.

2) 보라색 � SiteAgent 버튼을 브라우저 북마크바로 드래그합니다.

3) 아무 웹 페이지에서 방금 만든 북마크를 클릭합니다.

4) AI 패널이 나타납니다. 바로 쓰면 됩니다.


크롬 확장 버전은 스토어 심사 완료 후 공개됩니다. 출시 알림을 받으려면 홈페이지에서 얼리 액세스를 등록해주세요.


낙원타코 강남역점 - 네이버지도.png


기술 스택

SiteAgent의 프론트엔드는 프레임워크 없이 순수 JavaScript로 구축되어 경량성을 극대화했습니다. 백엔드는 Python FastAPI 위에서 돌아가며, AI 추론은 Groq API의 gpt-oss-120b 모델을 MARL 5단계 파이프라인으로 감싸서 처리합니다. 이미지 생성은 fal.ai의 Grok Imagine을 사용하고, 데이터는 SQLite에 저장한 뒤 HuggingFace Hub에 자동 백업합니다. 브라우저 에이전트 코어는 Alibaba PageAgent를 기반으로 하되, Ginigen AI가 커스텀 UI와 MARL 엔진을 통합한 독자 구현입니다.


쿠팡이 추천하는 아이패드 프로 관련 혜택과 특가.png


만든 사람들

Ginigen AI (지니젠AI) — 서울 강남구에 위치한 AI 스타트업. "누구나 쉽게 만드는 AI 영상"을 비전으로 2025년 설립되었습니다.

HuggingFace Star AI Top 12 선정 (2024). FINAL Bench — 세계 최초 AI 메타인지 벤치마크로 HF 글로벌 인기 5위 달성. 월간 Active Users 100만 이상, 커뮤니티 5,000명 이상. 서울신문, 아시아경제, IT조선, 비하인드 등 언론 보도.


Site Agent 무료 서비스 링크

https://siteagent.ginigen.ai/


NAVER.png


관련 링크

MARL 미들웨어:

https://huggingface.co/spaces/VIDraft/MARL


FINAL Bench:

https://huggingface.co/spaces/FINAL-Bench/Leaderboard


기술 블로그:

https://huggingface.co/blog/FINAL-Bench/marl-middleware


MARL PyPI:

https://pypi.org/project/marl-middleware


ClawHub:

https://clawhub.ai/Cutechicken99/marl-middleware


문의:

arxivgpt@gmail.com


세상 모든 소식을 읽어봅시다 _ 네이버 블로그.png


자주 묻는 질문

SiteAgent는 정말 무료인가요? 네, 북마클릿과 크롬 확장 모두 완전 무료입니다. API 키도 필요 없고, 구독도 없습니다. 서버 비용은 Ginigen AI가 부담합니다.


어떤 브라우저에서 동작하나요? 크롬, 엣지, 웨일, 브레이브 등 Chromium 기반 브라우저 전체에서 동작합니다. 북마클릿 버전은 파이어폭스와 사파리에서도 됩니다.


개인정보는 안전한가요? API 키는 브라우저 로컬에만 저장됩니다. 개인정보를 제3자에게 판매하거나 공유하지 않습니다. 확장 프로그램을 삭제하면 로컬 데이터가 자동으로 사라집니다.


MARL이 정확히 뭔가요? Metacognitive Amplification & Reasoning Layer의 약자입니다. AI가 답을 내기 전에 스스로 가설을 세우고, 추론하고, 감사하고, 일부러 반론을 만들어 검증한 다음, 이 모든 걸 종합해서 최종 답을 만드는 5단계 미들웨어입니다. 어떤 LLM이든 base_url 한 줄만 바꾸면 적용됩니다.


OpenClaw나 Page Agent와 뭐가 다른가요? SiteAgent만의 차별점은 네 가지입니다. 첫째, 업계 유일의 MARL 메타인지 5단계 추론. 둘째, 12가지 올인원 도구가 전부 내장. 셋째, 한국어 네이티브 최적화. 넷째, 완전 무료에 드래그 한 번이면 설치 끝. 참고로 OpenClaw는 보안 취약점이 512건 발견되어 Microsoft와 Kaspersky가 경고했고, Page Agent는 패널 드래그가 안 되고 한국어 UI가 없습니다.


기업에서 도입하고 싶은데 어떻게 하나요? B2B 서버사이드 버전은 기업 웹사이트에 AI 에이전트를 직접 삽입하여 운용하는 솔루션입니다. 커머스, 교통, 고객응대 등 도메인에 맞춰 커스터마이징됩니다.


arxivgpt@gmail.com으로 문의해주세요.


비드래프트 - Google 검색.png


작가의 이전글lol - AI 벤치마크의 벤치마크