Google이 Google-Pinpoint라는 새로운 사용자 에이전트(User Agent)를 공식 문서에 추가했습니다. 이 크롤러는 사용자가 직접 지정한 URL만 요청하는 사용자 트리거형(fetcher) 방식으로 작동한다고 Google은 최신 업데이트에서 밝혔습니다.
이 기능은 Google의 문서 분석 도구 Pinpoint에서 사용자가 수집(source)으로 설정한 URL을 가져오기 위해 활용됩니다. 자세히 보기
Pinpoint는 기자, 연구자, 학계 전문가들이 방대한 규모의 문서를 빠르게 탐색·분석할 수 있도록 설계된 Google의 고급 리서치 도구입니다.
사용자는 수십만 건의 문서, 이미지, 이메일, 수기 노트, 오디오 파일 등을 업로드하고, 특정 단어·구절·지명·조직·인물을 손쉽게 검색할 수 있습니다.
Pinpoint 하나의 컬렉션에는 **최대 20만 개(200,000개)**의 문서를 저장할 수 있습니다.
이미지, PDF, 오디오 파일, 스캔 문서 등 다양한 형식의 콘텐츠 업로드가 가능합니다.
Pinpoint는 **OCR(문자 인식)**과 음성-텍스트 변환(Speech-to-Text) 기술을 활용해 다음과 같은 광범위한 파일에서 텍스트를 검색할 수 있습니다.
Microsoft Office 문서
텍스트 파일, 이메일
이미지 내부의 텍스트
여러 언어의 음성 파일을 텍스트로 변환한 자료
단순 키워드 검색을 넘어 다음과 같은 검색 옵션을 제공합니다.
정확 일치 검색
유사어·근접어 검색
어간(stemming) 기반 검색
예를 들어 *“moon”*을 검색하면 “moons”, “lunar”, 심지어 프랑스어 *“lune”*까지 매칭됩니다.
최대 2시간 길이의 오디오 파일을 업로드할 수 있으며
Pinpoint가 이를 텍스트로 전사하여 검색 가능한 문서로 변환합니다.
전사는 15개 언어를 지원합니다.
Pinpoint는 단독 연구뿐 아니라 협업 환경에서도 강력합니다.
컬렉션의 전체 또는 특정 문서·문단을 공유
텍스트 하이라이트 공유
Google 계정 보유자 간 안전한 권한 공유
모든 컬렉션은 기본적으로 비공개이며, Google의 보안·개인정보 보호 기술로 보호됩니다.
사용자가 선택한 경우에만 특정 사용자 또는 팀과 공유할 수 있습니다.
Google 계정을 가진 누구나 공개된(Public) Pinpoint 컬렉션을 탐색하고 검색할 수 있습니다.
Google이 이번에 문서화한 Google-Pinpoint User Agent는 Pinpoint 이용자가 직접 선택한 소스 URL을 수집하기 위한 크롤러로, Pinpoint의 강력한 리서치 기능을 뒷받침하는 핵심 요소입니다.
Pinpoint는 방대한 문서 처리, 고급 검색 기능, 오디오 전사, 협업 기능 등을 제공하며 저널리스트·연구자·학계에 최적화된 도구로 자리 잡고 있습니다.
검색엔진 최적화에 대한 이해를 위해 Google SEO 가이드를 읽어 보세요.