brunch

You can make anything
by writing

C.S.Lewis

by 정하윤 Jun 18. 2024

구글 알고리즘 유출의 핵심 15가지

최근 구글 검색 알고리즘 관련 내부 문서가 유출되면서 큰 파장을 일으켰다.

결론부터 말하자면 양질의 콘텐츠가 핵심이다.


이 유출은 Warehouse yoshi-code-bot이 GitHub에 구글 내부 Content API를 게시하면서 일어났다. 초기에는 구글이 문서의 진위여부에 대한 언급을 피했으나, 이후 문서가 실제 구글 내부 문서임을 확인했다. 다만, 문서의 내용이 다소 오래된 정보일 수 있다는 점을 감안해야 한다.


일부 전문가들은 이 문서가 구글의 실제 알고리즘을 반영한게 아니라, 단지 내부 API 문서일뿐이라고 주장하기도 한다. 따라서 아래 내용을 바탕으로 SEO 전략을 전적으로 변경하는 것은 지양해야한다.



그러나 유출된 문서에 담긴 내용은 주목할만하다. 


1. 클릭 데이터의 중요성

구글은 클릭 데이터를 검색 순위에 사용하지 않는다고 주장해왔다. 그러나 유출된 문서에 따르면 'goodClicks', 'badClicks', 'lastLongestClicks'와 같은 클릭 데이터가 실제로 중요한 순위 결정 요소로 사용되고 있다. 


이는 사람들이 클릭하고 싶은 제목을 짓는 것이 얼마나 중요한지를 보여준다.








2. 도메인 권위 (Domain Authority)

도메인 권위가 없다고 얘기했던 Google Analyst, Gary

구글은 도메인 권위를 사용하지 않는다고 여러 차례 밝혔지만, 문서에는 'siteAuthority'라는 항목이 포함되어 있다. 이는 구글이 사이트 전체의 권위를 측정하고 이를 순위 결정에 사용하고 있다는 것을 시사한다.

도메인 권위가 높을수록 더 높은 구글 순위에 게재될 가능성이 크다. 여기서 도메인 권위란 특정 도메인이 검색 엔진에서 얼마나 신뢰할 수 있고 권위있는 사이트로 평가받는지에 대한 지표이다. (백링크, 콘텐츠, 사용자 경험 등 다양한 요소로 평가된다.)


버젓이 발견된 도메인 권위



3. 크롬 데이터의 사용

2016 구글 내부 PPT 유출 자료


구글은 크롬 브라우저 데이터를 검색 순위에 사용하지 않는다고 주장해왔지만, 유출된 문서에는 크롬 데이터를 포함한 여러 측정 항목이 포함되어 있다.

이는 크롬 데이터를 웹사이트 품질을 평가하는 데 사용할 수 있다는 것을 보여준다. 구글이 크롬 브라우저를 권장하는 이유다. 보통 검색 히스토리, 브라우징 히스토리, 클릭, 움직임, 체류시간, 패턴등을 수집해왔을 것으로 추측해볼 수 있다.



4. 신생 웹사이트 샌드박스

Google 내부고발자 Zach Vorhies 가 유출한 자료


구글은 신생 웹사이트를 구글 샌드박스에 포함시키지 않는다고 밝혔지만, 문서에는 'hostAge'라는 속성이 포함되어 있다.

이는 신생 웹사이트가 구글 색인부터 높은 SERP 순위에 페널티가 있을 수 있음을 나타낸다. 새로운 웹사이트가 처음부터 높은 순위에 오르지 못하게 함으로써 스팸 사이트나 저품질 사이트가 검색 결과를 장악하는 것을 막기 위함으로 추측해볼 수 있다.



5. 사용자 경험 (UX)


구글은 사용자 경험이 검색 순위에 큰 영향을 미치지 않는다고 주장해왔지만, 문서에는 클릭률(CTR)과 체류 시간(dwell time)과 같은 지표가 실제로 순위에 영향을 미친다는 내용이 포함되어 있다. 이는 여전히 퀄리티 있는 콘텐츠의 중요성을 강조한다.



6. 저자 정보의 중요성 


구글은 저자 정보가 검색 순위에 영향을 미치지 않는다고 밝혔지만, 문서에는 구글이 페이지의 저자 데이터를 수집하고 이를 순위 결정에 사용하고 있다는 내용이 포함되어 있다. 메타 태그의 author 데이터가 검색 순위에 영향을 미칠 수 있다. 



7. 콘텐츠 최신성 

문서에는 구글이 콘텐츠의 최신성을 중요하게 여긴다는 내용이 포함되어 있다.

이는 글이 콘텐츠의 최신성을 평가하고 이를 순위 결정에 반영한다는 것을 보여준다. 아웃데이트된 콘텐츠를 지속적으로 업데이트해야 한다.





8. 링크의 중요성 

링크 빌딩이 여전히 중요한 순위 결정 요소로 남아있다는 내용이 문서에 포함되어 있다. 링크의 다양성과 관련성이 중요한 역할을 한다. 이는 양질의 백링크가 여전히 중요하다는 것을 시사한다.



9. 키워드 매칭 페이지 타이틀

문서에는 타이틀매치스코어(titlematchScore)라는 항목이 포함되어 있으며, 이는 페이지 타이틀이 검색 쿼리와 얼마나 잘 맞는지를 평가하는 지표다.

이는 타이틀에 타겟 키워드를 포함시키는 것이 중요함을 보여준다.



10. 콘텐츠 길이와 키워드 밀도 


구글은 문서의 최대 토큰 수를 고려하여 콘텐츠를 잘라내기 때문에 중요한 콘텐츠는 문서의 초반부에 배치하는 것이 좋다. 이 말인 즉슨 알고리즘이 인덱싱할 때 특정 한도를 초과하면 콘텐츠의 일부를 무시할 수 있다는 것을 의미한다. 짧은 콘텐츠도 독창성을 평가받아 높은 점수를 받을 수 있다.

핵심 메시지를 앞부분에 배치하고, 콘텐츠가 길더라도 중요한 정보를 먼저 제공하는 것이 중요하다.



11. 도메인 등록 정보 

구글은 도메인의 최신 등록 정보를 문서 수준에서 저장하며, 이는 새로 등록된 도메인을 샌드박스에 포함시키는 데 사용될 수 있다.

메인이 최근에 등록되었거나 소유자가 변경된 경우 초기 색인화에서 불이익을 받을 수 있다.

신뢰성의 이슈로 생각해볼 수 있다. 앞서 말한 신생 웹사이트 샌드박스와 일맥상통한다고 볼 수 있다.



12. 동영상 중심 사이트

사이트의 50% 이상의 페이지에 동영상이 포함되어 있다면, 해당 사이트는 동영상 중심 사이트로 간주되어 다르게 처리된다. 동영상 콘텐츠가 많은 사이트는 이를 최적화하여 검색 순위에 긍정적인 영향을 미칠 수 있다.



13. YMYL (Your Money or Your Life) 

구글은 YMYL 건강과 YMYL 뉴스에 대한 점수를 매기고 있으며, 이는 특정 주제에 대한 신뢰성과 권위성을 평가하는 데 사용된다. 구글은 YMYL 을 특히 중요하게 여긴다.

금융, 건강 등 중요한 정보를 제공하는 사이트는 신뢰성과 권위성을 갖추어야 높은 순위를 받을 수 있다.






14. 사이트 임베딩 

구글은 페이지 임베딩과 사이트 임베딩을 비교하여 페이지가 주제에서 얼마나 벗어났는지를 측정한다. 이는 페이지가 사이트의 주제와 얼마나 일치하는지를 평가하는 데 사용된다.

사이트의 전반적인 주제와 일관된 콘텐츠를 제공하는 것이 중요하다.






15. 소규모 개인 사이트

구글은 '소규모 개인 사이트'를 구분하는 특정 플래그를 가지고 있으며, 이는 작은 사이트들을 다른 방식으로 처리할 가능성이 있다. 작은 개인 사이트가 더 높은 노출을 받기 위해 특별한 전략을 필요로 할 수 있다.

소규모 사이트는 신뢰성과 권위성을 구축하고, 지속적으로 고품질의 콘텐츠를 제공하는 것이 중요하다.






구글은 Larry Page 와 Sergey Brin 이 공동 창립하였다. 스탠포드 대학교 박사 과정 학생이었던 두 창업자는 검색 엔진의 혁신을 목표로 삼았으며, 구글은 학술 논문 검색을 개선하려는 연구 프로젝트로부터 시작되었다. 


그래서 구글의 핵심 알고리즘인 PageRank 는 학술 논문을 평가하는 방식과 굉장히 유사하다. 학술 논문이 인용된 횟수와 눈문의 영향력을 평가하는 것과 유사하게 웹페이지가 얼마나 많은 다른 웹페이지로부터 링크를 받았는지, 링크를 제공하는 웹페이지의 중요도에 따라 페이지의 중요도를 평가한다.


결론적으로는 이 모든 요소들이 구글이 궁극적인 목표, 즉 사용자에게 가장 유용하고 신뢰할 수 있는 정보를 제공하기 위함이라는 것이다. 결국은 본질이다. 구글은 앞으로도 신뢰를 바탕으로 사용자 중심의 접근을 통한 더 나은 검색 경험을 제공하기 위해 계속해서 알고리즘을 발전시켜 나갈 것이다.




출처: https://ipullrank.com/google-algo-leak






작가의 이전글 당신은 실패하실 겁니다
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari