브랜드 매니저가 꼭 알아야 할 검색 랭킹의 실제 작동 원리(출처: 2024년 유출된 구글 알고리즘 문서)

브랜드 매니저가 꼭 알아야 할 검색 랭킹의 실제 작동 원리(출처: 2024년 유출된 구글 알고리즘 문서) 브랜드 매니저가 꼭 알아야 할 검색 랭킹의 실제 작동 원리(출처: 2024년 유출된 구글 알고리즘 문서)

2024년 5월에 구글 내부 콘텐츠 API Warehouse 문서에서 무려 14,000개 이상의 랭킹 관련 신호와 2,500개 이상의 모듈이 유출된 사건이었습니다. 이 사건은 해킹이나 내부 고발로 인해 발생한 것이 아니라 구글이 의도치 않게 드러난 정보였기에, 그 파급력은 더욱 컸습니다. 특히 이번 유출을 통해 우리가 그동안 구글이 공식적으로 긍정도 부인해주지 않았던 랭킹 요소들이 실제로 존재하고 있었고, 랭킹에도 영향을 미치고 있었음을 확인할 수 있었습니다. 검색 이용자들의 클릭 데이터를 활용하는가?, 브라우저 정보가 이용되는가?, 사이트 전체의 권위 점수와 같은 요소들이 있는가? 같은 SEO 업계에서의 오래된 궁금증이 드디어 풀리는 순간이었습니다. 오늘은 이 리크 문서를 분석했던 여러 아티클을 종합해서 우리가 기억해 둬야할 만한 것들을 정리해보려 합니다.

구글 검색의 첫 번째 관문, 머스탱(Mustang) 평가 시스템

머스탱은 검색 알고리즘의 가장 기본적인 평가 계층의 이름으로, 페이지가 검색 결과에 노출되기에 얼마나 적절한지를 판단하는 첫 번째 필터입니다. 이 시스템에서는 아직 사용자의 클릭이나 행동 데이터를 고려하지 않고, 오직 페이지 자체의 품질, 구조, 텍스트 구성 등 만으로 점수를 매겨 콘텐츠를 평가합니다. 다시 말해, 이 계층은 콘텐츠의 ‘내부 스펙’을 점검하는 품질 평가 시스템이라고 할 수 있습니다.

머스탱은 콘텐츠 신선도, 문서 길이, 제목과 검색어의 일치도, 강조 텍스트 사용 여부, 홈 페이지의 신뢰도, 단어별 가중치 등 총 8가지 요소를 평가합니다. 실무자의 입장에서는 검색엔진에 노출되기 위해서는 최소한 이 8가지 기준에서 좋은 점수를 받도록 콘텐츠를 설계해야 합니다. 아무리 클릭률이 높다 하더라도, 머스탱에서의 기본 점수를 통과하지 못하면 상위 노출은 요원하다는 사실을 기억해야 합니다.

실시간 이용자 피드백으로 순위를 조정하는 트위들러(Twiddlers) 평가 시스템

머스탱이 콘텐츠의 ‘정적 품질’ 평가라면 트위들러는 사용자 행동의 실시간 신호를 파악하여 페이지의 순위를 ‘조정’하는 역할을 합니다. 이 시스템은 실제로 사용자가 검색을 수행해서 결과 페이지를 로딩하기 직전에 작동합니다. 말하자면, 머스탱을 통해 정리된 후보자 콘텐츠 순위를 클릭률, 신선도, 검색 트렌드 등을 기반으로 재정렬하는 시스템이라고 할 수 있습니다.

트위들러는 네 가지 주요 알고리즘으을 포함합니다. 네브부스트( NavBoost )는 클릭 데이터를 기반으로하며, 리얼타임부스트( RealTimeBoost )는 실시간 트렌드를 반영하고, 웹이미지부스트( WebImageBoost )는 이미지 중심 콘텐츠를 평가하며, 퀄리티부스트 ( QualityBoost )는 사이트 전체의 품질 신호를 바탕으로 순위 결정에서의 우대 포인트를 조정 합니다. 이 네 가지 순위 보정 시스템은 SEO 운영 전략과 밀접한 관련이 있다고 할 수 있습니다.

1/4. 네비부스트 (NavBoost) 클릭 데이터의 힘

네비부스트는 사용자의 실제 클릭 데이터를 기반으로 페이지의 순위를 재조정하는 시스템입니다. 어떤 결과를 클릭했는지, 클릭 후 해당 페이지에서 얼마나 오래 머물렀는지, 재검색을 했는지, 마지막으로 만족한 클릭이었는지 등을 종합적으로 분석합니다. 이 데이터는 단순한 사용자 행동 데이터가 아닌, 구글이 ‘콘텐츠 만족도’로 해석하여 랭킹에 반영하는 요소입니다.

이를 위해서 검색 결과 페이지에서 해당 콘텐츠로의 클릭을 유도하는 제목이나 썸네일만으로는 부족합니다. 사용자가 클릭으로 들어간 페이지에서 얼마나 오래 머물고, 다른 검색을 하지 않았는지 등이 네비부스트의 평가 점수에 영향을 미칩니다. 따라서 브랜드 매니저는 자사 콘텐츠를 읽는 방문자들의 체류 시간을 늘리기 위해 실제로 도움이 되는 정보를 제공하는 콘텐츠를 만들어야 한다는 사실을 명심해야 합니다.

2/4. 리얼타임부스트( RealTimeBoost) 트렌드와 시의성

리얼타임부스트는 실시간 검색 트렌드에 반응하여 콘텐츠의 노출 순위를 일시적으로 상향 조정하는 알고리즘입니다. 즉, 뉴스 속보, 사회 이슈, 급상승 검색어 등을 확인하려는 검색이 늘어나는 등의 이벤트가 발생할 경우 즉각적으로 반응하여 사용자가 보고 싶어하는 관심 콘텐츠를 전면에 배치합니다. 사건 사고 등이 일어난 직후 관련자나 관련 단체명으로 검색하면 해당 사건 사고를 다루는 뉴스 포스트나 소셜 미디어 포스트가 검색 결과 상단에 나타나게하는 알고리즘인 것입니다.

이 알고리즘은 콘텐츠의 품질보다는 ‘지금 이 순간 얼마나 해당 이슈에 대해 검색 수요가 집중되고 있는가’를 중심으로 활용 필요성이 판단된니다. 따라서 시즌성 키워드나 특정 시기 이벤트, 트렌드를 반영한 콘텐츠는 리얼타임부스트 알고리즘의 수혜를 받을 수 있습니다. 특히 쇼핑몰이나 캠페인을 운영하는 브랜드에게는 전략적으로 큰 기회가 될 수 있습니다.

3/4. 웹이미지부스트 ( WebImageBoost ) 이미지 기반 콘텐츠의 중요성

웹이미지부스트는 콘텐츠 내 이미지의 유무와 품질을 평가하여 랭킹에 반영하는 알고리즘입니다. 여기서 말하는 이미지는 단순 장식용이 아닌, 정보 전달에 실질적으로 기여하는 시각 자료를 말합니다. 예를 들어, 복잡한 개념을 설명하는 인포그래픽, 제품 사용법을 보여주는 이미지, 비교 차트 등이 여기에 해당합니다.

이 알고리즘은 이미지 파일명, alt 텍스트, 캡션과의 연관성, 이미지 주변 텍스트와의 의미적 일치성 등을 함께 평가합니다. 결과적으로 이미지가 단순 ‘보기 좋음’이 아니라 ‘정보 전달 수단’으로 기능할수록 더 높은 점수를 받을 수 있습니다.

4/4. 퀄리티부스트 ( QualityBoost ) 구글이 신뢰하는 브랜드의 이점

퀄리티부스트는 구글 내부 평가 기준에 따라 사이트나 페이지가 ‘신뢰할 수 있는지’를 판단해 점수를 부여합니다. 클릭 데이터에 의존하지 않으며, 구글 자체의 DB 기반 품질 지표에 따라 우대를 결정합니다. 신뢰도 높은 도메인, 전문적인 콘텐츠 구조, 반복적인 사용자 만족 신호 등이 평가 요소입니다.

이 알고리즘은 단기간의 SEO 시책으로 대응할 수 있는 것이 아닙니다. 오히려 장기적인 콘텐츠 품질 관리, 정기적인 업데이트, 일관된 브랜드 포지셔닝을 통해 축적되는 신호에 더 큰 영향을 받기에 브랜드 매니저는 콘텐츠의 순간적인 성과보다, 사이트 전체의 신뢰도를 높이는 전략이 필요합니다.

만족하지 못한 사용자 경험의 대가로 발생하는 감점 알고리즘

구글은 자신들의 검색 결과 페이지에 콘텐츠가 일정 시점에 단순히 상위에 노출되었다고 해서 지속적인 긍정 평가를 해주지는 않습니다. 한번의 평가에 멈추지 않고, 지속적인 모니터링을 통해 사용자가 만족하지 못한 신호가 나타날 경우 감점을 부과합니다. 예를 들어, 클릭 후 빠르게 ‘돌아가기’를 눌렀거나, 같은 키워드로 재검색을 했거나, 페이지에서 머무른 시간이 너무 짧았다면, 이는 모두 해당 콘텐츠의 감점 원인이 됩니다.

이러게 감점과 관련된 신호는 콘텐츠 자체에 대한 품질 평가뿐만이 아니라 UX 전반에도 영향을 받습니다. 제목과 본문이 내용적으로 잘 연결되는지, 독자가 원하는 정보를 쉽게 찾을 수 있는지, 콘텐츠 독자가 기대하는 것과 실제 콘텐츠를 통한 경험 사이의 간극은 없는지가 매우 중요합니다.

페이지퀄리티 (Page Quality) 평가: LLM 기반 정성 분석

최근 구글은 대형 언어 모델(LLM)을 활용해 페이지의 정성적 품질을 평가하는 PQ 시스템을 도입했습니다. 이는 단순히 단어 수나 키워드 밀도를 보는 것이 아니라, 콘텐츠에 투입된 노력, 창의성, 정보의 깊이, 독자적 기여도 등을 평가하는 방식입니다.

예를 들어, 직접 작성한 설명, 고유한 분석, 독자적인 시각을 담은 콘텐츠는 높은 PQ 점수를 받을 수 있습니다. 반면, AI가 자동 생성했거나, 단순 요약 콘텐츠는 낮은 점수를 받게 됩니다. 실제 임상적 정보와 도구(계산기, 체크리스트 등)를 포함한 콘텐츠는 PQ 평가에서 유리한 요소로 작용합니다.

오리지널 콘텐츠 스코어 (Original Content Score): 독창성의 진짜 가치

오리지널 콘텐츠 스코어는 콘텐츠가 브랜드 고유의 정보와 시각을 담고 있는지, 즉 다른 브랜드가 그저 복제해서 가져가도 사용할 수 없는 해당 브랜드 고유의 콘텐츠인지를 평가하는 지표입니다. 콘텐츠의 길이가 짧더라도 해당 영역의 새로운 글로서의 오리지널함이 큰 내용(해당 분야에서 실질적인 기여가 있는가라는 측면에서)은 높은 점수를 받을 수 있다는 것이 핵심입니다.

이 기준은 동일한 제품이라면 거의 비슷한 콘텐츠가 대량으로 양산될 가능성이 높은 이커머스의 제품 상세 페이지들을 비교 평가하거나, 특정 지역의 전문 서비스(예: 법률 서비스, 병원 등)의 소개 페이지 등에서 중요하게 작용합니다. 어느 곳의 설명도 크게 차이가 없을 것 같은 비슷비슷한 정보, 심지어 복붙을 했을 것 같은 정보가 아니라, 오리지널리티를 높여줄 직접 작성된 사용 후기, 비교표, 사용 팁 등이 포함되어야 높은 점수를 받을 수 있습니다.

키워드 스터핑 스코어 ( Keyword Stuffing Score ): 과도한 키워드 반복 사용의 위험성

구글은 키워드를 과도하게 반복하거나 문맥에 어울리지 않게 삽입한 경우 패널티를 부여합니다. ‘서울 피부과, 강남 피부과, 역삼 피부과 추천’과 같이 키워드를 나열하거나, 각 단락마다 같은 키워드를 반복하는 방식은 키워드 스터핑으로 간주되고 품질이 낮은 콘텐츠의 중요한 시그널로 판단합니다.

현대의 SEO는 키워드 삽입이 아니라 의미 중심 구성, 자연스러운 흐름, 동의어와 유의어 활용이 핵심입니다. 구글은 문맥을 이해하는 방향으로 진화했기 때문에, 사용자의 입장에서 도움이 되는 콘텐츠를 작성하는 것이 SEO에 있어 더 큰 효과를 발휘합니다.

토피컬 오쏘러티(Topical Authority) “당신의 웹사이트가 이 주제를 다룰 자격이 있는가?”에 대한 평가 시스템

마케터로서 브랜드 매니저로서 제가 이번 구글 문서 유출에서 가장 주목하는 부분이 바로 토피컬 오쏘러티에 대한 내용입니다. 이미 오래 전부터 구글이 토피컬 오쏘러티를 평가하고 있을 것이라는 추측을 해왔었으나, 이번 유출로 구글이 사이트의 전문성을 판단하기 위해 siteFocus, siteRadius, siteEmbeddings, pageEmbeddings 등을 활용하고 있다는 것이 확인된 것을 알게 된 것입니다. 특히 주목할 점은 단일 URL의 콘텐츠 퀄리티보다, 웹 사이트 전체가 하나의 주제를 얼마나 깊이 있게, 일관되게 다뤄왔는지를 평가하고 있다는 점입니다.

예를 들어 ‘이혼 전문 변호사’를 주제로 사이트를 운영한다면, 이혼과 관련된 다양한 주제를 다룬 콘텐츠(양육권, 재산분할, 조정 절차 등)가 존재해야하고, 이들 콘텐츠 페이지들이 내부 링크를 통해 주제에 맞게 연결되어 있어야 합니다. 또한 주요 주제와 관계가 떨어지는 다른 주제의 콘텐츠(예: 부동산 매물, 교통사고 사례 등)가 다수 섞여 있을 경우, 사이트 전체의 주제 집중도가 낮아져 검색 순위에서 불리해집니다.는 과감히 제거하거나 그 양이 많거나 퀄리티가 높거나 필요해서 유지해야한다면 다른 영역을 다룬 콘텐츠들을 별도 서브 도메인으로 분리해야 합니다.

구글은 이를 평가하기 위해 siteFocusScore, siteRadius, siteEmbedding 등의 정량 지표를 사용하고 있는 것을 확인할 수 있었습니다. 이는 구글이 토픽 오쏘리티를 판단하기 위해 단순 키워드 매칭이 아니라, 사이트와 페이지를 임베딩한 벡터 정보를 기준으로 특정 주제에 대해 벡터 공간에서 ‘의미상 일관된(가까운) 정보 네트워크’를 구축되고 있는지를 확인한다는 것을 보여줍니다.

토피컬 오쏘러티란 구글이 사이트를 평가할 때, “이 사이트가 이 주제에 대해 얼마나 전문적으로, 일관되게 다뤄왔는가?”를 판단하는 기준이라고 할 수 있는데, 이를 벡터 공간으로 설명한다면 하나의 사이트의 웹 페이지들이 특정 주제가 모여있는 벡터 공간에 얼마나 조밀하게 모여 있는가로 말할 수 있습니다. 단순히 한두 개의 페이지가 잘 작성되어 있는지 여부를 보는 것이 아니라, 해당 페이지를 포함한 사이트 전체의 페이지들이 해당 주제를 중심으로 가까운 벡터 공간 안에 모여있고, 여러 콘텐츠가 그 세부 주제에 맞춰 독자의 다양한 관련 관심사를 빠짐없이 심도있게 다루고 있는가를 본다는 말입니다.

구글은 이를 평가하기 위해 다음과 같은 내부 지표들을 사용합니다:

1) siteFocus Score

사이트가 얼마나 특정 주제에 집중되어 있는지를 수치화한 점수입니다. 이 점수가 높을수록 “이 사이트는 특정 주제에 일관되게 집중하고 있다”는 신호를 구글에 보냅니다. 다양한 카테고리를 무분별하게 다룰 경우, 이 점수가 낮아지고 권위가 분산됩니다.

2) siteRadius

각 개별 페이지가 사이트 전체의 중심 주제와 얼마나 떨어져 있는지를 측정하는 지표입니다. 사이트 중심 주제에서 벗어난 콘텐츠가 많을수록 siteRadius가 커지며, 이는 감점 요소입니다. 예를 들어, ‘이혼 변호사’ 전문 사이트에서 ‘자동차 수리법’ 같은 글을 발행하면 해당 페이지는 물론이고 사이트 전체의 평가에 악영향을 줄 수 있습니다.

3) siteEmbeddings / pageEmbeddings

구글은 각 페이지와 사이트 전체를 의미 벡터로 추상화하여, 의미적으로 얼마나 일관되고 밀접한 관계가 있는지 평가합니다. 이는 키워드 매칭이 아닌 ‘주제의 의미상 일관성’을 AI가 이해한다는 뜻입니다. 예: ‘이혼’이라는 주제를 중심으로 한 콘텐츠들이 ‘양육권’, ‘재산분할’ 같은 내용과 함께 클러스터링되어 있는 경우 높은 일관성 점수.

우리는 구글이 왜 토피컬 오쏘러티를 중시하는지를 이해해야합니다. 검색 알고리즘은 처음부터 유입량을 목적으로 한 인기 키워드를 많이 넣은 콘텐츠가 아니라 객관적인 전문성과 신뢰성을 가진 출처로부터 깊이 있는 양질의 정보를 제공받고자 하는 사용자 요구에 부응하는 방향으로 진화해오고 있었습니다. 구글이 이미 오래전부터 E-A-T를 통해서 단순한 ‘글 잘 쓰는 사람’보다는 ‘그 주제에 대해 많은 연구와 발언을 지속적으로 해온 출처’를 우대해왔던 것에서도 이런 구글의 방향성은 명확하게 드러납니다.

브랜드 매니저의 입장에서 토피컬 오쏘러티를 구축하는 일은 단순한 SEO 시책을 넘어서는 브랜드 전략의 핵심 요소입니다. 특히 최근 검색 환경이 AI 기술이 검색에 적용되면서 점차 제로클릭 검색이 늘어남에 따라, 단순히 오가닉 트래픽 유입만을 기대하는 방식은 점점 그 효과가 떨어지고 있습니다.

이제는 검색 결과 자체에서 사용자의 궁금증이 해결되거나, 요약된 형태로 AI가 콘텐츠를 전달하는 경우가 많아졌습니다. 이런 상황에서 브랜드가 노출될 수 있는 유일한 방법은 단순한 키워드 최적화가 아니라, 구글과 사용자 모두에게 ‘이 브랜드는 이 주제에 대해 이야기할 자격이 있다’는 신뢰를 구축하는 것, 즉 토피컬 오쏘러티를 실질적으로 형성하는 것입니다.

이는 곧 브랜드의 정체성, 포지셔닝, 차별화의 문제입니다. 브랜드는 스스로 어떤 주제에 대한 전문성을 갖추고 있는지 명확히 정의하고, 그에 기반한 콘텐츠를 지속적으로 생산하며, 구조화된 방식으로 사용자와 검색엔진 모두에게 “우리는 이 주제의 전문가입니다”라고 일관되게 설득하고 인정받을 수 있어야 합니다.

브랜드 및 콘텐츠 전략 수립 시, 다음과 같은 실행 단계가 필요합니다:

  1. 핵심 주제 정의는 사이트 또는 디렉토리 단위에서 명확히 설정해야 합니다.
    예를 들어 ‘이혼 전문 법률’, ‘소아 건강과 육아’, ‘남성 라이프스타일’ 등과 같이, 사이트가 지속해서 다룰 핵심 전문 영역을 선명하게 규정해야 합니다. 이는 브랜드 포지셔닝과 SEO 전략의 기초가 됩니다.
  2. 콘텐츠 클러스터 구축을 통해 구조적인 권위 체계를 만듭니다.
    정해진 핵심 주제를 중심으로, 그 하위 토픽을 계획적으로 분화하고 콘텐츠로 확장합니다.
    이때 허브 앤 스포크(hub-and-spoke) 또는 콘텐츠 실로(content silo) 모델을 활용해, 중심 주제를 둘러싼 관련 콘텐츠를 체계적으로 연결해야 합니다. 이를 통해 구글은 해당 브랜드가 단편적 정보가 아닌 심화된 지식 구조를 보유하고 있다고 판단하게 됩니다.
  3. 내부 링크 최적화로 콘텐츠 간 관계성과 깊이를 강화해야 합니다.
    각 콘텐츠는 단독으로 존재하는 것이 아니라, 유관 콘텐츠와 유기적으로 연결되어야 합니다. 이를 통해 사이트 전체에 주제 일관성, 탐색 흐름, 토픽 심화 구조가 형성되고, 이는 곧 토피컬 오쏘러티를 강화하는 핵심 요소가 됩니다.
  4. 주제 일관성을 해치는 콘텐츠는 과감히 정리해야 합니다.
    핵심 주제와 관련이 없는 콘텐츠, 또는 중복·의미가 약한 콘텐츠는 정리하거나 별도의 하위 디렉토리 또는 서브도메인으로 분리하여, 메인 도메인의 주제 일관성과 집중도를 유지해야 합니다. 구글은 사이트 내 잡다한 주제가 많을수록 siteFocus 스코어를 낮게 평가하고, 이는 전체 SEO 성과에 부정적 영향을 미칩니다.

콘텐츠 신선도와 업데이트 히스토리

이번 문서 유출을 통해 우리는 구글은 콘텐츠의 생성일과 최종 수정일, sitemap 및 스키마 내의 날짜 정보가 일치하는지 여부를 확인하여 콘텐츠의 신선도를 평가한다는 사실을 알게 되었습니다. 또한, 웹페이지의 과거 버전 최대 20개까지 보관하며, 과거 이력이 불량했다면 단순히 내용을 바꾸는 것으로는 랭킹 회복이 어렵다는 점도 확인 할 수 있었습니다.

정기적이고 의미 있는 콘텐츠 업데이트는 단기 SEO뿐만 아니라, 사이트 전체의 신뢰도 유지에도 중요합니다. 이는 특히 정보성 콘텐츠나 뉴스 기반 콘텐츠를 운영하는 브랜드에 있어 매우 중요한 관리 요소입니다.

Host NSR(Normalized Site Rank) 및 차드베리언스(chardVariance): 사이트 전체 품질 중요성 평가

Host NSR은 구글이 사이트를 여러 조각으로 나누어 품질을 평가하고, 이를 평균화하여 사이트 신뢰도를 계산하는 시스템입니다. 이 시스템은 사이트 일부만 품질이 낮아도 전체 신뢰도가 하락할 수 있음을 의미합니다. 반면, 좋은 페이지가 많을수록 평균 점수를 끌어올릴 수 있습니다. 여기서 Host NSR은 “호스트 수준의 정규화된 사이트 랭크”를 의미합니다. “Host”는 www.example.com, blog.example.com, 또는 m.example.com처럼 서브도메인 또는 루트 도메인 단위의 URL 집합을 말합니다. “Normalized”란 페이지마다 다른 점수를 가졌더라도, 구글이 전체적으로 일정 기준에 맞게 점수를 표준화시켜 평가한다는 뜻입니다.

이는 결국, 한 사이트 또는 호스트(도메인)의 전반적인 품질과 신뢰도를 종합한 점수라고 보면 됩니다.

또한, 챠드베리언스는 페이지마다 콘텐츠 스타일이나 구조가 들쭉날쭉할 경우의 감점 요인에 대한 시스템이라고 보면 됩니다. 브랜드의 톤앤매너, 정보 구성 방식, 문서 포맷 등이 일관되게 유지되어야 사이트의 품질 점수를 방어할 수 있습니다.

콘텐츠 사일로(Content Silos) 및 내부 링크 전략 평가

특정 주제에 대해 깊이 있게 콘텐츠를 구축하려면 콘텐츠 사일로 전략이 효과적입니다. 하나의 ‘허브 페이지’를 중심으로 관련 콘텐츠들이 잘 연결되어 있는 구조는 구글에게 명확한 주제성을 전달합니다. 이 구조는 사용자 경험(UX) 향상에도 도움이 됩니다.

브랜드는 단일 사이트 내 여러 서비스를 운영하더라도, 각 주제를 중심으로 콘텐츠를 클러스터링하고 내부 링크를 최적화해야 합니다. 이를 통해 검색엔진과 사용자 모두에게 ‘이 브랜드는 이 분야에서 전문성 있는 출처’라는 인식을 심어줄 수 있습니다.

로컬 SEO: 지역성과 검색 노출의 상관관계 평가

법률, 의료, 부동산 등 지역 기반 서비스를 제공하는 브랜드에게는 Local SEO 전략이 매우 중요합니다. 구글은 사용자 위치, 지리 정보, Google 비즈니스 프로필, 지역 리뷰 등을 함께 고려하여 로컬 검색 랭킹을 결정합니다. SiteFocusScore와 SiteRadius는 지역성과도 연결되어 있으며, 지역성 있는 콘텐츠, 지역 키워드, 지역 백링크 확보 등이 로컬 SEO의 핵심 전략입니다.

외부 링크와 도메인 신뢰도

구글은 외부 링크의 수보다는 질을 더 중요하게 평가합니다. 링크가 본문 어디에 위치했는지, 어떤 앵커 텍스트로 연결됐는지, 링크된 도메인의 신뢰도(NSR 점수)가 높은지 등을 종합적으로 분석합니다. 즉, 의미 있는 문맥에서 신뢰할 수 있는 도메인으로부터 자연스럽게 링크를 받는 것이 핵심입니다. 언론, 학계, 업계 기관과 같은 출처는 매우 높은 신뢰도 점수를 제공할 수 있습니다.

여전히 사용되는 검색어와 콘텐츠의 연결 고리를 계산하는 알고리즘, BM25

BM25는 검색엔진이 웹페이지를 평가할 때, 사용자가 입력한 검색어와 특정 페이지의 내용이 얼마나 잘 맞는지를 수치로 평가하는 방식 중 하나입니다. 다시 말해, 누군가가 ‘이혼 전문 변호사’를 검색했을 때, 수천 개의 관련 문서 중 어떤 페이지가 그 검색어와 가장 관련성이 높은지 판단하는 기준이 되는 알고리즘입니다. 이번 문서 유출에서 아래의 문서들이 확인되어 아직도 BM25가 사용된다는 것을 확인할 수 있었습니다.

  • bm25f, bm25_title_score, bm25_body_score, bm25_anchor_score
  • 이는 제목, 본문, 링크 텍스트 등 구성 요소별로 BM25 점수가 개별적으로 계산되고 있었음을 의미

BM25는 정보 검색 분야에서 수십 년간 사용되어 온 TF-IDF 방식을 발전시킨 형태입니다. TF는 특정 단어가 문서에 얼마나 자주 나오는지를 의미하고, IDF는 그 단어가 전체 문서 중 얼마나 드문지를 의미합니다. 흔히 나오는 단어보다, 자주 등장하지 않지만 문맥상 중요한 단어를 높게 평가한다는 논리입니다.

BM25는 여기에 추가로, 문서가 지나치게 길어서 단어가 많이 포함될 가능성을 보정하는 기능도 포함하고 있습니다. 이처럼 단어 빈도, 희귀성, 문서 길이를 모두 고려해 문서와 검색어 간의 관련 점수를 계산합니다.

예를 들어, 사용자가 “강남 이혼 전문 변호사”를 검색했을 때, 어떤 웹페이지가 이 단어들을 중요한 위치(제목, 본문 초반, 부제목 등)에 얼마나 적절하게 포함하고 있는지, 그 사용 빈도는 과하지 않은지, 문서 전체 길이와 균형 있게 들어 있는지를 판단해 BM25 점수를 부여합니다. 이 점수가 높을수록 해당 문서는 해당 검색어와 ‘더 관련성이 높은 콘텐츠’로 평가받아 검색 상단에 노출될 가능성이 커집니다.

이로써 우리는, 구글이 검색 순위를 매길 때 단지 LLM이나 AI 신호만을 사용하는 것이 아니라, 기본적으로 ‘검색어와 문서가 얼마나 잘 맞는가’를 정량적으로 계산하는 고전적인 기법도 여전히 활용하고 있다는 사실을 명확히 알 수 있게 되었습니다

마무리

이번 구글 알고리즘 유출은 우리가 기존에 알고 있었던 SEO 전략의 기준점을 다시 공고하게 세우는 계기가 되었습니다. 그동안 ‘공식적으로 확인되지 않았던’ 수많은 랭킹시그널들이 실제로 존재하고 있었으며, 특히 구글이 개별 콘텐츠 뿐 아니라 사이트 전체의 일관성, 전문성, 신뢰도, 맥락 구조를 얼마나 중시하고 있는지를 확인할 수 있었습니다.

이로써 검색엔진 최적화는 더 이상 특정 키워드를 넣고, 메타태그를 정리하고, 몇 가지 트릭을 통해 상위를 노리는 기술적 작업이 아니라는 것도 확인이 된 것입니다. 브랜드의 정체성과 포지셔닝, 정보 구조, 사용자 경험, 콘텐츠의 깊이와 독창성까지 통합적으로 설계해야하는 종합적인 전략이라는 사실도 드러났습니다.

브랜드 매니저, 마케터, 콘텐츠 전략가는 이제 구글이라는 플랫폼과의 관계를 단기 유입 확보의 수단으로 보아서는 안 됩니다. 구글은 점점 더 콘텐츠의 진정성, 사용자 만족도, 사이트의 구조적 신뢰도를 판단하고 있으며, 이러한 기준은 단지 랭킹을 위한 것이 아니라 브랜드 자체의 신뢰 자산과 직결됩니다. 앞으로의 SEO 전략은 검색 알고리즘을 공략하는 것이 아니라, 사용자의 기대를 충족하고 브랜드로서의 진정한 전문성과 일관성을 갖추는 것에서 출발해야 합니다.