구글로부터 토픽 오쏘로티 인정받기 : siteFocus와 siteRadius 이해

구글로부터 토픽 오쏘로티 인정받기 : siteFocus와 siteRadius 이해 구글로부터 토픽 오쏘로티 인정받기 : siteFocus와 siteRadius 이해

2024년 3월 SEO 전문가인 어판아지미(Erfan Azimi)와 댄페트로빅(Dan Petrovic)이 우연히 노출된 구글의 내부 저장소를 발견하면서 공개된 구글의 내부 API 문서를 통해 검색 엔진이 웹사이트를 평가하는 방식이 과거와는 완전히 달라졌다는 사실이 밝혀졌습니다. 이들 문서에는 무려 14,014개의 구글 내부 API 참조가 포함되어 있었으며, 이는 구글 검색 엔진의 실제 작동 방식에 대한 전례 없는 통찰을 제공했습니다.

어판아지미는 이 정보를 SEO 업계의 저명한 인물인 Moz.com 의 창립자인 랜드피쉬킨(Rand Fishkin)과 공유했습니다. 한편 댄페트로빅은 어판아지마와는 별개로 같은 발견을 한 후에 구글에 직접 이를 신고했습니다. 결국 구글은 이 문서 유출 사실을 공식적으로 인정했지만, 흥미롭게도 해당 데이터를 완전히 삭제하지 않고 여전히 온라인에서 접근 가능한 상태로 두었습니다. 이는 구글 역사상 가장 큰 규모의 내부 정보 유출 사건으로 기록되고 있으며, SEO 업계에 혁명적인 변화를 가져왔습니다.

이 문서들을 통해 SEO 업계에 드러난 가장 중요한 사실은 이젠 단순히 키워드를 많이 넣거나 백링크 수량에만 의존했던 시대가 완전히 끝났다는 것이며, 이미 구글은 인공지능과 자연어 처리 기술을 활용해 웹사이트가 특정 주제에 얼마나 집중하고 있는지, 그리고 얼마나 깊이 있는 정보를 제공하는지를 수학적으로 분석하고 있다는 사실이었습니다.

이렇게 공개된 내용 중에 위에서 언급한 변화의 핵심에는 사이트포커스(SiteFocus), 사이트레디우스(SiteRadius), 토피컬 오쏘리티(Topical Authority), 페이지 임베딩(Page Embedding), 사이트 임베딩(Site Embedding) 같은 개념들이 있습니다. 이것들이 복잡해 보일 수 있지만, 본질적으로는 “당신의 웹사이트가 하나의 주제에 대해 얼마나 전문적이고 일관성 있게 정보를 제공하는가”를 측정하는 지표들입니다. 이것들을 주목하는 이유는 벡터 검색 기술이 적용된 최신 검색의 SEO에서 이 요소들이 좋은 콘텐츠로 인정을 받는데 아주 중요한 부분이 되기 때문입니다. 우선은 이들 요소들이 무엇인지를 설명하고 실제로 웹사이트를 구축함에 있어 이들 요소들을 왜 고려하고, 어떻게 활용해야하는 지를 이야기하려합니다.

사이트와 웹페이지 임베딩과 토픽 클러스터: 의미 구조의 이해

구글은 사이트 임베딩(Site Embedding)과 페이지 임베딩(Page Embedding)을 통해서 웹사이트 전체와 각 페이지의 의미를 벡터 공간 위에 맵핑합니다. 이는 마치 각 콘텐츠에 GPS 좌표를 부여하는 것과 같이 웹사이트 안에 있는 콘텐츠를 벡터를 통해 수치화한 결과입니다. 구글은 이 좌표들 사이의 거리(혹은 벡터 사이의 각도)를 계산해서 검색자의 쿼리와 구글이 제공하는 결과 콘텐츠 사이에, 그리고 각 콘텐트 들이 얼마나 관련성(유사도)이 높은지 등을 판단합니다.

특정 제품이나 서비스에 특화된 콘텐츠를 기획한다는 것은 해당 제품과 서비스와 연관된 토픽별로 콘텐츠 클러스터를 설계하는 것이라고 말할 수 있고, 이런 실제 콘텐츠 구성 전략을 앞서 말한 이런 임베딩 개념으로 치환함으로서 우리는 이번에 발견한 구글의 리크 정보를 앞으로의 SEO 전략에 이용할 수 있을 것입니다. 이것이 랭킹팩터의 리크가 아니기에 당장에 순위에 영향을 주는 것은 아닐지라도 구글이나 AI들이 왜 해당 콘텐츠를 더 많이 노출 시키고 있는지에 대해 설명이 가능해진다고 생각합니다.

이 관점에서 특정 주제에 특화된 콘텐츠 사이트(클러스터)들은 핵심 주제를 다룬 글(페이지)을 중심으로 여러 개의 관련 소주제를 다룬 글(페이지)을 체계적으로 배치하고, 이들을 적절하게 내부 링크로 연결하는 구조를 보여줍니다. 구체적인 예시로 스마트 농업 드론이라는 새로운 카테고리 제품을 런칭한다면, 중심에는 “스마트 농업 드론의 모든 것”이라는 핵심 주제 페이지가 있어야 하고 이 주변으로 “드론 농업의 기본 원리”, “작물별 드론 활용법”, “농업 드론 도입 비용 분석”, “기존 농업 방식 대비 효율성”, “농업 드론 규제와 법률”, “실제 농가 적용 사례”, “드론 유지보수 가이드”, “미래 농업 기술 전망” 등의 소주제를 다룬 글(페이지)가 위치하면서 하나의 클러스터를 형성하여야 한다는 말입니다.

사이트포커스(SiteFocus): 주제 집중도의 힘

우리는 어떤 사이트에 전문성이 있는 지를 중시합니다. 이를 평가하기 위한 여러가지 접근이 있었겠지만, 이번 리크를 통해서 확인된 바로는 구글이 사이트포커스를 통해 웹사이트가 특정 주제에 얼마나 집중되어 있는지를 측정하고 있다는 것이었습니다. 예를 들어, 스마트 홈 IoT 디바이스라는 새로운 카테고리의 제품을 출시한다고 가정할 때 사이트포커스 지표가 높은 웹사이트라면 이 웹사이트의 모든 콘텐츠가 스마트 홈, IoT 기술, 홈 자동화, 편의성 향상 등의 연관성 높은 주제들로만 구성되어 있을 것이라고 판단할 수 있습니다.

반대로 사이트포커스 지표가 낮은 경우는 스마트 홈 디바이스 소개 페이지 옆에 요리 레시피나 여행 정보, 일반적인 기업 소개 등 전혀 관련 없는 내용들이 섞여 있는 상황일 것이라고 추축할 수 있습니다. 구글 검색에 적용된 AI 기술은 이런 산만한 구성을 사이트포커스 지표를 통해 감지하고 해당 웹사이트를 스마트 홈 분야의 전문성이 있지 않다고 판단합니다.

사이트포커스 지표를 높이기 위해서는 스마트 홈 IoT 디바이스 제품과 관련된 다양한 고객 여정을 고려해야 합니다. 고객 여정을 고려한다는 말은 소비자가 “왜 스마트 홈이 필요한가”부터 시작해서 “어떤 제품을 선택해야 하는가”, “설치는 어떻게 하는가”, “문제가 생겼을 때는 어떻게 해결하는가”까지 등의 구매 의사 결정에 이르는 모든 단계에서 답이 필요한 개별적 질문에 적절한 답을 일관성 있게 제공해야 합니다.

사이트레디우스(SiteRadius): 주제 일탈도 관리

사이트레디우스는 개별 페이지들이 웹사이트의 핵심 주제에서 얼마나 벗어나 있는지를 측정합니다. 이는 구글이 각 페이지의 내용을 수치화한 임베딩 값들 사이의 거리(혹은 각도)를 계산해서 판단하는데, 사이트레디우스가 클수록 웹사이트가 산만하다는 의미이며, 이는 검색 순위(노출)에 부정적인 영향을 미칩니다.

실제 예를 들어보면 친환경 농업 기술이라는 새로운 카테고리의 스타트업이 있다고 가정해봅시다. 처음에는 유기농 재배 기술, 토양 관리, 친환경 농약 등에 대한 콘텐츠로 시작했지만, 시간이 지나면서 일반적인 환경 보호, 기후 변화, 심지어 회사 CEO의 개인적인 철학이나 취미까지 다루기 시작한다면 사이트레디우스가 급격히 증가하게 되고, 기존에 잦은 인용이 되던 콘텐츠들이 콘텐츠가 늘어나면서 오히려 노출에 도움이 안되는 일이 벌어지게 될 수 있습니다.

이런 상황이 일어나는 것을 방지하려면 전문성을 갖게하려는 웹사이트의 모든 콘텐츠가 핵심 제품 혹은 서비스와 그것이 해결하는 문제, 그리고 타겟 고객의 관심사 안에서 움직여야 합니다. 친환경 농업 기술이라면 토양 건강, 작물 수확량 증대, 비용 절감, 환경 영향 최소화 등의 주제로 범위를 한정하고, 이 안에서만 콘텐츠를 확장해야 합니다.

결국은, 토피컬 오쏘리티(Topical Authority) 구축!

토피컬 오쏘리티는 특정 주제 영역에서 웹사이트가 갖는 전문성과 신뢰도를 의미합니다. 이는 단순히 많은 글을 쓰는 것으로 만들어지는 것이 아니라, 해당 주제의 다양한 측면(관련된 의도를 포괄적으로 다룬다는 의미에서)을 깊이 있게 다루면서 동시에 콘텐츠들 사이의 연결성을 강화함으로써 구축됩니다.

SEO에서만이 아니라, 이러한 점은 GEO 관점에서도 중요합니다. AI는 정확하고 신뢰할 수 있는 정보를 찾을 때 토피컬 오쏘리티가 높은 웹사이트의 정보를 우선적으로 참조하기 때문입니다. 따라서 새로운 카테고리 제품을 소개할 때는 단순한 제품 설명을 넘어서 해당 분야의 포괄적이고 깊이 있는 정보를 제공해야 합니다. 중요한 점은 이 모든 콘텐츠가 서로 긴밀하게 연결되어야 한다는 것입니다. 각 페이지에서 관련된 다른 페이지들로 자연스럽게 이어지는 내부 링크 구조를 만들어야 하고, 이때 앵커 텍스트도 관련성이 높고 구체적이어야 합니다. 이런 방식으로 장기간에 걸쳐 누적적으로 구축된 토피컬 오쏘리티는 해당 웹사이트를 그 분야의 최고 전문가 사이트로 인식하게 만듭니다.

실전 적용을 위한 구체적 가이드라인

실제로 이런 우리가 관리하는 브랜드를 위한 웹사이트 콘텐츠 전략을 실행할 때는 아주 체계적인 접근이 필요합니다. 먼저 핵심 제품이나 서비스를 중심으로 한 키워드 맵(혹은 엔티티(개체) 맵)을 작성하고, 이를 기반으로 콘텐츠 허브의 구조를 설계해야 합니다. 각 콘텐츠는 독립적으로도 가치가 있어야 하지만, 동시에 전체 토픽 클러스터의 일부로서도 역할을 해야 합니다.

콘텐츠 제작 시에는 구글의 NLP 모델이 인식할 수 있는 관련 엔터티들을 적절히 포함시키고 이들 엔티티들간의 관계를 콘텐츠 안에 자연스럽게 설명하고 스키마에도 포함시켜야 합니다. 이 때 콘텐츠 안에서 엔티티에 해당하는 키워드를 단순 반복하는 것이 아니라, 주제와 관련된 소비자들의 의도를 고려한 다양한 연관 개념, 관련 용어, 사례들을 자연스럽게 콘텐츠 안에 녹여내야 합니다. 또한 각 페이지마다 명확한 포커스 엔터티를 정하고, 이를 제목, 헤딩, 본문, 이미지 등에서 일관성 있게 다뤄야 합니다.

웹사이트의 각 페이지들 간에 만들어지는 내부 링크 구조도 전략적으로 설계해야 합니다. 관련성이 높은 페이지들끼리는 서로 링크로 연결하되, 앵커 텍스트는 구체적이고 설명적이어야 합니다. “여기를 클릭하세요”같은 본문의 토픽과 관련없는 앵커텍스트 보다는 “AI 기반 개인 건강 데이터 분석 방법”과 같이 주제와 연관된 명확한 앵커 텍스트를 사용해야 합니다.

마지막으로, 이 모든 노력은 실제 독자나 사용자에게 가치를 제공하는 방향으로 설계되어야 한다는 점을 잊어서는 안 됩니다. 구글이나 AI의 알고리즘이 아무리 발전해도 결국은 사용자 만족도가 최종 목표입니다. 웹사이트 내에 높은 토피컬 오쏘리티를 구축하되, 그것이 결과적으로 사용자의 실제 니즈를 충족하고 문제를 해결하는 방향으로 이뤄져야 합니다. 이렇게 할 때 비로소 우리의 브랜드는 소비자들이 당신을 필요로하는 순간에 적절한 가시성을 확보하게 되고, 우리의 제품도 새로운 환경에서 성공적으로 성장의 기회를 잡을 수 있게 될 것입니다.