구글 허밍버드, 랭크 브레인, 버트 업데이트 제대로 이해하기

저품질 콘텐츠와 백링크 등을 통한 스패밍 방지를 위한 구글의 판다 알고리즘 업데이트나 펭귄 알고리즘 업데이트와 달리 허밍버드, 랭크 브레인 그리고 버트 알고리즘 업데이트는 모두 구글이 어떤 콘텐츠들을 좋은 콘텐츠로 보고 있는가와 관여가 깊기 때문에 SEO를 담당하는 마케터들이 반드시 관심을 가져야하는 알고리즘이라고 생각한다. 

허밍버드, 링크 브레인, 그리고 버트를 하나씩 설명해가겠지만 머리속에 꼭 기억해야하는 것은 이들 알고리즘이 지향하는 바는 구글이 검색자의 의도에 부합하는 양질의 콘텐츠를 선별하여 이를 검색자에게 즉각적으로 제공하기위해 개발된 것이라는 점이다. 따라서 마케터들은 이 알고리즘을 구성하는 로직이나 디테일에 집중하기 보다는 이 알고리즘이 지향하는 방향에 맞춰 얼마나 효율적으로 좋은 콘텐츠 제작할 것인가 실행 방법에 집중해야한다는 점이다.

구글 허밍버드(Google Hummingbird)란 무엇인가?

처음 소개된 것이 2013년 8월 경으로 알려져있는 허밍버드는 랭킹과 관련한 구글의 코어 알고리즘의 업데이트로서 검색자가 사용한 쿼리 의도를 더욱 정교하게 이해하고 이 의도에 관련성이 더 높은 콘텐츠를 매칭 시키기 위해 만들어졌다. 허밍버드가 출현하게 된 배경에는 2013년의 상황에 대한 이해가 필요한데, 이 시점은 2007년 아이폰의 출현으로 시작된 스마트폰 시대가 만 7년째가 되던 해로서 모바일 검색이 데스크탑 검색을 추월한다는 이야기들이 많이 나왔던 때이다. 

구글의 입장에서는 모바일 기기를 통해 검색자들이 이동하면서 입력하는 자연어 검색(보이스 검색), 이전에는 없었던 검색 쿼리 유형 특히 대화형 검색 쿼리에 대해 보다 잘 대응을 해야하는 실질적인 필요가 생겼다. 구글 허밍버드는 바로 이런 상황에서 출현한 것이다. 

이렇게 출현한 허밍버드 이전의 구글 검색은 사전을 찾아보는 듯한 느낌을 주는 검색이었다면 허밍버드 이후의 구글은 자연스럽게 사람과 대화를 하는 것 같은 느낌을 주는 검색이 되었다. 예를 들어  “가까운 편의점” 이라고 검색을 했을 때 가까운 편의점이라는 사전적인 의미로만 검색결과를 보여주는 것이 아니라 아래의 실제 검색 결과에서 처럼 “나를 중심으로 가까운 편의점을 찾아줘”라는 말로 검색 의도를 이해하고 이에 대한 답을 시도하는 것이 허밍버드라고 할 수 있다. 

허밍버드 업데이트 이후 구글의 검색어 구성은 단순한 단어들의 나열이 아니라, 의미를 가진 문장을 구성하는 일부로 이해되게 된 것이다. 그래서 이제는 검색 결과 상위라고 해서 타이틀에 검색 쿼리에 들어간 단어가 꼭 들어가는 것이 아니다. 오히려 쿼리 속의 단어가 전혀 들어가 있지 않아도 검색 의도에 부합하면 상위에 오게 되었다. 

구글 랭크브레인 (Google Rankbrain)이란 무엇인가?

랭크 브레인은 기계학습을 사용하여 검색 엔진 쿼리와 가장 관련성이 높은 결과를 결정하는 구글의 핵심 알고리즘 구성 요소라고 할 수 있다. 랭크브레인은 프리랭크브렌인과 포스트 랭크브레인으로 구분할 수 있는데, 프리랭크브레인은 구글이 사전적으로 가지고 있는 검색 쿼리별로 검색 의도를 구분하는 로직에 의해 추정한 검색 의도를 기반으로 표시할 검색 결과를 결정하는 알고리즘이라고 할 수 있다. 포스트랭크브레인은 검색 결과 페이지에 게재된 검색 결과에 대해서 검색자들이 보인 다양한 반응을 바탕으로 검색자의 진정한 의도를 결정하는 해석모델을 통해 검색 결과를 조정해나가는 알고리즘이라고 할 수 있다.

랭크브레인이라는 것은 결국 검색자가 진정 원하는 것이 무엇인가를 검색자의 피드백을 통해서 특정해나가면 구글의 검색 결과를 검색자들의 의도에 더욱 관련성 높게 만들려는 구글의 노력이라고 할 수 있겠다.

랭크브레인은 기계 학습 측면에서 다른 업데이트와 차별이 되는데, 이것은 유용한 검색 결과를 생성하도록 랭크브레인 알고리즘을 교육하려고 다양한 소스에서 데이터를 확보하여 공급한다. 이렇게 공급한 데이터를 바탕으로 프리랭크브레인의 결과를 생성하고 이에 대해서 검색자들이 보내주는 피드백 시그널을 포스트랭크브레인에 던져 결과를 개선해나가는 것이다. 이런 특성 때문에 랭크 브레인에 의한 결과는 같은 국가 같은 지역이라도 같은 쿼리에 대해서 시간에 따라 다른 결과를 보여줄 수 있다. 

예를 들어보면, “MAC”이라는 키워드로 검색을 했을 때 이 검색의 진정한 의도는 무엇일까? 이것이 여성 화장품 브랜드 M.A.C을 찾는 것일까? 아니면 애플의 Mac 컴퓨터를 찾는 것일까? 혹은 MacOS를 찾는 것일까? 이 검색 쿼리에 답하려고 할 때 구글이 콘텐츠 품질이나 백링크와 관련한 정보만 활용한다면 특정 프로모션이나 PR활동으로 백링크를 많이 획득한 쪽의 콘텐츠가 검색 결과의 상위를 모두 차지하게 될 것이다. 바로 이런 경우에서 랭크브레인만이 가진 특징이 발휘되는데, 구글의 머신러닝 알고리즘 랭크브레인은 어느 것을 우선해야하는가를 검색자의 행동에서 인식한 패턴을 기반으로 보다 만족스러워할 검색 결과를 예측한다. 

다른 예를 들어보면 한국에서 “가장 최근의 올림픽 개최지”라고 검색했을 때(참고로 현재는 동경 올림픽 연기가 확정된 2020년 8월 어느날이다) 어떤 답을 보여주는가? 2016년 하계 올림픽 개최지였던 리오 데 자네이로를 보여주는 것이 맞을까? 아니면 2020년 하계 올림픽 개최 예정지였던 도쿄가 맞을까? 아니면 2018년 동계 올림픽 개최지였던 평창이 맞을까? 이에 대해서 구글의 현재 검색 결과는 검색 결과 최상단에 리오 데 자네이로의 지도와 지역 관련 사진을 보여주고 검색 결과 1위에 위키피디아의 올림픽 항목을 그리고 2위에 동계 올림픽에 대한 위키피디아 페이지를 보여주고 있다. 이런 검색 결과의 구성에 검색자들의 행동 시그널을 적극 활용하는 것이 바로 랭크브레인이다.

랭크 브렌인에 적응하기 위한 SEO 시책은?

랭크브레인은 검색자의 의도에 정확하게 답하는 콘텐츠를 매칭하는 것을 목표로 하기 때문에 검색자의 의도가 바뀌면 검색 결과도 바뀌게 된다. 하지만 모든 쿼리에 대해서 그러한 것은 아니다. 시간이나 환경에 따라서 변화가 있을 수 있는 검색 쿼리인가 아니면 역사 정보와 같이 이런 변화가 거의 없어서 검색자의 행동 피드백보다 콘텐츠의 깊이나 도메인의 테마성 그리고 백링크 등에 의한 권위가 더 중요한 콘텐츠를 찾는 검색 쿼리인가에 따라 다르기 때문이다. 아무튼 랭크 브레인이 중요한 쿼리에대한 SEO에서의 핵심은 검색자의 의도에 최대한 포괄적이고 심도있는 답을 제공하는 콘텐츠를 제작하는 것이라고 할 수 있다. 

구글 버트 (Google BERT)란 무엇인가?

버트는 가장 최근에 구글 알고리즘에 포함된 요소이면서 최근에 가장 주목 받는 업데이트이다. 이미 구글은 버트 업데이트 때문에 SEO 측면에서 뭔가 달라질 것은 없다고 이미 말하고 있지만 업계 안에서는 상당한 소란이 있을 정도로 관심을 불러 일으켰다. 

구글의 알고리즘에 포함되기 이전에 버트는 엔티티 인식, 감정 분석, 질문과 답변 등 자연어 처리(NLP) 분야의 다양한 개별  솔루션들을 모두 합친 지금 단계에서는 가장 완벽하다고 평가 받고, 그 성능 때문에 주목 받고 있는 사전 훈련된 비지도 자연어 처리 모델로 자연어 처리계의 완벽한 종합 선물 세트라고 할 수 있다. 그리고 구글은 이 버트를 자신들의 검색 알고리즘에 포함시킨 것이다. 

구글은 이렇게 구글의 알고리즘에 포함시킨 버트가 제 구실을 하게 하기 위해 많은 텍스트 데이터들을 학습시켰다. 예를 들어 엄청난 컴퓨팅 파워와 돈을 사용해서 위키피디아의 모든 텍스트를 학습시켰다. 버트가 포함된 구글의 큰 특징은 아래와 같이 단어의 순서만 다를 뿐 같은 단어로 구성된 두 문장이 사실은 서로 다른 뜻을 가지고 있을 때 그 두 문장을 차이를 제대로 이해하고 검색 결과를 만들어낼 수 있게 되었다는 점이다.

예시문장1: does us citizen need visa for Korea?
예시문장2: does Korea citizen need visa for US?

그렇다면 버트의 도입에 대비해서 마케터들이 해야할 일이 있을까? 간단하게 말한다면 특별한 대책은 필요없다. 왜냐하면 버트는 원래부터 복잡하고 다양해지는 검색 쿼리에 대응하기 위해서 구글이 지금까지의 자연어 처리 능력을 개선해서 검색의도에 부합하는 콘텐츠를 검색 결과에 보여주기 위해 도입된 것이지 새로운 SEO적 측면에서 뭔가 대응을 유도하려는 의도가 없었기 때문이다.

버트, 랭크브레인을 포함해서 최근 검색 알고리즘 업데이트의 큰 맥락은 허밍버드 이후 계속해서 강조되어오던 것 처럼 검색자 의도에 잘 대응하는 포괄적이고 심도있는 콘텐츠를 지속적으로 제작하는 것이 유일하게 신경써야할 부분이라 할 수 있다.