구글 사이트 검색, 알고리즘 이해하기 1

구글 사이트 검색을 하면 등록된 수많은 사이트 중에서 가장 연관성이 높은 페이지를 찾아 제공합니다. 이게 바로 ‘알고리즘’입니다. 통계분석 결과를 보면 검색 후 나오는 첫 페이지에서는 10개로 추려 나오게 되는데 대부분의 구글 사용자들은 92% 확률로 10개 중 1개를 클릭하게 됩니다.

목 차

1. 구글 사이트, 알고리즘

구글에서는 작성된 글과 문서의 수가 무려 30조 개가 넘는다고 합니다. 이 중에서 사용자가 검색한 내용과 연관된 자료를 추출하여 10개의 결과물을 제시하는 데에는 0.5초 밖에 걸리지 않죠. 방법은 각종 색인된 웹페이지를 데이터화해 정보를 저장해두고 알고리즘을 통해 정보를 제공하기 때문입니다.
(현실에서 복권 당첨되는 확률(8,145,060대 1)보다 어려운 걸 구글은 해내고 있습니다.)

우선, 구글 사이트에 들어가셔서 정보를 얻길 원하는 검색을 해보시기 바랍니다.

☞ Google 검색엔진 사이트 바로가기

여기에서 알고리즘에 대해서 얘기할 수 있습니다. 알고리즘의 뜻부터 확인하고 넘어가겠습니다.

‘어떠한 행동을 하기 위해서 만들어진 명령어들의 집합체’

네, 알고리즘은 ‘일련의 명렁어‘라고 생각하면 됩니다. 구글 검색엔진은 색인(index)된 페이지 중 연관성이 큰 웹페이지를 찾아 노출시킵니다. 이 때, 구글 봇이 크롤링할 때 내부 링크와 외부 링크를 통해 크롤링이 진행된다고 합니다.

“구글 봇”에 대해서는 Google 검색 센터에서 자세하게 설명되어 있는데요. 특히, 여러분이 블로그, SNS 등 온라인 상에서 정보를 수집하는 데 도움을 받으려면 “SEO기본 가이드”에 대해 잘 파악해야 원하는 정보에 빠르게 도달할 수 있습니다.

☞ Google 검색엔진 최적화(SEO) 기본 가이드 바로가기

2. ‘크롤링’ 이해하기

google은 알고리즘을 위해 색인(index)된 웹페이지를 데이터화해 저장한다고 했는데요. 그러면, 어떤 방법으로 데이터를 저장하고 있을까요?

이 때, 언급되는 것이 바로 ‘크롤링’입니다.

① 크롤링이란?

‘크롤’은 기어다닌다는 뜻인데요. 크롤링은 계속해서 인터넷 속 모든 웹페이지를 찾을 때까지는 지속한다는 것입니다.

Google의 자동화된 프로그램 ‘크롤러'(=스파이더)
페이지로부터 텍스트(txt), 이미지(image), 동영상(video) 등 다운로드

② 크롤링 시기

크롤링은 밤낮없이 항상 진행 중입니다. Google은 ‘스파이더(spider)’라는 프로그램으로 크롤링을 하고 있습니다. 새로운 웹페이지를 색인하고 변화가 있다면 새롭게 적용해 줍니다.

새로운 웹페이지 색인
기존 색인된 웹페이지에 변화가 있을 경우 색인에 반영
더 이상 웹페이지를 찾을 수 없을 때까지 무한 반복 크롤링

3. 단어, 키워드의 중요성

Google은 어떤 단어를 검색하냐에 따라 검색 결과가 달라집니다. 동일한 정보를 얻고 싶을 때에도 검색어를 조금이라도 다르게 표현하면 가장 상단에 노출된 웹페이지가 다를 수 있다는 의미입니다.

① 과거 검색엔진

가장 단순한 방법을 채택했습니다. 키워드의 출현 빈도로 결과물을 보여주었는데요. 어떤 웹페이지에서 검색된 키워드의 개수가 많다면 최상단 노출이 보장되었다는 뜻입니다.

이러한 방법을 활용해 많은 온라인에서 정보를 제공하는 사람들의 글이 상단에 노출되기도 했습니다.

예를 들면, “나이키 운동화”를 키워드라고 해보겠습니다. 일반적으로 드는 생각은 나이키 공식 홈페이지(nike.com/kr)가 가장 먼저 확인되는 게 당연한 논리인데요. 만약, 키워드의 출현 빈도로만 노출된다면 어떨까요?

가장 많이 ‘나이키 운동화’라고 표현한 페이지가 제일 먼저 노출될 겁니다. 그러면, 검색 결과에 있어 신뢰성을 떨어뜨리고 알고리즘을 통해 노출된 정보가 쓸모 없게 되어버리는 것이죠.

② 현재 검색엔진

Google 검색엔진 사이트 기준으로 설명하겠습니다.

기본적으로 구글은 ‘텍스트 기반의 빠른 검색’이 기본 포맷입니다. 즉, 페이지 제목과 본문이 설정한 키워드 관련 내용으로 구성되어 있는지를 파악합니다. 그만큼 텍스트 즉, 키워드가 중요하다는 것은 과거와 현재가 동일합니다.

다만, 알고리즘의 관점에서 달라집니다. 현재 검색엔진의 알고리즘은 하이퍼링크 구조가 있는 문서에 가중치를 부여하는 방식을 채택했습니다. 쉽게 풀어보면 이렇습니다.

문서를 작성하는 사람은 링크가 있는 문서 A를 작성하고 다른 곳에서 오는 B페이지와의 연관성이 높다면 질 좋은 정보로 판단한다는 겁니다. 아래 이미지로 이해하시면 빠릅니다.

※ 구글 검색엔진의 알고리즘 이해도

4. 페이지랭크

앞서 하이퍼링크가 있는 문서는 가중치 점수를 더 준다고 했습니다. 이게 바로 ‘페이지랭크‘ 알고리즘입니다.

개발자 : Google 설립자 래리 페이지와 세르게이 브린
점수계산 : 웹페이지 점수와 링크된 페이지의 점수 함께 반영
산출방식 : 선형대수학

산출방식이 ‘선형대수학’이라고 해서 학업에 정진해 산출 방식을 꿰뚫어보라는 뜻이 아닙니다. 단지 Google의 점수계산 로직을 이해하고 넘어가면 됩니다.

① 그럼, 이제 우리는 링크만 달면 될까요?

아닙니다.

점수를 높게 받으려면 좋은 문서이면서 연관성이 높은 링크가 필요합니다. 그럼 ‘Google 검색엔진의 알고리즘 이해도’를 다시 보겠습니다.

A와 B문서의 타이틀 연관성
본문에서 추천 링크 적용

여기서 “적절한 키워드 출현 빈도가 적용”되었다면 더 나은 양질의 문서와 링크가 걸렸다고 할 수 있죠.

이제 여러분들은 품질 좋은 정보를 제공하는 글을 쓰고 연관된 문서와의 연결고리를 찾으면 됩니다.

② 품질 좋은 글, 어떻게 작성하나요?

정답은 Google SEO 최적화입니다. SEO의 기본은 다음과 같습니다.

자신의 웹페이지를 링크한 웹페이지를 늘리는 것
적절한 키워드 배치 및 연관성 높은 글의 하이퍼링크 구조 적용

검색엔진 최적화가 필요한 이유는 자신이 작성한 웹페이지가 크롤링할 때 빠르고 쉽게 찾도록 도와주는 역할을 합니다. 만약, Google SEO 최적화가 아닌 페이지일 경우, 크롤링을 느리거나 색인을 하지 못하는 경우가 발생하게 되는데요. 그렇게 되면 여러분들의 글이 노출되지 않아 온라인 비지니스를 하는 데 있어 악영향을 미칠 수 있습니다.

☞ 검색엔진 최적화(SEO)의 필요성 바로가기

다양한 플랫폼 중 카카오(KAKAO)에서 운영하는 티스토리 블로그의 최적화가 필요하다면 주요 핵심 카테고리로 구분해 정리한 글이 있어 함께 공유 드립니다. 저도 처음에는 이 정보로 도움을 많이 받았고 수익 창출을 위해 애드센스 신청 후 승인할 때까지 2주가 걸리지 않았습니다. 꼭 참고해 보세요!

용어 정리
알고리즘
Google 노출
현명한 링크 활용
URL 주소
이미지 최적화

☞ 구글 애드센스 승인 어렵지 않다!(feat. 구글 SEO최적화) 바로가기

5. 마치며

Google 검색 결과가 어떻게 노출되는지 ‘알고리즘’이라는 용어를 기준으로 알아봤는데요. 주의해야 할 사항이 있습니다.

한번 정한 알고리즘이 끝까지 유지되는 게 아니라 수시로 수정하고 업데이트를 한다고 하니 SEO 최적화는 계속해서 변한다고 할 수 있습니다. 즉, 수정이 있다면 이를 적용할 수 있는 방법을 모색하고 반영해야 합니다.

사용자 입장에서는 알고리즘 이해를 기반으로 검색할 때 원하는 정보를 더욱 빨리 찾을 수 있게 됩니다.

정보 제공 입장에서는 SEO 최적화로 검색 결과 상단에 노출되어 수익 창출의 기반을 마련할 수 있게 됩니다.

1. 구글 사이트, 알고리즘

2. ‘크롤링’ 이해하기

3. 단어, 키워드의 중요성

4. 페이지랭크

5. 마치며

Leave a Comment 응답 취소