Google 검색의 작동 방식

Google이 웹페이지를 발견, 크롤링, 게재하는 방법 알아보기

Google은 어떻게 작동하나요? 다음은 이에 대한 짧은 버전의 답변과 긴 버전의 답변입니다.

Google은 다음을 포함한 여러 다른 출처에서 정보를 가져옵니다. 

  • 웹페이지
  • Google 마이 비즈니스 및 지도 사용자 제출 내역과 같은 사용자 제출 콘텐츠
  • 책 스캔
  • 인터넷의 공개 데이터베이스
  • 그 외 다수의 기타 출처

그 중 이 페이지에서는 웹페이지를 중점적으로 다룹니다.

짧은 버전

Google은 세 가지 기본 단계에 따라 웹페이지에서 가져와 결과를 생성합니다.

크롤링

첫 번째 단계는 웹에 어떤 페이지가 존재하는지 파악하는 것입니다. 모든 웹페이지의 중심 레지스트리가 있는 것이 아니므로 Google은 계속해서 새 페이지를 검색하여 알려진 페이지 목록에 추가해야 합니다. 이 발견 절차를 크롤링이라고 합니다.

일부 페이지는 Google이 이미 크롤링한 적이 있기 때문에 알려져 있습니다. 다른 페이지는 Google이 알려진 페이지에서 새 페이지로의 링크를 따라갈 때 발견됩니다. 또한 어떤 페이지는 웹사이트 소유자가 Google에서 크롤링할 수 있도록 페이지 목록(사이트맵)을 제출하는 방법으로 발견됩니다. Wix나 Blogger 같은 관리 웹 호스트를 사용 중인 경우 관리 웹 호스트에서 Google에 업데이트된 페이지나 신규 페이지를 크롤링하라고 알릴 수도 있습니다.

사이트 크롤링 개선하기

  • 단일 페이지를 변경하려면 Google에 개별 URL을 제출할 수 있습니다.
  • Google이 이미 알고 있는 다른 페이지에서 내 페이지로 연결되게 합니다. 하지만 광고 링크, 다른 사이트에서 구매한 링크, 댓글에 포함된 링크 등 Google 웹마스터 가이드라인을 따르지 않는 링크는 Google에서 따라가지 않습니다.
  • Google이 하나의 페이지만 크롤링하게 하려면 페이지를 홈페이지로 설정합니다. Google의 입장에서 봤을 때 사이트에서 가장 중요한 페이지는 홈페이지입니다. 사이트 전체가 크롤링되게 하려면 홈페이지(및 모든 페이지)에 사이트의 모든 중요한 섹션 및 페이지로 이어지는 양질의 사이트 탐색 시스템을 갖추세요. 이렇게 하면 사용자(및 Google)가 사이트를 탐색하는 데 도움이 됩니다.

 

Google은 금전적인 대가를 받고 사이트 크롤링 횟수를 늘리거나 순위를 높이지 않습니다. 누군가 이와 반대로 이야기한다면 이는 사실이 아닙니다.

색인 생성

페이지가 별견되면 Google은 해당 페이지가 어떤 페이지인지 파악하려고 합니다. 이 과정을 색인 생성이라고 합니다. Google은 페이지의 콘텐츠를 분석하고 삽입된 이미지와 동영상 파일의 목록을 작성하고 그 외 다른 방법으로 페이지를 파악하려고 합니다. 이 정보는 수많은 (아주 많은!) 컴퓨터에 저장된 거대한 데이터베이스인 Google 색인에 저장됩니다.

페이지 색인 생성 개선하기

  • 페이지 제목은 짧고 의미있게 만듭니다.
  • 페이지의 주제를 전달하는 페이지 제목을 사용합니다.
  • 이미지보다 텍스트를 사용하여 콘텐츠를 전달합니다. (Google은 일부 이미지와 동영상을 이해할 수 있지만 텍스트만큼 잘 이해하지는 못합니다.) 최소한 대체 텍스트와 기타 속성을 적절히 이용해 동영상이미지에 주석을 달아 주시기 바랍니다.

게재 (및 순위 지정)

사용자가 검색어를 입력하면 Google이 여러 요소를 바탕으로 색인에서 관련성 있는 답변을 찾기 위해 노력합니다. Google은 가장 높은 품질의 답변을 결정하고, 최상의 사용자 환경과 가장 적절한 답변을 제공할 수 있는 다른 요소(예: 사용자의 위치, 언어, 데스크톱 또는 휴대전화 등의 기기)를 고려합니다. 예를 들어 '자전거 수리점'을 검색하면 파리에 있는 사용자와 홍콩에 있는 사용자에게 다른 답변이 표시됩니다. Google은 금전적인 대가를 받고 페이지의 순위를 높이지 않습니다. 사이트의 순위는 프로그래매틱 방식으로 결정됩니다.

게재 및 순위 개선하기

긴 버전

좀 더 자세한 정보를 원하시나요? 다음을 참조하세요.

긴 버전

 

크롤링

크롤링은 Googlebot이 새로운 페이지 및 업데이트된 페이지를 찾아 Google 색인에 추가하는 과정입니다.

Google은 다양한 종류의 컴퓨터를 사용하여 수십억 개의 웹페이지를 가져옵니다. 이 작업을 크롤링한다고도 합니다. 웹페이지를 가지고 오는 프로그램을 Googlebot이라고 합니다. 로봇, 봇 또는 스파이더라고도 알려져 있습니다. Googlebot은 알고리즘 과정을 사용하므로 컴퓨터 프로그램에서 크롤링할 사이트, 크롤링 횟수 및 각 사이트에서 가져올 페이지 수를 결정합니다.

Google의 크롤링은 이전 크롤링 과정에서 생성되고 웹마스터가 제공한 Sitemap 데이터가 추가된 웹페이지 URL 목록부터 시작합니다. Googlebot은 이러한 웹사이트를 방문할 때 각 페이지의 링크를 감지하여 이를 크롤링할 페이지 목록에 추가합니다. 이렇게 파악된 새 사이트, 기존 사이트의 변경사항 및 비활성 링크에 따라 Google 색인이 업데이트됩니다.

Google은 어떻게 페이지를 찾나요?

Google은 다음을 포함한 여러 기술을 사용하여 페이지를 찾습니다.

  • 다른 웹사이트나 페이지의 링크 따라가기
  • 사이트맵 읽기

Google은 크롤링하지 말아야 하는 페이지를 어떻게 파악하나요?

  • robots.txt에서 차단된 페이지는 크롤링되지 않지만, 다른 페이지에서 연결된 경우에는 여전히 색인 생성될 수 있습니다. (Google은 해당 페이지를 가리키는 링크로 페이지의 콘텐츠를 추론한 후 콘텐츠를 파싱하지 않고 페이지의 색인을 생성할 수 있습니다.)
  • Google은 익명 사용자가 액세스할 수 없는 페이지를 크롤링할 수 없습니다. 따라서 로그인 또는 기타 승인 보호가 설정된 경우 페이지가 크롤링되지 않습니다.
  • 이미 크롤링되었으며 다른 페이지의 중복으로 간주되는 페이지는 더 적은 빈도로 크롤링됩니다.

크롤링 개선하기

다음과 같은 기술을 사용하면 Google이 내 사이트에서 올바른 페이지를 발견하게 하는 데 도움이 됩니다.

색인 생성

Googlebot은 크롤링하는 각 페이지를 처리하여 각 페이지에서 파악된 모든 단어와 해당 단어의 위치로 구성된 거대한 색인을 컴파일합니다. 또한 <title> 태그나 alt 속성과 같은 주요 콘텐츠 태그와 속성에 포함된 정보도 처리합니다. Googlebot은 대부분의 콘텐츠 유형을 처리할 수 있지만, 일부 처리가 불가능한 유형도 있습니다. 예를 들어 일부 리치 미디어 파일의 콘텐츠는 처리할 수 없습니다.

Google에서는 크롤링과 색인 생성을 하는 중에 페이지가 다른 페이지의 중복 또는 표준 페이지인지 판단합니다. 페이지가 중복으로 간주되면 크롤링 빈도가 훨씬 적어집니다.

Google에서는 NOINDEX 명령어(헤더 또는 태그)가 포함된 페이지의 색인을 생성하지 않습니다. 하지만 Google에서 명령어를 읽을 수 있어야 합니다. 페이지가 robots.txt 파일이나 로그인 페이지 등의 수단으로 차단된 경우 Google에서 방문하지 않았는데도 페이지의 색인이 생성될 수 있습니다.

색인 생성 개선하기

다양한 기술을 사용해 Google의 페이지 콘텐츠 파악 성능을 개선할 수 있습니다.

결과 게재

사용자가 검색어를 입력하면 Google 컴퓨터는 색인에서 일치하는 페이지를 검색하고 사용자에게 가장 관련성이 높은 것으로 판단되는 결과를 반환합니다. 관련성은 200가지 이상의 요인으로 결정되며 Google은 항상 알고리즘 개선을 위해 노력합니다. Google에서 결과를 선택하고 순위를 지정할 때는 사용자 환경을 고려하므로 페이지가 빠르게 로드되며 모바일 친화적인지 확인하세요.

게재 개선하기

  • 결과가 특정 위치 또는 언어의 사용자를 대상으로 하는 경우 Google에 선호사항을 알릴 수 있습니다.
  • 페이지가 빠르게 로드되며 모바일 친화적인지 확인합니다.
  • 일반적인 신수를 피하고 사이트의 순위를 올릴 수 있도록 웹마스터 가이드라인을 따릅니다.
  • 레시피 카드나 기사 카트와 같이 사이트에 검색결과 기능 구현을 고려합니다.
  • 휴대기기에서 빠르게 로드될 수 있도록 AMP를 구현합니다. 일부 AMP 페이지는 주요뉴스 캐러설과 같은 추가 검색 기능을 사용할 수 있습니다.
  • Google의 알고리즘은 계속해서 개선되고 있습니다. 알고리즘을 추측하여 이에 맞게 페이지를 설계하려 노력하기 보다는 사용자가 원하는 새로운 양질의 콘텐츠를 제공하기 위해 노력하고 가이드라인을 따르세요.

더 긴 버전

여기에서 더 긴 버전의 Google 검색 작동 방식(그림 및 동영상 포함)을 확인하세요.

도움이 되었나요?
어떻게 하면 개선할 수 있을까요?