웹마스터는 'nofollow' 속성을 통해 검색엔진에 '이 페이지의 링크를 추적하지 마세요' 또는 '특정 링크를 추적하지 마세요'라고 알려줄 수 있습니다.
기본적으로 nofollow 속성은 페이지 수준의 메타 태그에서 사용되며 페이지의 외부 링크에 대해 추적, 즉 크롤링 하지 않도록 검색엔진에 지시하는 역할을 합니다. 예를 들면 다음과 같습니다.
<meta name="robots" content="nofollow" />
개별 링크에 대해 nofollow가 사용되기 전에 로봇이 페이지의 개별 링크를 추적하는 것을 방지하려면 링크를 robots.txt의 차단된 URL로 리디렉션하는 것과 같이 복잡한 작업을 거쳐야 했습니다. 그래서 rel 속성에서 nofollow 속성값이 만들어지게 되었습니다. 이 속성을 통해 웹마스터는 검색엔진이나 봇에 페이지 링크를 추적하지 말라고 지시하는 대신 간편하게 로봇에게 특정 링크를 크롤링하지 않도록 지시함으로써 더 효과적으로 관리할 수 있게 되었습니다. 예를 들면 다음과 같습니다.
<a href="signin.php" rel="nofollow">sign in</a>
Google에서는 nofollow로 설정된 링크를 어떻게 처리하나요?
일반적으로 Google은 이러한 링크를 따르지 않습니다. 즉, Google에서는 이러한 링크 간에 PageRank 또는 앵커 텍스트를 전송하지 않습니다. nofollow 속성을 사용할 경우 Google의 전체 웹 도표에서 타겟 링크를 삭제하게 됩니다. 하지만 다른 사이트에서 nofollow를 사용하지 않고 타겟 페이지로 링크하거나 해당 URL이 Sitemap 형태로 Google에 제출된 경우, 타겟 페이지는 Google 색인에 계속 나타날 수 있습니다. 또한 검색엔진마다 nofollow 속성을 처리하는 방식은 조금씩 다를 수 있습니다.
nofollow 속성 사용에 대한 Google 정책과 구체적인 사용 예를 알고 싶습니다.
다음과 같은 경우 nofollow 속성의 사용을 고려해 볼 수 있습니다.
- 신뢰할 수 없는 콘텐츠: 신뢰할 수 없는 사용자 댓글이나 방명록과 같이 사이트에서 링크한 페이지의 콘텐츠를 신뢰할 수 없는 경우 해당 링크에 nofollow를 사용할 수 있습니다. 이렇게 하면 스팸 발송자가 사이트를 타겟팅하는 것을 막아, 웹의 악성 사용자에게 우연히 사이트 PageRank가 전달되는 상황을 예방할 수 있습니다. 특히 스팸 댓글 작성자가 특정 콘텐츠 관리 시스템 또는 블로그 서비스에서 신뢰하지 않는 링크를 추적하지 않는다는 것을 알게 될 경우 해당 서비스를 타겟팅하지 않을 수 있습니다. 오랜 기간 동안 지속적으로 훌륭한 콘텐츠를 제공해 온 회원이나 사용자에 대해 자동 또는 수동으로
nofollow속성을 제거함으로써 신뢰할 수 있는 의견 제공자에 대해서는 속성을 달리 지정할 수 있습니다. - 유료 링크: Google로 연결되는 사이트에 대한 분석결과도 Google 검색결과의 사이트 게재순위에 영향을 미칩니다. 유료 링크가 검색결과에 영향을 미치거나 사용자에게 부정적인 영향을 미치지 않게 하려면 해당 링크에 대해 웹마스터가
nofollow속성을 사용할 수 있습니다. 검색엔진 가이드라인은 유료 링크는 컴퓨터에서 인식할 수 있어야 한다고 규정합니다. 이는 전면 광고에서 '광고'라는 표시를 통해 온라인 및 오프라인 소비자에게 유료 광고임을 알리는 것과 같은 맥락입니다. Google의 유료 링크 정책에 대해 자세히 알아보기 - 크롤링 순서 지정: 검색엔진 로봇은 토론 그룹에 로그인하거나 사용자로 등록할 수 없으므로 Googlebot에서 '지금 등록하기' 또는 '로그인' 링크를 추적할 필요가 없습니다. 이러한 링크에 대해
nofollow속성을 사용하면 Google 색인에 나타나기를 원하는 다른 페이지를 Googlebot에서 크롤링하도록 할 수 있습니다. 그러나 알기 쉬운 탐색 경로, 사용자 및 검색엔진이 쉽게 접근할 수 있는 URL 등과 같이 정보 구조가 잘 되어 있는 사이트라면 nofollow가 지정된 링크를 통해 크롤링 순서를 정하는 것보다 훨씬 생산적으로 리소스를 사용할 수 있습니다.
nofollow는 소셜 그래프 API(rel="nofollow me")와 어떻게 작동하나요?
사용자 프로필을 호스트하고 사용자가 웹의 다른 프로필에 연결하도록 허용하는 경우, 소셜 그래프 API를 통해 사용할 수 있도록 이러한 링크를 rel="me" microformat으로 표시하는 것이 좋습니다. 예를 들면 다음과 같습니다.
<a href="http://blog.example.com" rel="me">내 블로그</a>
그러나 이러한 링크는 사용자가 생성하고 때로는 신뢰할 수 없는 페이지를 가리킬 수 있으므로, 이러한 링크를 nofollow로 표시하는 것이 좋습니다. 예를 들면 다음과 같습니다.
<a href="http://blog.example.com" rel="me nofollow">내 블로그</a>
rel="me nofollow"로 표시하면 Google이 rel="nofollow"를 PageRank를 이전하지 않는 것과 같이 검색 용도로 계속 간주합니다. 하지만 소셜 그래프 API의 경우 Google은 nofollow와 함께 포함된 경우에도 rel="me" 링크를 계산합니다.
OpenID 또는 OAuth 같은 인증 기술을 사용하여 링크의 소유권을 확인할 수 있는 경우 nofollow 링크를 삭제하도록 선택할 수 있습니다.
URL의 크롤링을 차단하려면 robots.txt를 사용할 수 있습니다. 표준 robots.txt 예외 규칙은 Googlebot 및 소셜 그래프 API를 모두 준수합니다.
