Pengguna pemula

Cara Kerja Google Penelusuran

Mempelajari cara Google menemukan, meng-crawl, dan menayangkan halaman web

Bagaimana cara kerja Google? Berikut ini penjelasan singkat dan panjangnya.

Google mendapatkan informasi dari berbagai sumber, termasuk: 

  • Halaman web,
  • Konten yang dikirim pengguna seperti kiriman pengguna Google Bisnisku dan Maps,
  • Pemindaian buku,
  • Database publik di Internet,
  • dan banyak sumber lainnya.

Namun, halaman ini difokuskan pada halaman di Internet.

Penjelasan singkat

Google mengikuti 3 langkah dasar untuk menampilkan hasil dari halaman:

Crawling

Langkah pertama adalah mencari tahu halaman apa yang ada di web. Tidak ada registry pusat untuk semua halaman, sehingga Google harus menelusuri halaman baru secara terus-menerus dan menambahkannya ke daftar halaman yang dikenal. Beberapa halaman sudah dikenal karena telah dikunjungi Google sebelumnya. Halaman lain akan ditemukan saat Google mengikuti link dari halaman yang dikenal ke halaman baru. Selain itu, halaman lain akan ditemukan saat pemilik situs mengirim daftar halaman (peta situs) untuk di-crawl oleh Google. Jika Anda menggunakan host web yang dikelola, seperti Wix atau Blogger, host web tersebut mungkin memberi tahu Google untuk meng-crawl halaman yang diperbarui atau baru yang Anda buat.

Setelah menemukan URL halaman, Google akan mengunjungi atau meng-crawl halaman untuk mencari tahu apa yang ada di dalamnya. Google merender halaman dan menganalisis konten teks, non-teks, serta tata letak visual secara keseluruhan untuk menentukan tempat ditampilkannya di Hasil penelusuran. Semakin baik Google memahami situs Anda, semakin baik kami dapat mencocokkannya kepada orang yang mencari konten Anda.

Untuk menyempurnakan crawling situs:

  • Verifikasi bahwa Google dapat menjangkau halaman di situs Anda, dan pastikan halaman tersebut sudah terlihat benar. Google mengakses web sebagai pengguna anonim (pengguna tanpa sandi atau informasi). Google juga harus dapat melihat semua gambar dan elemen lainnya pada halaman agar dapat memahaminya dengan benar. Anda dapat melakukan pemeriksaan cepat dengan mengetikkan URL halaman Anda pada alat uji untuk Mobile-Friendly.
  • Jika telah membuat atau memperbarui satu halaman, Anda dapat mengirimkan URL individual ke Google. Untuk memberi tahu Google tentang jumlah halaman baru atau yang diperbarui sekaligus, gunakan peta situs.
  • Jika Anda meminta Google untuk meng-crawl satu halaman saja, pastikan halaman tersebut adalah halaman beranda Anda. Halaman beranda Anda adalah halaman paling penting di situs Anda, sejauh yang diperhatikan Google. Untuk mendorong crawling situs yang lengkap, pastikan halaman beranda Anda (dan semua halaman) berisi sistem navigasi situs yang bagus yang ditautkan ke semua bagian dan halaman penting di situs Anda. Tindakan ini akan membantu pengguna (dan Google) dalam menjelajahi situs Anda. Untuk situs yang lebih kecil (kurang dari 1.000 halaman), cukup pastikan Google mengetahui halaman beranda Anda saja, asalkan Google dapat menjangkau semua halaman lainnya dengan mengikuti jalur link yang dimulai dari halaman beranda Anda. 
  • Tautkan halaman Anda ke halaman lain yang sudah diketahui Google. Namun, perhatikan bahwa link di iklan, link yang Anda bayar untuk ditempatkan di situs lain, link di komentar, atau link lain yang tidak mengikuti Pedoman Webmaster Google tidak akan diikuti oleh Google.

 

Google tidak menerima pembayaran untuk meng-crawl situs tertentu lebih sering, atau memberinya peringkat lebih tinggi. Jika Anda mendapatkan informasi sebaliknya, artinya informasi tersebut tidak benar.

Pengindeksan

Setelah halaman ditemukan, Google mencoba memahami berbagai elemen yang ada di halaman tersebut. Proses ini disebut pengindeksan. Google menganalisis konten halaman, gambar katalog, dan file video yang disematkan pada halaman, dan mencoba memahami halaman tersebut. Informasi ini disimpan di indeks Google, sebuah database besar yang disimpan di banyak (sangat banyak) komputer.

Untuk menyempurnakan pengindeksan halaman:

  • Buat judul halaman yang pendek dan bermakna.
  • Gunakan judul halaman yang menyampaikan subjek halaman.
  • Gunakan teks untuk menyampaikan konten, bukan gambar. (Google dapat memahami sebagian gambar dan video, tetapi tidak sebaik memahami teks. Setidaknya beri keterangan pada video dan gambar dengan teks alternatif dan atribut lain yang sesuai.)

Penayangan (dan pemberian peringkat)

Saat pengguna mengetik kueri, Google mencoba menemukan jawaban yang paling relevan dari indeksnya berdasarkan banyak faktor. Google mencoba menentukan jawaban dengan kualitas tertinggi, dan memperhitungkan pertimbangan lain yang akan memberikan pengalaman pengguna terbaik dan jawaban yang paling tepat, dengan mempertimbangkan hal-hal seperti lokasi, bahasa, dan perangkat pengguna (desktop atau ponsel). Misalnya, jawaban untuk penelusuran "bengkel perbaikan sepeda" bagi pengguna di Paris akan berbeda dengan jawaban bagi pengguna di Hong Kong. Google tidak menerima pembayaran untuk memberi peringkat halaman lebih tinggi, dan pemberian peringkat dilakukan secara terprogram.

Untuk menyempurnakan penayangan dan pemberian peringkat:

Penjelasan panjang

Ingin mendapatkan informasi selengkapnya? Berikut informasinya:

Penjelasan panjang

Crawling

Crawling adalah proses yang digunakan Googlebot untuk mengunjungi halaman baru dan yang diperbarui untuk ditambahkan ke indeks Google.

Kami menggunakan banyak sekali komputer untuk mengambil (atau "meng-crawl") miliaran halaman di web. Program yang melakukan pengambilan ini disebut Googlebot (juga dikenal sebagai robot, bot, atau spider). Googlebot menggunakan proses algoritme untuk menentukan situs mana yang di-crawl, seberapa sering, dan jumlah halaman yang akan diambil dari tiap situs.

Proses crawling Google dimulai dengan daftar URL halaman web, yang dihasilkan dari proses crawling sebelumnya, dan ditambahkan dengan data Peta Situs yang disediakan oleh webmaster. Saat mengunjungi halaman, Googlebot menemukan link pada halaman dan menambahkannya ke daftar halaman untuk di-crawl. Situs baru, perubahan terhadap situs yang ada, dan link mati akan dicatat serta digunakan untuk memperbarui indeks Google.

Selama crawling, Google merender halaman menggunakan Chrome versi terbaru. Sebagai bagian dari proses rendering, skrip halaman apa pun yang ditemui akan dijalankan. Jika situs Anda menggunakan konten yang dihasilkan secara dinamis, pastikan Anda mengikuti dasar-dasar SEO JavaScript.

Crawl utama/ crawl sekunder

Google menggunakan dua crawler yang berbeda untuk meng-crawl situs: crawler seluler dan crawler desktop. Setiap jenis crawler menyimulasikan pengguna yang mengunjungi halaman Anda dengan jenis perangkat tersebut.

Google menggunakan satu jenis crawler (seluler atau desktop) sebagai crawler utama untuk situs Anda. Semua halaman di situs Anda yang telah di-crawl oleh Google, di-crawl menggunakan crawler utama. Crawler utama untuk semua situs baru adalah crawler seluler.

Selain itu, Google akan meng-crawl ulang beberapa halaman di situs Anda dengan jenis crawler lain (seluler atau desktop). Ini disebut crawl sekunder, dan dilakukan untuk melihat seberapa baik situs Anda bekerja dengan jenis perangkat lainnya.

Bagaimana cara Google mengetahui halaman yang tidak di-crawl?

  • Halaman yang diblokir dalam robots.txt tidak akan di-crawl, tetapi mungkin masih diindeks jika tertaut ke halaman lain. (Google dapat menyimpulkan konten halaman dengan link yang mengarah ke halaman itu, dan mengindeks halaman tanpa mengurai kontennya.)
  • Google tidak dapat meng-crawl halaman apa pun yang tidak dapat diakses oleh pengguna anonim. Dengan demikian, login atau perlindungan otorisasi lainnya akan mencegah halaman agar tidak di-crawl.
  • Halaman yang telah di-crawl dan dianggap duplikat dari halaman lain akan jarang di-crawl.

Menyempurnakan crawling Anda

Gunakan teknik berikut untuk membantu Google menemukan halaman yang tepat di situs Anda:

Pengindeksan

Googlebot memproses setiap halaman yang di-crawl untuk memahami konten halaman. Hal ini mencakup pemrosesan konten teks, atribut dan tag konten utama, seperti tag <judul> serta atribut alt, gambar, video, dan lainnya. Googlebot dapat memproses banyak jenis konten tetapi tidak semuanya. Misalnya, kami tidak dapat memproses konten beberapa file multimedia.

Di antara crawling dan pengindeksan, Google menentukan apakah suatu halaman merupakan duplikat atau kanonis dari halaman lain. Jika dianggap duplikat, halaman akan lebih jarang di-crawl. Halaman yang mirip dikelompokkan bersama menjadi dokumen, yang merupakan sebuah kelompok berisi 1 atau beberapa halaman yang menyertakan halaman kanonis (yang paling mewakili grup) dan duplikat apa pun yang ditemui (yang mungkin hanya berupa URL alternatif untuk menjangkau halaman yang sama, atau mungkin versi seluler atau desktop alternatif dari halaman yang sama).

Perhatikan bahwa Google tidak mengindeks halaman yang memiliki perintah noindex (header atau tag). Namun, Google harus dapat melihat perintah tersebut. Karena itu, jika halaman diblokir oleh file robots.txt, halaman login, atau perangkat lain, kemungkinan halaman tersebut akan diindeks meski tidak dikunjungi oleh Google.

Menyempurnakan pengindeksan

Terdapat banyak teknik untuk menyempurnakan kemampuan Google dalam memahami konten halaman Anda:

Apa yang dimaksud dengan "dokumen"?

Secara internal, Google merepresentasikan web sebagai kumpulan dokumen (yang sangat besar). Setiap dokumen mewakili satu atau beberapa halaman web. Halaman tersebut sama atau sangat mirip, tetapi pada dasarnya adalah konten yang sama dan dapat dijangkau oleh URL yang berbeda. URL yang berbeda dalam dokumen dapat mengarah ke halaman yang sama persis (misalnya, example.com/dresses/summer/1234 dan example.com?product=1234 mungkin menampilkan halaman yang sama), atau halaman yang sama dengan variasi kecil yang ditujukan untuk pengguna di perangkat yang berbeda (misalnya, example.com/mypage untuk pengguna desktop dan m.example.com/mypage untuk pengguna seluler).

Google memilih salah satu URL dalam dokumen dan menentukannya sebagai URL kanonis dokumen. URL kanonis dokumen adalah URL yang paling sering di-crawl serta diindeks oleh Google; URL lainnya dianggap sebagai duplikat atau alternatif, dan terkadang di-crawl, atau ditayangkan sesuai dengan permintaan pengguna. Contohnya, jika URL kanonis dokumen adalah URL seluler, Google mungkin masih akan menayangkan URL desktop (alternatif) untuk pengguna yang menelusuri di desktop.

Sebagian besar laporan di Search Console mengaitkan data ke URL kanonis dokumen. Beberapa alat (seperti Alat Inspeksi URL) mendukung pengujian URL alternatif, tetapi memeriksa URL kanonis juga akan memberikan informasi tentang URL alternatif.

Anda dapat memberi tahu Google URL mana yang menurut Anda kanonis, tetapi Google dapat memilih URL kanonis yang berbeda karena berbagai alasan.

Berikut adalah ringkasan istilah dan cara penggunaannya di Search Console:

  • Dokumen: Kumpulan halaman yang mirip. Memiliki URL kanonis, dan mungkin URL alternatif, jika situs Anda memiliki halaman duplikat. URL dalam dokumen dapat berasal dari organisasi yang sama atau berbeda (domain root, misalnya "google" di www.google.com). Google memilih URL terbaik untuk ditampilkan di Hasil penelusuran menurut platform (seluler/desktop), bahasa pengguna atau lokasi, dan banyak variabel lainnya. Google menemukan halaman terkait di situs Anda dengan crawling organik, atau dengan fitur yang diimplementasikan situs seperti pengalihan atau tag <link rel=alternate/canonical>. Halaman terkait di organisasi lain hanya dapat ditandai sebagai alternatif jika dikodekan secara eksplisit oleh situs Anda (melalui pengalihan atau tag link).
  • URL: URL yang digunakan untuk menjangkau bagian konten tertentu di situs. Situs mungkin menyelesaikan URL yang berbeda untuk halaman yang sama.
  • Halaman: Halaman web tertentu, dijangkau oleh satu atau beberapa URL. Halaman dapat memiliki versi yang berbeda, bergantung pada platform pengguna (seluler, desktop, tablet, dan sebagainya).
  • Versi: Satu variasi halaman, biasanya dikategorikan sebagai "seluler", "desktop", dan "AMP" (meskipun AMP dapat memiliki versi seluler dan desktop). Setiap versi dapat memiliki URL yang berbeda (example.com vs m.example.com) atau URL yang sama (jika situs Anda menggunakan penayangan dinamis atau desain web yang responsif, dan URL yang sama dapat menampilkan versi yang berbeda dari halaman yang sama) bergantung pada konfigurasi situs Anda. Variasi bahasa tidak dianggap sebagai versi yang berbeda, tetapi dokumen yang berbeda.
  • URL atau halaman kanonis: URL yang dianggap Google sebagai yang paling mewakili dokumen. Google selalu meng-crawl URL ini; URL duplikat dalam dokumen terkadang juga di-crawl.
  • URL atau halaman alternatif/duplikat: URL dokumen yang mungkin di-crawl Google sesekali. Google juga menayangkan URL ini jika sesuai dengan pengguna dan permintaan (misalnya, URL alternatif untuk pengguna desktop akan ditayangkan untuk permintaan desktop, daripada URL seluler kanonis).
  • Situs: Biasanya digunakan sebagai sinonim untuk situs (kumpulan halaman web yang terkait secara konsep), tetapi terkadang digunakan sebagai sinonim untuk properti Search Console, meskipun properti sebenarnya dapat ditentukan sebagai hanya bagian dari sebuah situs. Situs dapat menjangkau subdomain (dan bahkan organisasi, jika telah menautkan halaman AMP dengan benar).

Halaman dengan konten yang sama dalam bahasa yang berbeda disimpan dalam dokumen berbeda yang merujuk satu sama lain menggunakan tag hreflang. Karena itu, sebaiknya gunakan tag hreflang untuk konten yang diterjemahkan.

Menayangkan hasil

Saat pengguna memasukkan kueri, mesin kami menelusuri indeks untuk mencari halaman yang cocok dan menampilkan hasil yang kami yakini paling relevan bagi pengguna. Relevansi ditentukan oleh ratusan faktor, dan kami selalu berupaya meningkatkan algoritme kami. Google mempertimbangkan pengalaman pengguna dalam memilih dan memberi peringkat pada hasil. Karena itu, pastikan halaman Anda dimuat dengan cepat dan mobile-friendly.

Menyempurnakan penayangan

  • Jika hasil Anda ditujukan untuk pengguna di lokasi atau bahasa tertentu, beri tahu Google tentang preferensi Anda.
  • Pastikan halaman Anda dimuat dengan cepat dan mobile-friendly.
  • Ikuti Pedoman Webmaster untuk menghindari kendala umum dan meningkatkan peringkat situs Anda.
  • Pertimbangkan untuk mengimplementasikan fitur Hasil penelusuran bagi situs Anda, seperti kartu resep atau kartu artikel.
  • Implementasikan AMP untuk memuat halaman lebih cepat di perangkat seluler. Sebagian halaman AMP juga memenuhi syarat untuk fitur penelusuran tambahan, seperti karosel berita utama.
  • Algoritme Google terus disempurnakan; daripada mencoba menebak algoritme dan mendesain halaman Anda untuk algoritme itu, buat konten yang bagus dan terkini yang diinginkan pengguna, dan ikuti panduan kami.

Penjelasan yang lebih panjang

Anda dapat menemukan penjelasan yang lebih panjang terkait cara kerja Google Penelusuran di sini (berisi gambar dan video).

Apakah ini membantu?
Bagaimana cara meningkatkannya?