Paano gumagana ang pagsa-sample

Ang pagsa-sample sa Google Analytics ay ang kasanayan ng pagpili ng subset ng data mula sa iyong trapiko at pag-uulat sa mga trend na available sa hanay ng sample na iyon. Ang pagsa-sample ay kadalasang ginagamit sa pagsusuri ng istatistika dahil ang mga resulta ng pagsusuri ng isang subset ng data ay katulad ng mga resulta ng pagsusuri sa lahat ng data. Dagdag pa rito, pinapabilis ng pagsa-sample ang pagpoproseso ng mga ulat kapag napakarami ng data at napapabagal nito ang mga query sa ulat.

Sa artikulong ito:

Pagsa-sample ng session

Paano gumagana ang mga standard na ulat

Ang bawat property na nasa Google Analytics ay nag-iimbak ng kopya ng lahat ng hindi na-filter na data na nauugnay sa natatanging numero ng property. Ang bawat view ng pag-uulat na nauugnay sa isang property ay gumagawa ng hanay ng mga hindi na-sample at paunang pinagsama-samang talahanayan ng data, na pinoproseso araw-araw. Ang mga paunang pinagsama-samang talahanayan ay ginagamit upang mabilis na ipakita ang mga hindi naka-sample na ulat.

Bukod sa mga karaniwang ulat, maaari ring magbigay ng mga ad-hoc na query sa Analytics ang mga user. Ang mga karaniwang query ay kinabibilangan ng paglalapat ng mga segment sa mga karaniwang ulat, paglalapat ng pangalawang dimensyon o pagpapatakbo ng custom na ulat. Kapag nagbigay ng isang query ang front-end, sisiyasatin ng Analytics ang hanay ng paunang pinagsama-samang talahanayan upang tukuyin kung ganap na matutugunan ng umiiral nang mga kabuuan ang query. Kung hindi, babalik ang analytics sa raw na data ng session upang maproseso at makalkula ang pinagsama-samang data habang gumagawa ng ibang bagay. Kung ang resultang ulat ay na-sample, makakakita ka ng isang mensahe sa itaas ng ulat, sa ibaba at sa kanan ng pamagat ng ulat, na nagsasabing, Batay sa N (na) session ang ulat na ito.

Paano gumagana ang mga ad-hoc na ulat

Kung kailangan ng analytics na kalkulahin ang pinagsama-samang data nang mabilisan upang matugunan ang query ng ulat, maaari itong mag-sample ng raw na data ng session upang mabawasan ang latency. Sa partikular, sinisiyasat ng Analytics ang bilang ng mga session para sa napiling hanay ng petsa sa antas ng property. Kung ang bilang ng mga session sa property sa partikular na hanay ng petsa ay lalampas sa 500K session (25M para sa Premium)1, magpapatupad ang Analytics ng algorithm ng pagsa-sample na gumagamit ng sample na hanay na proporsyonal sa pamamahagi ng mga session ayon sa araw para sa napiling hanay ng petsa. Kaya, nag-iiba ang rate ng pagsa-sample ng session sa bawat query depende sa bilang ng mga session na kasama sa napiling hanay ng petsa para sa partikular na property.

Mga implikasyon para sa mga naka-filter na view at segment

Nangyayari ang pagsa-sample ng session sa antas ng property, hindi sa antas ng view. Para sa mga query na ad-hoc, ang sample na hanay ay natutukoy sa antas ng property at pagkatapos ay ilalapat ang mga filter na antas ng view. Dahil dito, ang mga view na na-filter ay maaaring may mas kaunting session na kasama sa na-sample na kalkulasyon. Katulad nito, inilalapat ang Mga Segment pagkatapos na pagsa-sample, kaya mas kaunting session ang maaaring maisama sa kalkulasyon.

Google Analytics Premium: Para sa Google Analytics Premium, nagaganap ang pagsa-sample sa antas ng view. Kaya bilang resulta, hindi naaapektuhan ng mga filter ng view ang laki ng pagsa-sample. Gayunpaman, inilalapat ang Mga Segment pagkatapos ng pagsa-sample, kaya mas kaunting session ang maaaring maisama sa kalkulasyon.

Sa pangkalahatan, binabawasan ng pagsa-sample ng session ang latency ng query habang pinapanatili ang mataas na antas ng katumpakan. Ang pagsa-sample ng Google Analytics ay mahusay na gumagana para sa mabilis, nangungunang N (na) mga query at iba pang mga query na may bahagyang malawak, pare-parehong pamamahagi sa lahat ng session. Ang pagsa-sample ng session ay maaaring hindi gaanong tumpak para sa mga problemang napakahirap hanapin, tulad ng pagsusuri ng isang keyword at pagsusuri na long tail. Hindi rin ito gaanong tumpak sa mga sitwasyong kinabibilangan ng limitadong pagfi-filter ng dimensyon tulad ng mga view o pagsusuri ng conversion na na-filter nang mabuti, kung saan ang mga conversion ay bumubuo ng maliit na bahagi ng mga session. Para sa mga uri ng pagsusuring iyon, sumangguni sa Mga hindi na-sample na ulat para sa mga pangangailangan ng pang-isahang beses na ulat at sa Mga Custom na Talahanayan para sa patuloy na pangangailangan sa hindi na-sample na data sa isang partikular na hanay ng data, parehong available sa mga Google Analytics Premium account.

Pagsasama-sama ng value ng dimensyon

Paano gumagana ang mga karaniwang ulat

Ang mga paunang pinagsama-samang talahanayan bawat view ay pinoproseso sa pang-araw-araw na batayan. Nag-uulat ang mga talahanayang ito ng data tungkol sa lahat ng session, bagama't may limitasyon sa bilang ng mga row/natatanging value sa mga paunang pinagsama-samang talahanayan2. Pinagsasama-sama ng Analytics ang data kapag mayroong higit sa 50k row ng data (75k para sa Premium) sa isang talahanayan sa isang araw. Sa madaling salita, kapag mayroong higit sa 50k na value (75k para sa Premium) para sa isang partikular na talahanayan, kinukuha ng Analytics ang mga nangungunang N3 (na) value at gumagawa ng isang pinagsama-samang entry para sa natitirang mga value na may label na (iba pa).

Mga implikasyon para sa mga kahilingan sa maraming araw

Ang mga nangungunang N (na) entry ay natutukoy sa bawat araw na batayan. Halimbawa, kung pipili ka ng anumang araw sa ulat ng Mga Page, makikita mo ang hindi hihigit sa 50k na row (75k para sa Premium); lahat ng iba pang page ay pinagsama-sama sa kategoryang (iba pa). Samakatuwid, ang isang page na nasa kategoryang (iba pa) sa isang araw ay maaaring hindi makasama sa kategoryang (iba pa) sa ibang araw. Kaya, kung nagpapatakbo ka ng isang ulat para sa maraming araw na hanay ng petsa, maaaring magkaroon ng mga hindi pagkakatugma, dahil ang ilang mga page (o iba pang value ng dimensyon) sa long tail ay maaaring kasama sa (iba pa) na bucket o sa sarili nitong row sa lahat ng araw.

Dahil ang mga value ng dimensyon (hal., mga natatanging URL at keyword ng campaign) ay madalas na nauulit sa lahat ng napiling araw, karaniwang nakakaapekto lang ang hangganang ito sa mga site at app na may maraming natatanging page/screen at/o keyword.

Matuto nang higit pa tungkol sa kung paano pinagsasama-sama ang data sa ilalim ng (iba pa).

Paano gumagana ang mga ad-hoc na ulat

Sa mga sitwasyon kung saan hindi maaaring matugunan ng query ng umiiral nang pinagsama-sama (ibig sabihin, mga paunang pinagsama-samang talahanayan), babalik ang Analytics sa raw na data ng session upang makalkula ang hiniling na impormasyon. Sa ganitong pagkakataon, nagbabalik ang Analytics ng maximum na 1M ng mga natatanging value ng dimensyon na kasama sa hanay ng sample para sa query.

Iba pang mga ulat

Pagsa-sample at mga ulat sa Multi-Channel Funnel

Ang mga ulat sa Multi-Channel Funnel ay batay sa 1M conversion. Kung ang bilang ng mga conversion ay lumampas sa 1M para sa aktibong hanay ng petsa, magsa-sample ang Analytics ng hanggang sa 1M conversion sa antas ng view. Tandaan na nangyayari ang pagsa-sample sa antas ng view, hindi sa antas ng property, para sa mga ulat sa Multi-Channel Funnel.

Ang maximum na bilang ng mga natatanging path ng conversion ay 200K bawat araw. Ang lahat ng iba pang mga path ng conversion ay pinagsasama-sama sa ilalim ng (iba pa).

Pagsa-sample at mga ulat sa paglalarawan ng daloy

Ang mga ulat sa paglalarawan ng daloy (kinabibilangan ng Daloy ng Mga Bisita at Daloy ng Layunin) ay binubuo mula sa isang subset ng 100K session para sa aktibong hanay ng petsa. Katulad ng karaniwang pagsa-sample ng session ng ulat, ang 100K session ay na-sample sa antas ng property. Samakatuwid, maaaring higit pang bawasan ng paglalapat ng mga filter ng view o Segment ang laki ng hanay ng sample.

Dahil dito, ang mga ulat sa paglalarawan ng daloy, kasama na ang rate ng pagpasok, exit rate at rate ng conversion ay maaaring maiba sa mga resulta sa mga karaniwang ulat sa content at conversion, na batay sa ibang hanay ng sample.

Pagsa-sample ng pagkolekta ng data

Kung ang iyong site o app ay may milyun-milyong pageview bawat buwan, maaari mong pag-isipan ang pagko-configure ng iyong tracking code upang i-sample ang iyong data. Para sa impormasyon kung paano ito gawin, sundin ang mga tagubilin sa Gabay sa Developer para sa iyong partikular na environment:

Sa pamamagitan ng pagsa-sample ng mga hit para sa iyong site o app, makakakuha ka ng mga mapagkakatiwalaang resulta ng pag-uulat habang nananatiling nasa limitasyon ng hit para sa iyong account. Ang limitasyon sa bilang ng mga hit para sa isang karaniwang Analytics account ay 10M hit/buwan. Para sa mga Premium account, ang limitasyon ng hit ay 1B+ hit/buwan. Kapag ipinatupad ang pagsa-sample ng pagkolekta ng data, idi-discard ang mga hit sa panig ng kliyente at hindi kailan man kinokolekta o pinoproseso ng Analytics. Samakatuwid, ang mga na-discard na hit ay hindi na maaaring ma-recover sa pamamagitan ng mga Premium na hindi na-sample na ulat. Gayundin, hindi tulad ng pagsa-sample ng session, hindi kinakalkula ng Analytics ang mga resulta ng ulat batay sa rate ng sample ng pagkolekta ng data. Dahil doon, ang dagdag na pakinabang ng pagsa-sample ng koleksyon ng data ay magiging mas mabilis ang pagtugon ng ulat dahil mas kaunti ang data sa account.

Nangyayari nang tuluy-tuloy ang pagsa-sample ng pagkolekta ng data sa lahat ng user. Samakatuwid, kapag napili ang isang user para sa pagkolekta ng data, lahat ng session (kabilang ang mga session sa hinaharap) para sa user ay magpapadala ng data sa GA. Para sa mga mobile application, nangangahulugan ito na ang mga pagda-download ng application na napili para sa pagkolekta ng data ay magpapadala ng data sa GA, habang ang ibang pagkakataon ng application ay hindi magpapadala ng anumang hit.

Tandaan na kahit hindi ma-sample ang data para sa iyong site kapag kinuha ito, ang ilang partikular na uri ng mga ulat ay sasailalim sa iba pang mga uri ng pagsa-sample, kasama na ang pagsa-sample ng session at pagsasama-sama ng value ng dimensyon, batay sa katangian ng query. Tingnan ang Paano gumagana ang mga ad-hoc na ulat para sa pagsa-sample ng session.

1 Tingnan angpagsasaayos sa laki ng sample.

3 Maaaring tumugma ang mga talahanayan sa isang ulat o maraming ulat. Maaaring maglaman ang mga talahanayan ng isang dimensyon (hal., Keyword) o maraming dimensyon (hal., Ad Group at Campaign). Sa pinakadetalyadong antas, maglalaman ang mga ulat ng hanggang 50K row ng data (75k pra sa Premium).

3 Ayon sa natukoy ng nauugnay na sukatan para sa ulat/talahanayan (hal. # (na) session, # (na) kaganapan, # (na) page view, # (na) transaksyon).

Gaano kapaki-pakinabang ang artikulong ito:

Na-record ang feedback. Salamat!
  • Hindi talaga kapaki-pakinabang
  • Hindi masyadong kapaki-pakinabang
  • Medyo kapaki-pakinabang
  • Talagang kapaki-pakinabang
  • Lubos na kapaki-pakinabang