BigQuery ऐसा डेटा वेयरहाउस है जिसे Google पूरी तरह से मैनेज करता है. इसमें पेटाबाइट स्केल पर और कम-लागत में डेटा विश्लेषण की सुविधा मिलती है. Looker Studio BigQuery कनेक्टर की मदद से, Looker Studio में BigQuery टेबल का डेटा ऐक्सेस किया जा सकता है.
इस लेख में इन विषयों के बारे में बताया गया है:- शुरू करने से पहले कुछ अहम जानकारी
- BigQuery से कनेक्ट करने का तरीका
- किसी BigQuery टेबल या व्यू से कनेक्ट करना
- कस्टम एसक्यूएल क्वेरी का इस्तेमाल करके किसी BigQuery से कनेक्ट करना
- BigQuery नेटिव इंटिग्रेशन
- कई दिनों के आंकड़े दिखाने वाली टेबल
- BigQuery में की गई एसक्यूएल क्वेरी देखना
- रिकॉर्ड काउंट मेट्रिक
- वीपीसी सर्विस कंट्रोल से जुड़ी सहायता
- BigQuery GEOGRAPHY पॉलीगॉन को विज़ुअलाइज़ करना
- जॉब लेबल की मदद से Looker Studio की क्वेरी की पहचान करना
- क्वेरी की परफ़ॉर्मेंस वाला डायलॉग
- कोटा और सामान्य सीमाएं
- इसी विषय से जुड़े लिंक
शुरू करने से पहले कुछ अहम जानकारी
Looker Studio में BigQuery डेटा को ऐक्सेस करने के लिए, आपको Google Cloud बिलिंग खाते की जानकारी देनी होगी. BigQuery, पैसे देकर इस्तेमाल किए जाने वाला प्रॉडक्ट है. इसलिए, Looker Studio के ज़रिए BigQuery के डेटा को ऐक्सेस करने पर आपको शुल्क देना पड़ सकता है. BigQuery के अलग-अलग प्लान के बारे में ज़्यादा जानें.
BigQuery से कनेक्ट करने का तरीका
Google BigQuery में Looker Studio को किसी टेबल, व्यू या कस्टम क्वेरी से कनेक्ट किया जा सकता है.
कनेक्ट करने का तरीका
- Looker Studio में साइन इन करें.
- बनाएं पर क्लिक करें. इसके बाद, रिपोर्ट चुनें.
- इसके बाद, रिपोर्ट एडिटर दिखेगा. इसमें रिपोर्ट में डेटा जोड़ें पैनल खुलेगा.
- एम्बेड किया गया नया डेटा सोर्स बनाने के लिए, BigQuery कनेक्टर चुनें.
-
फिर से इस्तेमाल किए जा सकने वाले मौजूदा डेटा सोर्स को चुनने के लिए, मेरे डेटा सोर्स टैब पर क्लिक करें. इसके बाद, कोई ऐसा डेटा सोर्स चुनें जिसे आपने बनाया है या जो आपके साथ शेयर किया गया है.
एम्बेड किए गए डेटा सोर्स और फिर से इस्तेमाल किए जा सकने वाले डेटा सोर्स के बीच अंतर के बारे में जानकारी
डेटा सोर्स या तो एम्बेड किए गए हो सकते हैं या ऐसे हो सकते हैं जिनका फिर से इस्तेमाल किया जा सके. रिपोर्ट में, एम्बेड किए गए और फिर से इस्तेमाल किए जा सकने वाले, दोनों डेटा सोर्स शामिल हो सकते हैं.
किसी रिपोर्ट में बदलाव करते समय बनाए गए डेटा सोर्स, रिपोर्ट में एम्बेड होते हैं. एम्बेड किए गए डेटा सोर्स में बदलाव करने के लिए, उसी रिपोर्ट में जाएं. एम्बेड किए गए डेटा सोर्स की मदद से, रिपोर्ट और डेटा सोर्स पर साथ मिलकर काम करना आसान हो जाता है. जिस भी व्यक्ति के पास रिपोर्ट में बदलाव करने की अनुमति है उसके पास डेटा सोर्स में बदलाव करने के साथ-साथ उसका कनेक्शन बदलने की भी अनुमति होती है. रिपोर्ट को शेयर या कॉपी करने पर, एम्बेड किए गए डेटा सोर्स भी शेयर या कॉपी हो जाते हैं.
होम पेज से बनाए गए डेटा सोर्स, फिर से इस्तेमाल किए जा सकते हैं. इन डेटा सोर्स का इस्तेमाल, अलग-अलग रिपोर्ट में फिर से किया जा सकता है. फिर से इस्तेमाल किए जा सकने वाले डेटा सोर्स का इस्तेमाल करके, पूरे संगठन में एक जैसा डेटा मॉडल बनाया और शेयर किया जा सकता है. इस डेटा सोर्स में बदलाव सिर्फ़ वे लोग कर सकते हैं जिनके साथ आपने फिर से इस्तेमाल होने वाले डेटा सोर्स को शेयर किया है. कनेक्शन में बदलाव करने का विकल्प सिर्फ़ डेटा सोर्स के मालिक के पास होता है.
डेटा सोर्स के बारे में ज़्यादा जानें.
-
-
अपने BigQuery डेटा के साथ डेटा सोर्स के कनेक्शन को कॉन्फ़िगर करें. BigQuery टेबल या व्यू से कनेक्ट किया जा सकता है या कस्टम एसक्यूएल क्वेरी का इस्तेमाल करके कनेक्ट किया जा सकता है.
- जोड़ें पर क्लिक करें.
कुछ ही समय में, डेटा सोर्स से कनेक्ट की गई टेबल, रिपोर्ट कैनवस पर दिखने लगती है.
क्या आपके लिए Looker Studio एक नया प्रॉडक्ट है?
टेबल का डेटा और स्टाइल बदलने के लिए, प्रॉपर्टी पैनल का इस्तेमाल करें. अपनी रिपोर्ट में ज़्यादा चार्ट, कंट्रोल, और अन्य कॉम्पोनेंट जोड़ने के लिए, टूलबार का इस्तेमाल करें.
Looker Studio के बारे में जानें
- रिपोर्ट बनाने का ट्यूटोरियल देखें.
- रिपोर्ट एडिटर के बारे में जानें.
किसी BigQuery टेबल या व्यू से कनेक्ट करना
BigQuery टेबल में, लाइनों में अलग-अलग रिकॉर्ड होते हैं. हर रिकॉर्ड में कई कॉलम होते हैं, जिन्हें फ़ील्ड भी कहा जाता है. BigQuery व्यू एक वर्चुअल टेबल है, जिसे BigQuery कंसोल में एक्ज़ीक्यूट की जाने वाली एसक्यूएल क्वेरी से तय किया जाता है.
किसी टेबल या व्यू से कनेक्ट करने के लिए, आपको यह जानकारी देनी होगी:
- BigQuery प्रोजेक्ट
- डेटासेट
- टेबल या व्यू
प्रोजेक्ट
प्रोजेक्ट का इस्तेमाल करके, आपको BigQuery संसाधनों को व्यवस्थित करने में मदद मिलती है. साथ ही, ये BigQuery के मुफ़्त कोटे की संख्या से ज़्यादा रिपोर्ट होने की स्थिति में कितना शुल्क चुकाना है, इसकी सही-सही जानकारी भी देते हैं. बिलिंग और डेटा मैनेजमेंट, दोनों के लिए एक ही प्रोजेक्ट का इस्तेमाल किया जा सकता है. इसके अलावा, किसी दूसरे प्रोजेक्ट की बिलिंग करते समय, डेटा के लिए अलग प्रोजेक्ट का इस्तेमाल किया जा सकता है. Google Cloud के प्रोजेक्ट के बारे में ज़्यादा जानें.
अपना प्रोजेक्ट चुनने के लिए, इनमें से कोई एक विकल्प चुनें:
- हाल ही में देखे गए प्रोजेक्ट
- मेरे प्रोजेक्ट
- शेयर किए गए प्रोजेक्ट
हाल ही में देखे गए प्रोजेक्ट
हाल ही में देखे गए प्रोजेक्ट विकल्प से, आपको वे प्रोजेक्ट दिखते हैं जिन्हें आपने हाल ही में Google Cloud Console में ऐक्सेस किया है. आपके पास मैन्युअल तरीके से भी प्रोजेक्ट आईडी डालने का विकल्प है. आपने जिस प्रोजेक्ट को चुना है उसका इस्तेमाल बिलिंग और डेटा ऐक्सेस, दोनों के लिए किया जाएगा. प्रोजेक्ट चुनने के बाद, आपको एक डेटासेट चुनना होगा.
मेरे प्रोजेक्ट
मेरे प्रोजेक्ट विकल्प की मदद से, वह प्रोजेक्ट चुना जा सकता है जिसका ऐक्सेस आपके पास है. आपके पास मैन्युअल तरीके से भी प्रोजेक्ट आईडी डालने का विकल्प होता है. आपने जिस प्रोजेक्ट को चुना है उसका इस्तेमाल बिलिंग और डेटा के ऐक्सेस, दोनों के लिए किया जाएगा. प्रोजेक्ट चुनने के बाद, आपको एक डेटासेट चुनना होगा.
शेयर किए गए प्रोजेक्ट
शेयर किए गए प्रोजेक्ट विकल्प की मदद से, वह प्रोजेक्ट ऐक्सेस किया जा सकता है जो आपके साथ शेयर किया गया है. अगर आप चाहें, तो डेटा और बिलिंग के लिए अलग-अलग प्रोजेक्ट चुनें.
डेटासेट
डेटासेट का इस्तेमाल, आपके डेटा के ऐक्सेस को मैनेज करने और व्यवस्थित करने के लिए किया जाता है. सूची में से कोई डेटासेट चुनें या डेटासेट को नाम से खोजें.
सार्वजनिक डेटासेट
BigQuery के सार्वजनिक डेटासेट, सार्वजनिक सैंपल होते हैं. इनमें डेटासेट शेयर किया जाता है, लेकिन प्रोजेक्ट शेयर नहीं किया जाता. इस डेटा की क्वेरी के लिए, आपको अपना बिलिंग प्रोजेक्ट चुनना होगा. इसका इस्तेमाल, शेयर किए गए डेटा के प्रोसेसिंग शुल्क का बिल बनाने के लिए किया जाएगा.
टेबल
Looker Studio के डेटा सोर्स को किसी टेबल या व्यू से कनेक्ट किया जा सकता है.
तारीख के हिसाब से सेगमेंट में बांटी गई टेबल से कनेक्ट करना
BigQuery में तारीख के हिसाब से सेगमेंट में बांटी गई टेबल का फ़ायदा, Looker Studio को मिल सकता है. जब किसी ऐसी टेबल से कनेक्ट किया जाता है जिसे DATE
, DATETIME
या TIMESTAMP
फ़ील्ड के आधार पर बांटा गया है, तो Looker Studio उस फ़ील्ड का इस्तेमाल, इस डेटा सोर्स पर आधारित चार्ट के लिए तारीख की सीमा वाले डाइमेंशन के तौर पर कर सकता है. इस विकल्प को चालू करने के लिए, डेटा सोर्स कनेक्शन पेज के कॉन्फ़िगरेशन कॉलम में दिखने वाले fieldname को तारीख की सीमा वाले डाइमेंशन के तौर पर इस्तेमाल करें चेकबॉक्स को चुनें.
BigQuery में मौजूद, तारीख के हिसाब से सेगमेंट में बांटी गई टेबल के बारे में ज़्यादा जानें.
कस्टम एसक्यूएल क्वेरी का इस्तेमाल करके किसी BigQuery से कनेक्ट करना
कस्टम क्वेरी विकल्प की मदद से, एसक्यूएल लिखकर अपने डेटा से कनेक्ट किया जा सकता है. कस्टम क्वेरी सिंटैक्स, स्टैंडर्ड एसक्यूएल भाषा का पालन करता है. लेगसी BigQuery एसक्यूएल भाषा का इस्तेमाल करने के लिए, लेगसी एसक्यूएल का इस्तेमाल करें विकल्प चुनें.
सलाह: अपनी क्वेरी लिखने और उसकी जांच करने के लिए, BigQuery यूज़र इंटरफ़ेस का इस्तेमाल करें. इसके बाद, उस क्वेरी को कॉपी करके Looker Studio के कस्टम क्वेरी बॉक्स में चिपकाएं.
बिलिंग प्रोजेक्ट
बिलिंग प्रोजेक्ट विकल्प की मदद से, अपनी कस्टम क्वेरी के लिए बिलिंग प्रोजेक्ट उपलब्ध कराया जा सकता है. इसके लिए, प्रोजेक्ट आईडी खोजें या उसे मैन्युअल तरीके से डालें. अगर आपके संगठनों में कई BigQuery प्रोजेक्ट हैं, तो प्रोजेक्ट का पता लगाने के लिए आपको मैन्युअल तरीके से प्रोजेक्ट आईडी डालना पड़ सकता है.
अगर आपको एक प्रोजेक्ट का इस्तेमाल बिलिंग और दूसरे का इस्तेमाल डेटा के लिए करना है, तो यूज़र इंटरफ़ेस में बिलिंग प्रोजेक्ट चुनें या डालें. इसके बाद, डेटा प्रोजेक्ट को कस्टम क्वेरी के SELECT...FROM
क्लॉज़ में शामिल करें.
क्वेरी पैरामीटर
पैरामीटर की मदद से, ज़्यादा रिस्पॉन्सिव और अपनी ज़रूरत के मुताबिक रिपोर्ट बनाई जा सकती हैं. BigQuery डेटा सोर्स में मौजूद पैरामीटर, मौजूदा क्वेरी में वापस भेजे जा सकते हैं. अगर आपको अपनी कस्टम क्वेरी में किसी पैरामीटर का इस्तेमाल करना है, तो BigQuery में पैरामीटर वाली क्वेरी चलाने के लिए दिए गए सिंटैक्स के दिशा-निर्देशों का पालन करें.
कस्टम क्वेरी में पैरामीटर इस्तेमाल करने के बारे में ज़्यादा जानें.
कस्टम क्वेरी की सीमाएं
Looker Studio, डेटाबेस के लिए जनरेट की गई हर क्वेरी के लिए आपके कस्टम एसक्यूएल का इस्तेमाल, अंदरूनी स्टेटमेंट के रूप में करता है. इसका मतलब है कि आपकी कस्टम क्वेरी, एक नई वर्चुअल टेबल जनरेट करती है. इसके बाद, Looker Studio उस टेबल के लिए, खुद जनरेट किए गए "आउटर" एसक्यूएल का इस्तेमाल करके क्वेरी करता है. इस वजह से, Looker Studio में कस्टम क्वेरी पर कुछ पाबंदियां लागू होती हैं:
कस्टम एसक्यूएल क्वेरी में सिर्फ़ एक स्टेटमेंट हो सकता है
उदाहरण के लिए, यहां दी गई क्वेरी काम नहीं करेगी, क्योंकि इसमें कई एसक्यूएल स्टेटमेंट हैं:
DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;
SELECT total_bytes_billed / (1024 * 1024))* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;
जॉइन में साफ़ तौर पर फ़ील्ड के नाम इस्तेमाल करना
कस्टम जॉइन क्वेरी में, डुप्लीकेट नाम वाले कॉलम हैंडल नहीं किए जा सकते. डुप्लीकेट फ़ील्ड वाली कस्टम क्वेरी के आधार पर डेटा सोर्स का इस्तेमाल करने वाले चार्ट, उपयोगकर्ता कॉन्फ़िगरेशन से जुड़ी इस तरह की गड़बड़ी दिखाएंगे:
अगर आपको इस तरह की समस्या से बचना है, तो अपनी कस्टम क्वेरी में फ़ील्ड के लिए ऐसे नामों का इस्तेमाल करें जिनसे यह साफ़ तौर पर पता चलता हो कि वे किस डेटा से जुड़े हैं.
उदाहरण के लिए, मान लें कि आपको एक जैसी स्कीमा वाली दो टेबल को जोड़ना है. इसके लिए, दोनों टेबल में मौजूद Criteria_ID
फ़ील्ड जोड़ें. ऐसा करने का तरीका यहां बताया गया है:
SELECT * FROM ( SELECT Criteria_ID, Parent_ID, Name FROM 'table_1' ) As table_1 LEFT JOIN ( SELECT Criteria_ID, Parent_ID, Name FROM 'table_2' ) As table_2 ON table_1.Criteria_ID = table_2.Criteria_ID
इस क्वेरी में, डुप्लीकेट नाम वाले कॉलम शामिल हैं:
Criteria_ID
, Parent_ID
, और Name
.
"फ़ील्ड से जुड़ी जानकारी साफ़ तौर पर नहीं दी गई है" गड़बड़ी से बचने के लिए, AS
का इस्तेमाल करके, एक जैसे नाम वाले फ़ील्ड के नाम बदले जा सकते हैं:
SELECT * FROM ( SELECT Criteria_ID AS Criteria_ID_1, Parent_ID AS Parent_ID_1, Name AS NAME_1 FROM 'table_1' ) AS table_1 LEFT JOIN ( SELECT Criteria_ID AS Criteria_ID_2, Parent_ID AS Parent_ID_2, Name AS NAME_2 FROM 'table_2' ) AS table_2 ON table_1.Criteria_ID_1 = table_2.Criteria_ID_2;
अगर आपको सिर्फ़ कुछ फ़ील्ड के नाम बदलने हैं, तो उन फ़ील्ड को छोड़कर बाकी सभी फ़ील्ड चुनें. उदाहरण के लिए:
क्वेरी का समय खत्म होना
- क्वेरी को आसान बनाएं, ताकि वह तेज़ी से काम करे.
- क्वेरी को अपने डेटाबेस में चलाएं और नतीजों को एक अलग टेबल में सेव करें. इसके बाद, अपने डेटा सोर्स को उस टेबल से कनेक्ट करें.
BigQuery नेटिव इंटिग्रेशन
Looker Studio में BigQuery नेटिव इंटिग्रेशन की सुविधा चालू करके, Looker Studio की क्वेरी के लिए मॉनिटरिंग की सुविधाएं चालू की जा सकती हैं. साथ ही, क्वेरी की परफ़ॉर्मेंस को बेहतर बनाया जा सकता है और BigQuery की कई सुविधाओं का इस्तेमाल किया जा सकता है.
कई दिनों के आंकड़े दिखाने वाली टेबल
BigQuery की मदद से कई टेबल में क्वेरी की जा सकती है, जिसमें हर टेबल में सिर्फ़ एक दिन का डेटा होता है. टेबल का फ़ॉर्मैट YYYYMMDD होता है. जब Looker Studio को YYYYMMDD फ़ॉर्मैट वाली कोई टेबल मिलेगी, तो उस टेबल को कई दिनों के आंकड़े दिखाने वाली एक टेबल के तौर पर माना जाएगा. साथ ही, टेबल चुनने के दौरान सिर्फ़ नाम का शुरुआती prefix_YYYYMMDD दिखेगा.
इस टेबल को दिखाने के लिए कोई चार्ट बनाए जाने पर, Looker Studio पिछले 28 दिनों की तारीख की डिफ़ॉल्ट सीमा अपने-आप बना देगा और पिछली 28 टेबल के लिए ठीक से क्वेरी करेगा. इस सेटिंग को कॉन्फ़िगर करने के लिए, सबसे पहले रिपोर्ट में बदलाव करें और चार्ट चुनें. इसके बाद, चार्ट के डेटा टैब में, तारीख की सीमा वाली प्रॉपर्टी को अडजस्ट करें.
BigQuery में की गई एसक्यूएल क्वेरी देखना
BigQuery के क्वेरी इतिहास वाले यूज़र इंटरफ़ेस में, Looker Studio से जनरेट किए गए सभी BigQuery एसक्यूएल देखे जा सकते हैं.
रिकॉर्ड काउंट मेट्रिक
BigQuery के डेटा सोर्स से आपको अपने-आप डिफ़ॉल्ट रिकॉर्ड काउंट मेट्रिक मिलती है. अपने डाइमेंशन को अलग-अलग सेगमेंट में बांटने के लिए इसका इस्तेमाल किया जा सकता है, ताकि आप अपने चार्ट से इकट्ठा किए गए रिकॉर्ड की संख्या देख सकें.
VPC सर्विस कंट्रोल से जुड़ी सहायता
Looker Studio, व्यूअर के आईपी पते पर आधारित ऐक्सेस लेवल के ज़रिए, वीपीसी सर्विस कंट्रोल (वीपीसी-एससी) पेरीमीटर की सुरक्षा वाले BigQuery प्रोजेक्ट से कनेक्ट कर सकता है. BigQuery कनेक्टर, रिपोर्ट व्यूअर का आईपी पता BigQuery को पास करता है. ऐसा होने के बाद BigQuery, आईपी-आधारित वह ऐक्सेस लेवल लागू करता है जो उस आईपी पते के लिए सेट अप किया गया है.
BigQuery GEOGRAPHY पॉलीगॉन को विज़ुअलाइज़ करना
अपनी रिपोर्ट में Google Maps विज़ुअलाइज़ेशन का इस्तेमाल करके जियोग्राफ़ी पॉलीगॉन दिखाए जा सकते हैं. ट्यूटोरियल के लिए, Looker Studio का इस्तेमाल करके, BigQuery के जियोग्राफ़ी पॉलीगॉन दिखाना लेख पढ़ें.
जॉब लेबल की मदद से Looker Studio की क्वेरी की पहचान करना
Looker Studio से BigQuery को भेजी गई सभी क्वेरी में, BigQuery जॉब लेबल requestor:looker_studio
शामिल होता है. इस जॉब लेबल का इस्तेमाल करके, Looker Studio से जुड़ी BigQuery की क्वेरी की पहचान की जा सकती है. निर्देशों के लिए, जॉब लेबल देखना पर जाएं.
अगर आपके पास BigQuery के डेटा सोर्स का मालिकाना हक है, तो BigQuery की मदद से आइकॉन पर क्लिक करके भी जॉब की जानकारी देखी जा सकती है.
क्वेरी की परफ़ॉर्मेंस वाला डायलॉग
क्वेरी की परफ़ॉर्मेंस डायलॉग बॉक्स खोलने के लिए, BigQuery का इस्तेमाल करने वाले चार्ट के ऊपर दाएं कोने में मौजूद लाइटनिंग बोल्ट वाले आइकॉन पर क्लिक करें. डायलॉग बॉक्स में, BigQuery जॉब आईडी के साथ-साथ BigQuery जॉब की जानकारी वाले पेज का लिंक दिखता है.
डायलॉग बॉक्स में, इनमें से कोई एक स्टेटस मैसेज भी दिखता है:
- क्वेरी को BigQuery कैश मेमोरी से दिखाया गया.
- बीआई इंजन की मदद से क्वेरी की प्रोसेसिंग की स्पीड बढ़ाई गई.
- BigQuery के बीआई इंजन की मदद से, क्वेरी की प्रोसेसिंग की स्पीड नहीं बढ़ाई गई.
- इस मामले में, डायलॉग बॉक्स में उन एलिमेंट की सूची भी दिखती है जो क्वेरी की प्रोसेसिंग की स्पीड के लिए ज़रूरी हैं.
कोटा और सामान्य सीमाएं
BigQuery कनेक्टर का इस्तेमाल करके, ज़्यादा से ज़्यादा 20 लाख लाइनें दिखाई जा सकती हैं. डेटा की 20 लाख से ज़्यादा लाइनें होने पर, Looker Studio आपको इस बारे में सूचना देगा. हालांकि, लाइनों की संख्या नहीं बताई जाएगी.
इसके अलावा, BigQuery पर लागू होने वाली सीमाएं, BigQuery के डेटा सोर्स पर भी लागू होती हैं. जैसे, अनुरोध संख्या और कोटा की सीमाएं.
BigQuery डेटा सोर्स के लिए, MEDIAN
को BigQuery APPROX_QUANTILES फ़ंक्शन का इस्तेमाल करके लागू किया जाता है. BigQuery से मिलने वाले डेटा पर MEDIAN
लागू करने से, दूसरी तरह के डेटा सोर्स से मिलने वाले उसी डेटा पर MEDIAN
लागू करने की तुलना में, थोड़े अलग नतीजे मिल सकते हैं.