complete guide big data analytics
यह बिग डेटा एनालिटिक्स के लिए एक व्यापक मार्गदर्शिका है जिसके उपयोग के मामले, वास्तुकला, उदाहरण और बिग डेटा और डेटा साइंस के साथ तुलना है:
बिग डेटा एनालिटिक्स ने कर्षण प्राप्त कर लिया है क्योंकि फेसबुक, Google और अमेज़ॅन जैसे निगमों ने बड़े डेटा से मूल्य निष्कर्षण के लिए अपने ग्राहक की भविष्यवाणियों को समझने के लिए वितरित डेटा प्रोसेसिंग और एनालिटिक्स के अपने नए प्रतिमान स्थापित किए हैं।
इस ट्यूटोरियल में, हम बड़े डेटा एनालिटिक्स की व्याख्या करते हैं और इसकी तुलना बिग डेटा और डेटा साइंस से करते हैं। हम उन आवश्यक विशेषताओं को कवर करेंगे जो व्यवसायों को अपनी बड़ी डेटा रणनीति और कार्य करने की कार्यप्रणाली में होनी चाहिए। हम नवीनतम रुझानों और डेटा एनालिटिक्स के कुछ उपयोग मामलों का भी उल्लेख करेंगे।
जैसा कि नीचे की छवि में दिखाया गया है, Analytics को IT कौशल, व्यावसायिक कौशल और डेटा विज्ञान का उपयोग करने की आवश्यकता होती है। बिग डेटा एनालिटिक्स बड़े डेटा से मूल्यों का उपयोग करने के केंद्र में है, और यह एक संगठन के लिए उपभोज्य अंतर्दृष्टि प्राप्त करने में मदद करता है।
(छवि स्रोत )
आप क्या सीखेंगे:
- बिग डेटा एनालिटिक्स क्या है
- निष्कर्ष
बिग डेटा एनालिटिक्स क्या है
बिग डेटा एनालिटिक्स, बिग डेटा के लिए सांख्यिकीय तकनीकों, टूल और एनालिटिक्स की प्रक्रियाओं के संग्रह के उपयोग से संबंधित है।
सिफारिश की पढ़ना => बिग डेटा का परिचय
यह एनालिटिक्स है जो डेटा के नेतृत्व वाले निर्णय लेने के समर्थन के लिए बड़े डेटा से मूल्यवान पैटर्न और सार्थक अंतर्दृष्टि निकालने में मदद करता है। यह सोशल मीडिया, और IoT डेटा जैसे नए डेटा स्रोतों के उभरने के कारण है कि बड़े डेटा और एनालिटिक्स लोकप्रिय हो गए हैं।
यह प्रवृत्ति 'डेटा साइंस' नामक अभ्यास और अध्ययन के क्षेत्र को जन्म दे रही है, जिसमें डेटा खनन, सफाई, मॉडलिंग और विज़ुअलाइज़ेशन के लिए तकनीकों, उपकरणों, तकनीकों और प्रक्रियाओं को शामिल किया गया है।
बिग डेटा बनाम बिग डेटा एनालिटिक्स बनाम डेटा साइंस
सेवा मेरे बड़े डेटा, डेटा साइंस और बड़े डेटा एनालिटिक्स के बीच तुलना नीचे दी गई तालिका से समझा जा सकता है।
बेसिस | बड़ा डेटा | डाटा साइंस | बिग डेटा एनालिटिक्स |
---|---|---|---|
उपकरण और प्रौद्योगिकी | Hadoop Ecosystem, CDH, Cassandra, MongoDB, Java, Python, Talend, SQL, Rapid Miner | आर, पायथन, जुपाइटर, डेटा साइंस कार्यक्षेत्र, आईबीएम एसपीएसएस, झांकी | स्पार्क, स्टॉर्म, नाइम, डेटा रैपर, लुमिज़, एचपीसीसी, क्यूबोल, माइक्रोसॉफ्ट एचडीआईनाइट |
काम भूमिकाओं और कौशल | भंडारण अवसंरचना रखरखाव, डाटा प्रोसेसिंग, और Hadoop पर ज्ञान और अन्य उपकरणों के साथ इसका एकीकरण। | डेटा परिवर्तन, डेटा इंजीनियरिंग, डेटा क्रंदन, डेटा मॉडलिंग और विज़ुअलाइज़ेशन | BI और उन्नत Analytics, सांख्यिकी, डेटा मॉडलिंग और मशीन लर्निंग, गणित कौशल, संचार, परामर्श। |
पदनाम | बिग डेटा आर्किटेक्ट बिग डेटा डेवलपर बिग डाटा इंजीनियर | आँकड़े वाला वैज्ञानिक मशीन लर्निंग इंजीनियर | बिग डेटा विश्लेषक व्यापार विश्लेषक बिजनेस इंटेलिजेंस इंजीनियर व्यापार विश्लेषिकी विशेषज्ञ डेटा विज़ुअलाइज़ेशन डेवलपर एनालिटिक्स मैनेजर |
लगभग। यूएसडी में औसत वार्षिक वेतन | 100,000 है | 90,000 रु | 70,000 रु |
पठन पाठन = >> डाटा साइंस बनाम कंप्यूटर साइंस
क्या हर बिग डेटा एनालिटिक्स रणनीति होनी चाहिए
एक अच्छी तरह से परिभाषित, एकीकृत और व्यापक रणनीति एक संगठन में मूल्यवान डेटा-संचालित निर्णय लेने में योगदान देती है और समर्थन करती है। इस खंड में, हमने सबसे महत्वपूर्ण चरणों को सूचीबद्ध किया है जिन्हें एक बड़ी डेटा एनालिटिक्स रणनीति को परिभाषित करते समय विचार करने की आवश्यकता है।
चरण 1: मूल्यांकन
एक मूल्यांकन, पहले से ही व्यावसायिक उद्देश्यों के साथ गठबंधन, प्रमुख हितधारकों को शामिल करने की आवश्यकता है, सही कौशल सेट के साथ सदस्यों की एक टीम बनाएं, नीतियों, लोगों, प्रक्रिया और प्रौद्योगिकी और डेटा परिसंपत्तियों का मूल्यांकन करें। यदि आवश्यक हो, तो कोई इस प्रक्रिया में मूल्यांकन किए गए ग्राहकों को शामिल कर सकता है।
चरण 2: प्राथमिकता
मूल्यांकन के बाद, किसी को उपयोग के मामलों को प्राप्त करने की आवश्यकता है, उन्हें बड़े डेटा प्रेडिक्टिव एनालिटिक्स, प्रिस्क्रिप्टिव एनालिटिक्स और कॉग्निटिव एनालिटिक्स का उपयोग करके प्राथमिकता दें। आप प्राथमिकता वाले मैट्रिक्स जैसे टूल का भी उपयोग कर सकते हैं और प्रमुख हितधारकों से फीडबैक और इनपुट की मदद से उपयोग के मामलों को आगे फ़िल्टर कर सकते हैं।
चरण 3: रोडमैप
इस चरण में, समयबद्ध रोडमैप बनाना और उसे सभी के लिए प्रकाशित करना आवश्यक है। एक रोडमैप में जटिलताओं, फंड, उपयोग के मामलों के निहित लाभ और मैप किए गए प्रोजेक्ट के बारे में सभी विवरण शामिल करने की आवश्यकता है।
चरण 4: प्रबंधन बदलें
परिवर्तन प्रबंधन को लागू करने के लिए डेटा उपलब्धता, अखंडता, सुरक्षा और प्रयोज्य का प्रबंधन करने की आवश्यकता होती है। एक प्रभावी परिवर्तन प्रबंधन कार्यक्रम, किसी भी मौजूदा डेटा शासन का उपयोग करते हुए, गतिविधियों को प्रोत्साहित करता है, और निरंतर निगरानी के आधार पर सदस्य।
चरण 5: सही कौशल सेट
उद्योग में वर्तमान रुझानों के बीच संगठन की सफलता के लिए सही कौशल सेट की पहचान करना महत्वपूर्ण है। इसलिए, एक को सही नेताओं का पालन करने और महत्वपूर्ण हितधारकों को शिक्षित करने के लिए शैक्षिक कार्यक्रम लाने की आवश्यकता है।
चरण 6: विश्वसनीयता, स्केलेबिलिटी और सुरक्षा
सही दृष्टिकोण और प्रभावी बड़ी डेटा एनालिटिक्स रणनीति एनालिटिक्स प्रक्रिया को विश्वसनीय बनाती है, जिसमें डेटा विज्ञान सिद्धांतों को शामिल करने वाले व्याख्यात्मक मॉडल का प्रभावी उपयोग होता है। एक बड़ी डेटा एनालिटिक्स रणनीति के लिए एक मजबूत और कसकर एकीकृत एनालिटिक्स पाइपलाइन के लिए शुरुआत से ही सुरक्षा के पहलुओं को शामिल करना आवश्यक है।
डेटा पाइपलाइन और डेटा एनालिटिक्स के लिए प्रक्रिया
डेटा एनालिटिक्स पाइपलाइन की योजना बनाते समय, तीन मूलभूत पहलुओं पर विचार करना होगा। ये इस प्रकार हैं:
- इनपुट: डेटा स्वरूप और प्रक्रिया के लिए प्रौद्योगिकी का चयन, यह डेटा की अंतर्निहित प्रकृति पर आधारित है .i.e क्या डेटा समय-श्रृंखला और गुणवत्ता है।
- आउटपुट: कनेक्टर्स की पसंद , रिपोर्ट, और विज़ुअलाइज़ेशन एंड-यूज़र्स की तकनीकी विशेषज्ञता और उनकी डेटा खपत आवश्यकताओं पर निर्भर करता है।
- आयतन: स्केलिंग समाधान बड़े डेटा प्रोसेसिंग सिस्टम पर ओवरलोडिंग से बचने के लिए डेटा की मात्रा के आधार पर योजना बनाई जाती है।
अब एक सामान्य प्रक्रिया और एक बड़े डेटा एनालिटिक्स पाइपलाइन के चरणों पर चर्चा करते हैं।
चरण 1: डेटा अंतर्ग्रहण
डेटा अंतर्ग्रहण डेटा पाइपलाइन में पहला और सबसे महत्वपूर्ण कदम है। यह डेटा के तीन पहलुओं पर विचार करता है।
- डेटा का स्रोत - यह बड़े डेटा पाइपलाइन की वास्तुकला की पसंद के बारे में महत्वपूर्ण है।
- डेटा की संरचना - धारावाहिकीकरण पाइपलाइन के पार सजातीय संरचना को बनाए रखने की कुंजी है।
- डेटा की सफाई - एनालिटिक्स गायब मानों और आउटलेर्स आदि जैसे मुद्दों के बिना डेटा के रूप में अच्छा है।
स्टेज 2: ईटीएल / वेयरहाउसिंग
अगला महत्वपूर्ण मॉड्यूल ETL (एक्सट्रैक्ट ट्रांसफॉर्म लोड) प्रदर्शन करने के लिए डेटा स्टोरेज टूल है। एक उचित डेटा केंद्र में डेटा भंडारण पर निर्भर करता है,
- हार्डवेयर
- प्रबंधन विशेषज्ञता
- बजट
(छवि स्रोत )
डेटा केंद्रों में ईटीएल / वेयरहाउसिंग के लिए कुछ समय परीक्षण किए गए उपकरण हैं:
- अपाचे होदोप
- अपाचे हाइव
- अपाचे लकड़ी की छत
- प्रेस्टो क्वेरी इंजन
Google, AWS, Microsoft Azure जैसी क्लाउड कंपनियां भुगतान के आधार पर ये उपकरण प्रदान करती हैं और प्रारंभिक पूंजी व्यय को बचाती हैं।
चरण 3: विश्लेषिकी और दृश्य
तेज क्वेरी पर हडोप की सीमा को ध्यान में रखते हुए, किसी को विश्लेषण प्लेटफार्मों और उपकरणों का उपयोग करने की आवश्यकता होती है जो परिणामों के आवश्यक दृश्य के साथ तेज और तदर्थ क्वेरी की अनुमति देते हैं।
>> अनुशंसित पढ़ना: बिग डेटा टूल्स
चरण 4: निगरानी
दृश्य उपकरण के साथ घूस, भंडारण और विश्लेषिकी के लिए एक बुनियादी ढांचा स्थापित करने के बाद, अगला कदम यह है कि निगरानी के लिए आईटी और डेटा निगरानी उपकरण हैं। इसमें शामिल है:
- CPU या GPU का उपयोग
- मेमोरी और संसाधन की खपत
- नेटवर्क
विचार करने लायक कुछ उपकरण हैं:
- दातादोग
- ग्राफाना
निगरानी उपकरण एक बड़े डेटा एनालिटिक्स पाइपलाइन में अपरिहार्य हैं और पाइपलाइन की गुणवत्ता और अखंडता की निगरानी में मदद करते हैं।
बिग डेटा एनालिटिक्स आर्किटेक्चर
नीचे दिए गए आर्किटेक्चर आरेख से पता चलता है कि आधुनिक प्रौद्योगिकियाँ Hadoop & Map-कम प्रसंस्करण, इन-मेमोरी एनालिटिक सिस्टम और वास्तविक समय के संचालन और निर्णय लेने के लिए संयुक्त परिणाम लाने के लिए वास्तविक और विश्लेषणात्मक डेटा स्रोतों का उपयोग कैसे करती हैं।
(छवि स्रोत )
डेटा एनालिटिक्स में वर्तमान रुझान
इस खंड में, हमने उद्योग में बड़े डेटा एनालिटिक्स के रुझानों को लागू करने या उनका पालन करने के लिए आवश्यक पहलुओं को सूचीबद्ध किया है।
(1) बिग डेटा स्रोत
बिग डेटा के मुख्य रूप से तीन स्रोत हैं। इन्हें नीचे सूचीबद्ध किया गया है:
- सामाजिक डेटा: सोशल मीडिया के उपयोग के कारण उत्पन्न डेटा। यह डेटा समझने में मदद करता है भावना तथा ग्राहकों का व्यवहार और मार्केटिंग एनालिटिक्स में उपयोगी हो सकता है।
- मशीन डेटा: यह डेटा IoT सेंसर का उपयोग करके औद्योगिक उपकरण और अनुप्रयोगों से कैप्चर किया गया है। यह समझने में मदद करता है लोगों का व्यवहार और अंतर्दृष्टि प्रदान करता है प्रक्रियाओं ।
- लेन-देन संबंधी डेटा: यह भुगतान आदेशों, चालान, प्राप्तियों, आदि के बारे में उपयोगकर्ताओं की ऑफ़लाइन और ऑनलाइन गतिविधियों दोनों के परिणामस्वरूप उत्पन्न होता है। इस तरह के डेटा की अधिकांश जरूरतें होती हैं। पूर्व प्रसंस्करण तथा सफाई इससे पहले कि यह विश्लेषिकी के लिए इस्तेमाल किया जा सके।
# 2) SQL / NoSQL डाटा स्टोरेज
जब पारंपरिक डेटाबेस या RDBMS के साथ तुलना की जाती है, तो NoSQL डेटाबेस बड़े डेटा एनालिटिक्स के लिए आवश्यक कार्यों के लिए बेहतर साबित होते हैं।
NoSQL डेटाबेस स्वाभाविक रूप से असंरचित डेटा के साथ काफी अच्छी तरह से निपट सकते हैं और महंगे स्कीमा संशोधनों, ऊर्ध्वाधर स्केलिंग और ACID गुणों के हस्तक्षेप तक सीमित नहीं हैं।
# 3) भविष्य कहनेवाला विश्लेषिकी
प्रिडिक्टिव एनालिटिक्स अनुकूलित अंतर्दृष्टि प्रदान करता है जो संगठनों को नए ग्राहक प्रतिक्रिया या खरीद और क्रॉस-सेल अवसरों को उत्पन्न करने के लिए नेतृत्व करता है। संगठन भविष्य के परिणामों की भविष्यवाणी करने और संभावित मुद्दों को रोकने के लिए ग्रेन्युलर स्तर पर व्यक्तिगत तत्वों पर भविष्यवाणियां करने के लिए भविष्य कहनेवाला विश्लेषण का उपयोग कर रहे हैं। यह आगे ऐतिहासिक डेटा के साथ संयुक्त है और प्रिस्क्रिप्टिव एनालिटिक्स में बदल गया है।
कुछ क्षेत्र जहां बड़े डेटा भविष्य कहे जाने वाले एनालिटिक्स का सफलतापूर्वक उपयोग किया गया है, वे हैं व्यवसाय, बाल संरक्षण, नैदानिक निर्णय समर्थन प्रणाली, पोर्टफोलियो भविष्यवाणी, अर्थव्यवस्था-स्तर की भविष्यवाणियां और हामीदारी।
# 4) डीप लर्निंग
बड़ा डेटा पारंपरिक कंप्यूटिंग के लिए भारी है। यह पता चलता है कि डेटा विश्लेषण की पारंपरिक मशीन सीखने की तकनीक डेटा की विविधता और मात्रा में वृद्धि के साथ प्रदर्शन से बाहर हो जाती है।
Analytics प्रारूप भिन्नताओं, अत्यधिक वितरित इनपुट स्रोतों, असंतुलित इनपुट डेटा और तेज़ गति से स्ट्रीमिंग डेटा के संबंध में चुनौतियों का सामना करता है, और डीप लर्निंग एल्गोरिदम इस तरह की चुनौतियों से काफी कुशलता से निपटते हैं।
डीप लर्निंग ने सिमेंटिक इंडेक्सिंग, भेदभावपूर्ण कार्यों का संचालन, सिमेंटिक इमेज और वीडियो टैगिंग, सामाजिक लक्ष्यीकरण, और वस्तु मान्यता, डेटा टैगिंग, सूचना पुनर्प्राप्ति और प्राकृतिक भाषा के क्षेत्रों में पदानुक्रमित बहु-स्तरीय शिक्षण दृष्टिकोणों में भी इसका प्रभावी उपयोग पाया है। प्रसंस्करण।
# 5) डेटा झीलों
विभिन्न डेटा सेट को विभिन्न प्रणालियों में संग्रहीत करना और उन्हें पारंपरिक डेटा प्रबंधन दृष्टिकोण के साथ एनालिटिक्स के लिए संयोजन करना महंगा साबित होता है और लगभग अप्रभावी होता है। इसलिए, संगठन डेटा झीलों का निर्माण कर रहे हैं, जो कार्रवाई के विश्लेषण के लिए अपने कच्चे, मूल प्रारूप में डेटा संग्रहीत करते हैं।
नीचे दी गई छवि बड़े डेटा आर्किटेक्चर में एक उदाहरण डेटा झील प्रदर्शित करती है।
(छवि स्रोत )
बिग डेटा एनालिटिक्स का उपयोग करता है
हमने नीचे कुछ प्रचलित उपयोग मामलों को सूचीबद्ध किया है:
(1) ग्राहक विश्लेषिकी
बिग डेटा एनालिटिक्स विभिन्न उद्देश्यों के लिए उपयोगी है, जैसे कि माइक्रो-मार्केटिंग, वन-टू-वन मार्केटिंग, फाइन-सेगमेंटेशन, और किसी व्यवसाय के ग्राहकों के लिए बड़े पैमाने पर अनुकूलन। ग्राहक अपने उत्पादों और सेवाओं को उत्पादों या सेवाओं की एक समान या अलग-अलग बिक्री को बेचने या क्रॉस-सेल करने के लिए अपने उत्पादों और सेवाओं को निजीकृत करने के लिए रणनीति बना सकते हैं।
# 2) ऑपरेशन एनालिटिक्स
ऑपरेशन एनालिटिक्स मौजूदा डेटा का लाभ उठाकर और मशीन और IoT डेटा के साथ समृद्ध करके समग्र निर्णय लेने और व्यवसाय के परिणामों को बेहतर बनाने में मदद करता है।
उदाहरण के लिए, हेल्थकेयर में बड़े डेटा एनालिटिक्स ने COVID-19 जैसी रोग महामारियों के लिए क्लिनिकल ट्रायल की निगरानी में सुधार करना, भविष्यवाणी करना और प्रतिक्रियाओं की योजना में सुधार करना, हेल्थकेयर खर्च के अनुकूलन से संबंधित चुनौतियों और नए अवसरों का सामना करना संभव बना दिया है।
# 3) धोखाधड़ी की रोकथाम
बिग डेटा एनालिटिक्स को मुख्य रूप से वित्तीय और बीमा क्षेत्रों में धोखाधड़ी के प्रयासों को प्रत्याशित और कम करने में मदद करके बड़े पैमाने पर लाभ देने की क्षमता के साथ देखा जाता है।
उदाहरण के लिए, बीमा कंपनियां डेमोग्राफी, कमाई, मेडिकल क्लेम, अटॉर्नी खर्च, मौसम, ग्राहक की वॉयस रिकॉर्डिंग और कॉल सेंटर नोट्स पर वास्तविक समय के डेटा को कैप्चर करती हैं। विशिष्ट वास्तविक समय विवरण प्रारंभिक डेटा को अनुमानित धोखाधड़ी के दावों की पहचान करने के लिए ऐतिहासिक डेटा के साथ ऊपर दी गई जानकारी के संयोजन से प्राप्त करने में मदद करते हैं।
# 4) मूल्य अनुकूलन
उत्पाद स्तर पर सर्वोत्तम मूल्य पाकर लाभ मार्जिन बढ़ाने के लिए कंपनियां बड़े डेटा एनालिटिक्स का उपयोग करती हैं, न कि श्रेणी स्तर पर। बड़ी कंपनियों को मूल्य निर्धारण चर के दानेदार विवरण और जटिलता प्राप्त करने के लिए बहुत भारी लगता है, जो हजारों उत्पादों के लिए नियमित रूप से बदलते हैं।
एक एनालिटिक्स से संचालित प्राइस ऑप्टिमाइजेशन रणनीति, जैसे डायनेमिक डील स्कोरिंग, कंपनियों को अपने डेटा के आधार पर उत्पादों और सेगमेंट के समूहों के लिए मूल्य निर्धारित करने की अनुमति देता है और मांग वाले ग्राहकों से त्वरित जीत हासिल करने के लिए व्यक्तिगत सौदे के स्तर पर अंतर्दृष्टि देता है।
बार बार पूछे जाने वाले प्रश्न
Q # 1) क्या बड़ा डेटा एनालिटिक्स एक अच्छा करियर है?
उत्तर: यह किसी भी संगठन के लिए एक अतिरिक्त मूल्य है, जो इसे सूचित निर्णय लेने और प्रतियोगियों पर बढ़त प्रदान करने की अनुमति देता है। बिग डेटा करियर के कदम से किसी संगठन के लिए महत्वपूर्ण निर्णय लेने की संभावना बढ़ जाती है।
Q # 2) बड़ा डेटा एनालिटिक्स क्यों महत्वपूर्ण है?
उत्तर: यह संगठनों को नए विकास के अवसरों और पूरी तरह से नई श्रेणियों के उत्पादों को बनाने में मदद करता है जो उद्योग डेटा को जोड़ और विश्लेषण कर सकते हैं। इन कंपनियों के पास उत्पादों और सेवाओं, खरीदारों और आपूर्तिकर्ताओं, उपभोक्ता वरीयताओं के बारे में पर्याप्त जानकारी है जिन्हें कैप्चर और विश्लेषण किया जा सकता है।
Q # 3) बड़े डेटा एनालिटिक्स के लिए क्या आवश्यक है?
उत्तर: प्रौद्योगिकियों की श्रेणी जो एक अच्छे बड़े डेटा विश्लेषक से परिचित होनी चाहिए, विशाल है। बिग डेटा एनालिटिक्स में मास्टर करने के लिए, विभिन्न उपकरणों, सॉफ्टवेयर, हार्डवेयर और प्लेटफॉर्म की समझ की आवश्यकता होती है। उदाहरण के लिए, स्प्रैडशीट, एसक्यूएल क्वेरी और आर / आर स्टूडियो, और पायथन कुछ बुनियादी उपकरण हैं।
एंटरप्राइज़ स्तर पर, MATLAB, SPSS, SAS और Congnos जैसे उपकरण लिनक्स, Hadoop, Java, Scala, Python, Spark, Hadoop और HIVE के अलावा महत्वपूर्ण हैं।
उद्देश्य प्रश्न:
Q # 4) नीचे दिया गया कौन सा डेटाबेस NoSQL डेटाबेस नहीं है?
- MongoDB
- PostgreSQL
- CouchDB
- HBase
उत्तर: PostgreSQL
Q # 5) क्या कैसंड्रा एक NoSQL है?
- सच
- असत्य
उत्तर: सच
Q # 6) हडोप की संपत्ति निम्नलिखित में से कौन नहीं है?
विंडोज 7 64 बिट के लिए सबसे अच्छा मुफ्त बैकअप सॉफ्टवेयर
- खुला स्त्रोत
- जावा पर आधारित
- वितरित प्रसंस्करण
- रियल टाइम
उत्तर: रियल टाइम
Q # 7) उन सभी गतिविधियों को चुनें जो डेटा साइंटिस्ट द्वारा नहीं की जाती हैं।
- मशीन लर्निंग मॉडल बनाएं और उनके प्रदर्शन में सुधार करें।
- विश्लेषण को मान्य करने के लिए सांख्यिकीय मॉडल का मूल्यांकन
- डेटा विज़ुअलाइज़ेशन टूल्स का उपयोग करके उन्नत विश्लेषणों को सारांशित करें
- आंतरिक टीमों और व्यावसायिक ग्राहकों के लिए तकनीकी विश्लेषण के परिणामों की प्रस्तुति
उत्तर: आंतरिक टीमों और व्यावसायिक ग्राहकों के लिए तकनीकी विश्लेषण के परिणामों की प्रस्तुति
आगे पढ़ना = >> डेटा विश्लेषक और डेटा वैज्ञानिक के बीच मुख्य अंतर
Q # 8) डेटा विश्लेषक द्वारा कौन सी गतिविधियाँ की जाती हैं?
- कच्चे डेटा को साफ और व्यवस्थित करें
- डेटा में दिलचस्प रुझान ढूँढना
- आसान व्याख्या के लिए डैशबोर्ड और विज़ुअलाइज़ेशन बनाएं
- ऊपर के सभी
उत्तर: ऊपर के सभी
Q # 9) डेटा इंजीनियर द्वारा निम्नलिखित में से कौन सा प्रदर्शन किया जाता है?
- मौजूदा डेटा एनालिटिक्स पाइपलाइन में नए डेटा स्रोतों का एकीकरण
- डेटा खपत के लिए एपीआई का विकास
- निरंतर प्रदर्शन के लिए सिस्टम की निगरानी और परीक्षण
- ऊपर के सभी
उत्तर: ऊपर के सभी
क्यू # 10) एनालिटिक्स के लिए डेटा प्रवाह का सही क्रम है
- डेटा स्रोत, डेटा तैयारी, डेटा परिवर्तन, एल्गोरिथम डिज़ाइन, डेटा विश्लेषण
- डेटा स्रोत, डेटा परिवर्तन, एल्गोरिथम डिज़ाइन, डेटा तैयारी, डेटा विश्लेषण
- डेटा स्रोत, एल्गोरिथम डिज़ाइन, डेटा तैयारी, डेटा परिवर्तन, डेटा विश्लेषण
- डेटा स्रोत, डेटा तैयारी, एल्गोरिथम डिज़ाइन, डेटा परिवर्तन, डेटा विश्लेषण
उत्तर: डेटा स्रोत, डेटा तैयारी, डेटा परिवर्तन, एल्गोरिथम डिज़ाइन, डेटा विश्लेषण
Q # 11) डेटा विश्लेषण एक रैखिक प्रक्रिया है।
- सच
- असत्य
उत्तर: असत्य
Q # 12) खोजपूर्ण विश्लेषण नहीं है
- उत्तर प्रारंभिक डेटा विश्लेषण प्रश्न विस्तार से
- डेटा सेट के साथ समस्याओं का निर्धारण करें
- प्रश्न के उत्तर का एक स्केच विकसित करें
- निर्धारित करें कि किसी प्रश्न का उत्तर देने के लिए डेटा सही है या नहीं
उत्तर: उत्तरप्रारंभिक डेटा विश्लेषण प्रश्न विस्तार से
Q # 13) भविष्यवाणी का प्रश्न एक अन्य नाम है जिसे एक इंफ़रेशनल प्रश्न का नाम दिया गया है।
- सच
- असत्य
उत्तर: असत्य
निष्कर्ष
हमने बड़े डेटा एनालिटिक्स के सबसे महत्वपूर्ण पहलुओं को कवर किया। हमने सबसे अधिक प्रचलित उपयोग के मामलों और बड़े डेटा एनालिटिक्स उद्योग के रुझानों को अधिकतम लाभ प्राप्त करने के लिए समझाया।
अनुशंसित पाठ
- 2021 में शीर्ष 7 सर्वश्रेष्ठ डेटा विश्लेषिकी कंपनियां (अद्यतित 2021 सूची)
- 2021 में टॉप 15 बिग डेटा टूल्स (बिग डेटा एनालिटिक्स टूल्स)
- संपूर्ण डेटा प्रबंधन के लिए 10 सर्वश्रेष्ठ डेटा विश्लेषण उपकरण (2021 सूची)
- टॉप 20 डेटा साइंस टूल्स 2021 में प्रोग्रामिंग को खत्म करना
- बिग डेटा ट्यूटोरियल शुरुआती के लिए | बिग डेटा क्या है?
- 2021 की शीर्ष 13 सर्वश्रेष्ठ बड़ी डेटा कंपनियां
- 10 सर्वश्रेष्ठ डेटा मॉडलिंग उपकरण जटिल डिजाइनों को प्रबंधित करने के लिए
- 2021 में अपने डेटा की आवश्यकता को पूरा करने के लिए 10+ सर्वश्रेष्ठ डेटा शासन उपकरण