data mart tutorial types
यह ट्यूटोरियल डेटा मार्ट को स्वीकार करता है जिसमें डेटा मार्ट कार्यान्वयन, प्रकार, संरचना और साथ ही डेटा वेयरहाउस या डेटा डेटा के बीच अंतर शामिल हैं:
इस में पूरा डाटा वेयरहाउस ट्रेनिंग सीरीज़ , हम विभिन्न पर एक नज़र था डेटा वेयरहाउस स्कीमा विस्तार से।
यह ट्यूटोरियल आपको सरल उदाहरणों के साथ डेटा मार्ट अवधारणाओं को विस्तार से जानने में मदद करेगा।
हम देखेंगे कि डेटा मार्ट क्या है? हमें डेटा मार्ट की आवश्यकता कब होती है? लागत प्रभावी डेटा मार्टिंग, डेटा मार्ट की लागत, डेटा मौसा के प्रकार, डेटा मार्ट को लागू करने में कदम, डेटा मार्ट की संरचना, पायलट डेटा मार्ट कब उपयोगी है? डेटा वेयरहाउस बनाम डेटा मार्ट के बीच डेटामार्ट कमियां और अंतर।
लक्षित दर्शक
- डेटा वेयरहाउस / ईटीएल डेवलपर्स और परीक्षक।
- डेटाबेस अवधारणाओं के बुनियादी ज्ञान के साथ डेटाबेस पेशेवर।
- डेटाबेस व्यवस्थापक / बिग डेटा विशेषज्ञ जो डेटा वेयरहाउस / ईटीएल अवधारणाओं को समझना चाहते हैं।
- कॉलेज के स्नातक / फ्रेशर्स जो डेटा वेयरहाउस नौकरियों की तलाश कर रहे हैं।
आप क्या सीखेंगे:
- डेटा मार्ट क्या है?
- डेटा वेयरहाउस बनाम डेटा मार्ट की तुलना
- डेटा मार्ट के प्रकार
- एक डेटा मार्ट के कार्यान्वयन कदम
- एक डेटा मार्ट की संरचना
- जब एक पायलट डेटा मार्ट उपयोगी है?
- डेटा मार्ट की कमियां
- निष्कर्ष
डेटा मार्ट क्या है?
डेटा मार्ट डेटा वेयरहाउस का एक छोटा सा हिस्सा है जो मुख्य रूप से किसी विशेष व्यवसाय डोमेन से संबंधित है जैसे कि मार्केटिंग (या) बिक्री आदि।
DW सिस्टम में संग्रहीत डेटा बहुत बड़ा है इसलिए डेटा मौसा को डेटा के सबसेट के साथ डिज़ाइन किया गया है जो व्यक्तिगत विभागों से संबंधित है। इस प्रकार उपयोगकर्ताओं का एक विशिष्ट समूह अपने विश्लेषण के लिए आसानी से इस डेटा का उपयोग कर सकता है।
एक डेटा वेयरहाउस के विपरीत, जिसमें उपयोगकर्ताओं के कई संयोजन होते हैं, प्रत्येक डेटा मार्ट में एंड-यूज़र्स का एक विशेष सेट होगा। एंड-यूजर्स की कम संख्या से बेहतर रिस्पांस टाइम मिलता है।
डेटा मौसा भी व्यापार खुफिया (द्वि) उपकरण के लिए सुलभ हैं। डेटा marts में डुप्लिकेट (या) अप्रयुक्त डेटा शामिल नहीं है। वे नियमित अंतराल पर अपडेट होते रहते हैं। वे विषय-उन्मुख और लचीले डेटाबेस हैं। प्रत्येक टीम को डेटा वेयरहाउस (या) अन्य डेटा मार्ट के डेटा को संशोधित किए बिना अपने डेटा मौसा को विकसित करने और बनाए रखने का अधिकार है।
एक डेटा मार्ट छोटे व्यवसायों के लिए अधिक उपयुक्त है क्योंकि इसमें डेटा वेयरहाउस सिस्टम की तुलना में बहुत कम खर्च होता है। डेटा वेयरहाउस बनाने के लिए आवश्यक समय की तुलना में डेटा मार्ट बनाने के लिए आवश्यक समय भी कम है।
एकाधिक डेटा मार्ट का सचित्र प्रतिनिधित्व:
ओएसआई मॉडल की कौन सी परत डेटा एन्क्रिप्शन को संबोधित करती है?
जब हमें डेटा मार्ट की आवश्यकता होती है?
आवश्यकता के आधार पर, हितधारकों को उलझाकर अपने विभाग के लिए डेटा मार्ट की योजना बनाएं और डिज़ाइन करें क्योंकि डेटा मार्ट की परिचालन लागत कुछ समय अधिक हो सकती है।
डेटा मार्ट बनाने के लिए निम्न कारणों पर विचार करें:
- यदि आप उपयोगकर्ता अभिगम नियंत्रण रणनीति के एक सेट के साथ डेटा को विभाजित करना चाहते हैं।
- यदि कोई विशेष विभाग विशाल DW डेटा को स्कैन करने के बजाय क्वेरी परिणामों को बहुत तेज़ी से देखना चाहता है।
- यदि कोई विभाग चाहता है कि डेटा अन्य हार्डवेयर (या) सॉफ़्टवेयर प्लेटफ़ॉर्म पर बनाया जाए।
- यदि कोई विभाग चाहता है कि डेटा को ऐसे तरीके से डिज़ाइन किया जाए जो उसके उपकरणों के लिए उपयुक्त हो।
लागत प्रभावी डेटा मार्ट
एक लागत प्रभावी डेटा मार्ट निम्नलिखित चरणों द्वारा बनाया जा सकता है:
- कार्यात्मक विभाजन को पहचानें: संगठनात्मक निर्भरता के बिना, अपनी आवश्यकता को पूरा करने के लिए प्रत्येक डेटा मार्ट (विभागीय) विशिष्ट डेटा में संगठन डेटा को विभाजित करें।
- उपयोगकर्ता एक्सेस टूल आवश्यकताएँ पहचानें: बाजार में अलग-अलग उपयोगकर्ता एक्सेस टूल हो सकते हैं जिन्हें अलग-अलग डेटा संरचनाओं की आवश्यकता होती है। डेटा marts का उपयोग DW डेटा को परेशान किए बिना इन सभी आंतरिक संरचनाओं का समर्थन करने के लिए किया जाता है। उपयोगकर्ता की आवश्यकता के अनुसार एक डेटा मार्ट एक उपकरण से जुड़ा हो सकता है। डेटा मौसा प्रतिदिन ऐसे उपकरणों को अद्यतन डेटा प्रदान कर सकते हैं।
- अभिगम नियंत्रण मुद्दों की पहचान करें: यदि DW सिस्टम में अलग-अलग डेटा सेगमेंट में गोपनीयता की आवश्यकता होती है और इसे अधिकृत उपयोगकर्ताओं के एक सेट द्वारा एक्सेस किया जाना चाहिए, तो ऐसे सभी डेटा को डेटा marts में स्थानांतरित किया जा सकता है।
डेटा मार्ट की लागत
डेटा मार्ट की लागत का अनुमान इस प्रकार लगाया जा सकता है:
- हार्डवेयर और सॉफ्टवेयर लागत: किसी भी नए जोड़े गए डेटा मार्ट को अंतिम उपयोगकर्ताओं द्वारा अनुरोध किए गए प्रश्नों पर काम करने के लिए अतिरिक्त हार्डवेयर, सॉफ्टवेयर, प्रोसेसिंग पावर, नेटवर्क और डिस्क स्टोरेज स्पेस की आवश्यकता हो सकती है। यह डेटा मार्टिंग को एक महंगी रणनीति बनाता है। इसलिए बजट की सटीक योजना बनाई जानी चाहिए।
- नेटवर्क का उपयोग: यदि डेटा मार्ट का स्थान डेटा वेयरहाउस से भिन्न है, तो सभी डेटा को डेटा मार्ट लोडिंग प्रक्रिया के साथ स्थानांतरित किया जाना चाहिए। इस प्रकार एक नेटवर्क को भारी मात्रा में डेटा स्थानांतरित करने के लिए प्रदान किया जाना चाहिए जो महंगा हो सकता है।
- समय खिड़की की कमी: डेटा मार्ट लोडिंग प्रक्रिया के लिए लगने वाला समय विभिन्न कारकों पर निर्भर करेगा जैसे कि जटिलता और डेटा की मात्रा, नेटवर्क क्षमता, डेटा ट्रांसफर तंत्र आदि।
डेटा वेयरहाउस बनाम डेटा मार्ट की तुलना
एस.एन.ओ. | डेटा वेयरहाउस | आंकड़ों का बाजार |
---|---|---|
एक | लागू करने के लिए जटिल और अधिक लागत। | लागू करने के लिए सरल और सस्ता। |
दो | पूरे व्यवसाय के लिए संगठन स्तर पर काम करता है। | दायरा एक विशेष विभाग तक सीमित है। |
३ | भारी डेटा निर्भरता के कारण DW उपयोगकर्ताओं को छोड़ना व्यापार उपयोगकर्ताओं के लिए मुश्किल है। | सीमित डेटा के कारण व्यावसायिक उपयोगकर्ताओं के लिए डेटा मार्ट को कम करना आसान है। |
४ | कार्यान्वयन का समय महीनों या वर्षों में अधिक हो सकता है। | कार्यान्वयन का समय कम दिनों, हफ्तों या महीनों में हो सकता है। |
५ | विभिन्न बाहरी स्रोत प्रणालियों से डेटा इकट्ठा करता है। | कुछ केंद्रीयकृत DW (या) आंतरिक (या) बाहरी स्रोत प्रणालियों से डेटा इकट्ठा करता है। |
६ | रणनीतिक फैसले किए जा सकते हैं। | व्यावसायिक निर्णय हो सकते हैं। |
डेटा मार्ट के प्रकार
डेटा मौसा को तीन प्रकारों में वर्गीकृत किया जाता है यानी डिपेंडेंट, इंडिपेंडेंट और हाइब्रिड। यह वर्गीकरण इस बात पर आधारित है कि उन्हें किस तरह से आबाद किया गया है या तो किसी अन्य डेटा स्रोतों से डेटा वेयरहाउस (या) से।
निष्कर्षण, परिवर्तन और परिवहन (ETT) एक ऐसी प्रक्रिया है जिसका उपयोग किसी भी सोर्स सिस्टम से डेटा मार्ट के डेटा को पॉप्युलेट करने के लिए किया जाता है।
आइए प्रत्येक प्रकार के बारे में विस्तार से देखें !!
# 1) आश्रित डेटा मार्ट
एक आश्रित डेटा मार्ट में, डेटा मौजूदा डेटा वेयरहाउस से ही प्राप्त होता है। यह एक टॉप-डाउन दृष्टिकोण है क्योंकि डेटा मार्ट में पुनर्गठन डेटा का हिस्सा केंद्रीकृत डेटा वेयरहाउस से निकाला जाता है।
एक डेटा मार्ट DW डेटा का उपयोग तार्किक या भौतिक रूप से नीचे दिखाए गए अनुसार कर सकता है:
- तार्किक दृश्य: इस परिदृश्य में, डेटा मार्ट का डेटा DW से भौतिक रूप से अलग नहीं है। यह तार्किक रूप से आभासी विचारों (या) तालिकाओं के माध्यम से DW डेटा को संदर्भित करता है।
- भौतिक सबसेट: इस परिदृश्य में, डेटा मार्ट के डेटा को DW से भौतिक रूप से अलग किया गया है।
एक या एक से अधिक डेटा मौसा विकसित होने के बाद, आप उपयोगकर्ताओं को केवल डेटा मौसा (या) दोनों डेटा मौसा और डेटा वेयरहाउस तक पहुंचने की अनुमति दे सकते हैं।
ईटीटी निर्भर डेटा marts के मामले में एक सरल प्रक्रिया है क्योंकि प्रयोग करने योग्य डेटा केंद्रीकृत DW में पहले से मौजूद है। संक्षेप डेटा का सटीक सेट सिर्फ संबंधित डेटा marts में ले जाया जाना चाहिए।
डिपेंडेंट डेटा मार्ट की एक छवि नीचे दी गई है :
जहां मुफ्त मोबाइल फोनों के लिए ऑनलाइन देखने के लिए
# 2) स्वतंत्र डाटा मार्ट
एक स्वतंत्र डेटा मार्ट एक संगठन में छोटे विभागों के लिए सबसे उपयुक्त है। यहां डेटा मौजूदा डेटा वेयरहाउस से प्राप्त नहीं किया गया है। स्वतंत्र डेटा मार्ट न तो एंटरप्राइज़ डीडब्ल्यू पर निर्भर है और न ही अन्य डेटा मौसा पर।
स्वतंत्र डेटा मौसा स्टैंड-अलोन सिस्टम हैं जहां डेटा को बाह्य (या) आंतरिक डेटा स्रोतों से निकाला जाता है, रूपांतरित किया जाता है और लोड किया जाता है। ये तब तक डिज़ाइन और बनाए रखने में आसान होते हैं जब तक कि यह सरल विभाग वार व्यावसायिक आवश्यकताओं का समर्थन नहीं करता है।
आपको डेटा के केंद्रीकृत डीडब्ल्यू में कैसे संसाधित किया गया है, इस तरह से स्वतंत्र डेटा मौसा के मामले में ईटीटी प्रक्रिया के प्रत्येक चरण के साथ काम करना होगा। हालाँकि, स्रोतों की संख्या और डेटा मौतों के लिए आबादी वाले डेटा कम हो सकते हैं।
एक स्वतंत्र डेटा मार्ट का सचित्र प्रतिनिधित्व :
# 3) हाइब्रिड डेटा मार्ट
हाइब्रिड डेटा मार्ट में, डेटा को DW और अन्य परिचालन प्रणालियों दोनों से एकीकृत किया जाता है। हाइब्रिड डेटा marts बड़े भंडारण संरचनाओं के साथ लचीले होते हैं। यह अन्य डेटा marts डेटा को भी संदर्भित कर सकता है।
हाइब्रिड डेटा मार्ट का सचित्र प्रतिनिधित्व:
एक डेटा मार्ट के कार्यान्वयन कदम
डेटा मार्ट का कार्यान्वयन जिसे थोड़ा जटिल माना जाता है, नीचे दिए गए चरणों में समझाया गया है:
- डिज़ाइन बनाना: चूंकि समय व्यवसाय उपयोगकर्ता डेटा मार्ट का अनुरोध करते हैं, इसलिए डिज़ाइनिंग चरण में संबंधित डेटा स्रोतों से उचित डेटा बनाना, तार्किक और भौतिक डेटा संरचनाएं और ईआर आरेख तैयार करना शामिल है।
- निर्माण: टीम डेटा टेबल सिस्टम में सभी टेबल, व्यू, इंडेक्स आदि को डिजाइन करेगी।
- आबादी: डेटा मेटाडेटा के साथ डेटा मार्ट में निकाला, रूपांतरित और लोड किया जाएगा।
- पहुंच: डेटा मार्ट डेटा एंड-यूजर्स द्वारा एक्सेस करने के लिए उपलब्ध है। वे अपने विश्लेषण और रिपोर्ट के लिए डेटा को क्वेरी कर सकते हैं।
- प्रबंध: इसमें विभिन्न प्रबंधकीय कार्य शामिल हैं जैसे उपयोगकर्ता अभिगम नियंत्रण, डेटा मार्ट प्रदर्शन ठीक-ट्यूनिंग, मौजूदा डेटा marts को बनाए रखना और सिस्टम विफल होने की स्थिति में डेटा मार्ट पुनर्प्राप्ति परिदृश्य बनाना।
एक डेटा मार्ट की संरचना
प्रत्येक डेटा मार्ट की संरचना आवश्यकता के अनुसार बनाई गई है। डेटा मार्ट संरचनाओं को स्टार जॉइन कहा जाता है। यह संरचना एक डेटा मार्ट से दूसरे में भिन्न होगी।
स्टार जोड़ बहु-आयामी संरचनाएं हैं जो बड़ी मात्रा में डेटा का समर्थन करने के लिए तथ्य और आयाम तालिकाओं के साथ बनती हैं। स्टार ज्वाइन में आयाम तालिका से घिरे केंद्र में एक तथ्य तालिका होगी।
प्रतिक्रियाशील तथ्य तालिका डेटा आयाम तालिका डेटा के साथ एक विदेशी कुंजी संदर्भ के साथ जुड़ा हुआ है। एक तथ्य तालिका 20-30 आयाम तालिकाओं से घिरी हो सकती है।
DW प्रणाली के समान, स्टार में भी शामिल होता है, तथ्य तालिकाओं में केवल संख्यात्मक डेटा होते हैं और संबंधित पाठ डेटा को आयाम तालिकाओं में वर्णित किया जा सकता है। यह संरचना DW में एक स्टार स्कीमा जैसा दिखता है।
एक सितारा सम्मिलित संरचना का सचित्र प्रतिनिधित्व।
लेकिन केंद्रीकृत डीडब्ल्यू का दानेदार डेटा किसी भी डेटा मार्ट के डेटा का आधार है। सामान्यीकृत डीडब्ल्यू डेटा पर कई गणनाओं को बहुआयामी डेटा marts डेटा में बदलने के लिए किया जाएगा जो क्यूब्स के रूप में संग्रहीत होता है।
यह इसी तरह काम करता है कि कैसे विरासत स्रोत प्रणालियों का डेटा एक सामान्यीकृत DW डेटा में बदल जाता है।
जब एक पायलट डेटा मार्ट उपयोगी है?
एक पायलट को कम संख्या में उपयोगकर्ताओं के साथ सीमित वातावरण में तैनात किया जा सकता है ताकि यह सुनिश्चित किया जा सके कि तैनाती पूर्ण तैनाती से पहले सफल हो। हालांकि, यह हर समय आवश्यक नहीं है। एक बार उद्देश्य पूरा होने के बाद पायलट की तैनाती का कोई फायदा नहीं होगा।
हैश तालिका उदाहरण c ++
आपको पायलट परिनियोजन के लिए अनुशंसा करने वाले निम्न परिदृश्यों पर विचार करने की आवश्यकता है:
- यदि अंत-उपयोगकर्ता डेटा वेयरहाउस सिस्टम में नए हैं।
- यदि अंतिम-उपयोगकर्ता उत्पादन करने से पहले स्वयं द्वारा डेटा / रिपोर्ट प्राप्त करने के लिए सहज महसूस करना चाहते हैं।
- यदि अंतिम-उपयोगकर्ता नवीनतम उपकरणों (या) प्रौद्योगिकियों के साथ हाथ चाहते हैं।
- यदि प्रबंधन लाभ को एक बड़ी रिलीज के रूप में बनाने से पहले अवधारणा के प्रमाण के रूप में देखना चाहता है।
- यदि टीम चाहती है कि रिलीज से पहले सभी ईटीएल घटकों (या) बुनियादी ढांचे के घटकों को अच्छी तरह से काम करना सुनिश्चित करें।
डेटा मार्ट की कमियां
हालांकि डेटा मौसा का DW पर कुछ लाभ होता है लेकिन उन्हें नीचे बताई गई कुछ कमियां भी होती हैं:
- अनचाहे डेटा मर्ट्स जो बनाए गए हैं, उन्हें बनाए रखना मुश्किल है।
- डेटा मौसा छोटे व्यवसाय की जरूरतों के लिए होते हैं। डेटा marts का आकार बढ़ने से इसके प्रदर्शन में कमी आएगी।
- यदि आप अधिक संख्या में डेटा marts बना रहे हैं, तो प्रबंधन को उनके संस्करण, सुरक्षा और प्रदर्शन का ठीक से ध्यान रखना चाहिए।
- डेटा मौसा में ऐतिहासिक (या) सारांशित (या) विस्तृत डेटा हो सकता है। हालाँकि, डेटा असंगतता के कारण DW डेटा और डेटा मार्ट डेटा का अद्यतन एक ही समय में नहीं हो सकता है।
निष्कर्ष
कई संगठन लागत बचाने के दृष्टिकोण से डेटा मौतों की ओर बढ़ रहे हैं। इसलिए इस ट्यूटोरियल ने डेटा वेयरहाउस सिस्टम में डेटा मौसा के तकनीकी पहलुओं पर ध्यान केंद्रित किया है।
ETL में मेटाडेटा को हमारे आगामी ट्यूटोरियल में विस्तार से बताया गया है।
=> सभी के लिए डेटा भंडारण प्रशिक्षण श्रृंखला देखने के लिए यहां जाएं।
अनुशंसित पाठ
- उदाहरणों के साथ डेटा वेयरहाउस टेस्टिंग ट्यूटोरियल | ईटीएल परीक्षण गाइड
- पायथन डेटा प्रकार
- C ++ डेटा प्रकार
- डेटा वेयरहाउस में आयामी डेटा मॉडल - उदाहरणों के साथ ट्यूटोरियल
- डेटा माइनिंग में एप्रीओरी एल्गोरिदम: उदाहरणों के साथ कार्यान्वयन
- डेटा माइनिंग उदाहरण: डेटा माइनिंग 2021 के अधिकांश सामान्य अनुप्रयोग
- डेटा वेयरहाउसिंग फंडामेंटल्स: उदाहरणों के साथ एक अंतिम गाइड
- वॉल्यूम परीक्षण ट्यूटोरियल: उदाहरण और वॉल्यूम परीक्षण उपकरण