oracle data warehouse
लाभ, वास्तुकला, जोखिम, और OLTP (ऑनलाइन लेनदेन प्रसंस्करण) प्रणाली के साथ तुलना के साथ Oracle डाटा वेयरहाउस गाइड:
के पिछले ट्यूटोरियल में ओरेकल के लिए व्यापक गाइड , हमने विभिन्न डोमेन जैसे कि एप्लिकेशन, डेटाबेस, OS आदि में Oracle उत्पादों और सेवाओं के बारे में सीखा है। यह लेख Oracle Data Warehousing का गहन ज्ञान प्रदान करेगा। लेकिन इससे पहले हम पहले Business Intelligence (BI) की अवधारणा को समझें।
व्यापारिक सूचना
बिजनेस इंटेलिजेंस एक सॉफ्टवेयर डोमेन है जो कुछ तरीकों, प्रौद्योगिकियों, उपकरणों और अनुप्रयोगों को तैयार करता है जो बल्क डेटा को एक बुद्धिमान और समझने योग्य प्रारूप में बदलने, परिष्कृत करने और बदलने में मदद करता है, जिसका उपयोग ग्राहकों द्वारा अनुकूलित रिपोर्ट तैयार करने के लिए किया जा सकता है और व्यापार लेने में भी मदद करता है। निर्णय।
इस जरूरत को पूरा करने के लिए विभिन्न विकल्प उपलब्ध हैं जैसे डेटा वेयरहाउसिंग, ओएलएपी (ऑनलाइन ट्रांजेक्शन प्रोसेसिंग), डाटा माइनिंग, डेटा इंटीग्रेशन, डिसीजन इंजीनियरिंग, स्प्रेडशीट, आदि।
एंटरप्राइज डेटा वेयरहाउसिंग (EDW) BI के मुख्य घटकों में से एक है जो उद्यमों की विश्लेषणात्मक और रिपोर्टिंग जरूरतों को पूरा करता है। डेटा वेयरहाउस एक रिलेशनल डेटाबेस मैनेजमेंट सिस्टम (RDBMS) है, जो बाद के उपयोग के लिए कई स्रोतों से प्राप्त समेकित डेटा रखता है।
HTML साक्षात्कार प्रश्न और फ्रेशर्स के उत्तर
आप क्या सीखेंगे:
- ओरेकल डेटा वेयरहाउस अवलोकन
- ओएलटीपी बनाम डेटा वेयरहाउस की तुलना
- कंट्रास्टिंग डेटा वेयरहाउस और डेटा मार्ट
- ETL प्रक्रिया का अवलोकन
- डेटा वेयरहाउस आर्किटेक्चर
- निष्कर्ष
ओरेकल डेटा वेयरहाउस अवलोकन
इसे 'डेटा वेयरहाउस' क्यों कहा जाता है?
Ware डेटा वेयरहाउस ’शब्द से संबंधित करने के लिए in वेयरहाउस’ शब्द के अर्थ को याद करने की कोशिश करें।
एक भौतिक गोदाम एक भंडार है जो विभिन्न स्रोतों से प्राप्त सामानों के भंडारण के लिए उपयोग किया जाता है, जिसे बाद में ग्राहक को उनकी आवश्यकताओं के आधार पर आपूर्ति की जा सकती है।
(छवि स्रोत )
इसी प्रकार, डेटा वेयरहाउस विभिन्न स्रोत प्रणालियों से प्राप्त डेटा का भंडार है। ये स्रोत किसी भी स्टोरेज सिस्टम हो सकते हैं जैसे डेटा मर्ट्स, फ़्लैट फ़ाइल्स, या कोई मीडिया स्टोरेज डिवाइस जो विभिन्न एंटरप्राइज़ डोमेन जैसे एचआर, सेल्स, ऑपरेशंस, रिसोर्स मैनेजमेंट और मार्केटिंग, आदि के लिए डेटा रखती हैं।
डेटा वेयरहाउस होने का उद्देश्य
एक उद्यम ने डेटा वेयरहाउस की अवधारणा के बारे में सुना होगा, लेकिन वे अनिश्चित हो सकते हैं कि क्या उन्हें अपने उद्यम में शामिल करना चाहिए। फिर भी, हमेशा अलग-अलग स्रोतों से डेटा को आम जमीन पर डंप करने और उन्हें संग्रहीत करने की आवश्यकता होगी ताकि भंडारण स्थान को लेनदेन प्रणालियों से जारी किया जा सके। यह वह जगह है जहाँ डेटा वेयरहाउसिंग सिस्टम एक व्यावसायिक आवश्यकता बन जाती है।
बाजार में बढ़ने के लिए, प्रबंधन को निर्णय लेने में अच्छा होना चाहिए जो किसी संगठन के पिछले रुझानों का अच्छी तरह से अध्ययन करने के बाद ही किया जा सकता है। इसलिए, यह संग्रहीत डेटा डेटा वेयरहाउस में एक सुव्यवस्थित और गणना किए गए प्रारूप में बनाए रखा जाता है ताकि इसे भविष्य में व्यावसायिक विश्लेषण के लिए संदर्भित किया जा सके।
डेटा वेयरहाउसिंग के लाभ
डेटा वेयरहाउस सफलतापूर्वक कार्यान्वित होने पर निम्नलिखित तरीकों से लाभकारी हो सकता है:
# 1) इसने व्यापार खुफिया समाधानों का एक बढ़ाया संस्करण देकर विश्लेषकों की नौकरियों को सरल बनाया है। यह कई स्रोत प्रणालियों से डेटा निकालता है, रूपांतरित करता है, और इसे संग्रहीत करता है जिसे विश्लेषण के लिए व्यवसाय द्वारा सीधे उद्धृत किया जा सकता है।
यह विभिन्न उपकरण भी प्रदान करता है जो निम्नलिखित का समर्थन करते हैं:
- अनुकूलित व्यावसायिक रिपोर्टों का सृजन।
- आवश्यक जानकारी प्रदर्शित करने वाले इंटरएक्टिव डैशबोर्ड।
- केवल विवरण प्राप्त करने के लिए डैशबोर्ड के माध्यम से ड्रिल करने की क्षमता।
- डेटा खनन और रुझान विश्लेषण।
#दो) विभिन्न स्रोत प्रणालियों से डेटा प्राप्त करने के बाद भी, डेटा गोदाम के भीतर डेटा ETL प्रक्रिया के दौरान हुए परिवर्तनों के परिणामस्वरूप सुसंगत रहता है। लगातार डेटा सटीकता के मामले में एक निर्णय निर्माता को विश्वास दिलाता है।
# 3) डेटा वेयरहाउस को एक समय सेवर के रूप में भी परिभाषित किया गया है क्योंकि व्यापार के निर्णय लेने के लिए हितधारकों द्वारा आवश्यक महत्वपूर्ण डेटा एक ही स्थान पर उपलब्ध है और इसे आसानी से प्राप्त किया जा सकता है।
# 4) ये ऐतिहासिक डेटा रखने के लिए डिज़ाइन किए गए हैं और इसलिए अलग-अलग समय अवधि के दौरान रुझानों का अध्ययन करने के लिए इसे समझा जा सकता है। यह भविष्य के विकास पथ को प्राप्त करने के लिए हितधारकों की मदद करता है।
डेटा वेयरहाउस का उपयोग करने में शामिल जोखिम
लाभ के साथ, हर नए कार्यान्वयन में जोखिमों का एक सेट भी शामिल होता है जिसका ध्यान रखना आवश्यक है।
नीचे सूचीबद्ध कुछ जोखिम शामिल हैं:
- डेटा वेयरहाउसिंग सिस्टम के साथ स्रोत प्रणालियों की गैर-अनुकूलता बहुत सारे मैनुअल काम कर सकती है।
- ईटीएल प्रक्रिया के गलत समय आकलन से बाधित काम हो सकता है।
- ये बहुत ही उच्च अंत भंडारण प्रणाली हैं और इस प्रकार उच्च रखरखाव की आवश्यकता होती है। किसी भी वर्कफ़्लो या व्यावसायिक परिवर्तन की लागत बहुत अधिक हो सकती है।
- एक डेटा वेयरहाउस की स्थापना में समय लगता है क्योंकि व्यवसाय को समझने और गोदाम डिजाइन करने के लिए एकीकरण क्षमताओं की पहचान करने के लिए बहुत समय की आवश्यकता होती है।
- डेटा सुरक्षा हमेशा यहां एक जोखिम है क्योंकि यह पुराने-पुराने ऐतिहासिक डेटा को रखता है जो लीक होने पर व्यापार को प्रभावित कर सकते हैं।
ओएलटीपी बनाम डेटा वेयरहाउस की तुलना
OLTP और डेटा वेयरहाउस के बीच के अंतर को नीचे दी गई तालिका से समझा जा सकता है।
OLTP | विवरण भण्डारण |
---|---|
सम्मिलित करें और अद्यतन OLTP सिस्टम पर अंतिम उपयोगकर्ताओं द्वारा किए गए प्रमुख ऑपरेशन हैं। | डेटा वेयरहाउस का चयन कथन के माध्यम से किया जाता है और केवल ETL सेवाओं का उपयोग करके अपडेट किया जा सकता है। |
ओएलटीपी सिस्टम व्यापार लेनदेन का समर्थन करता है। | डेटा वेयरहाउस पूर्ण व्यापारिक लेनदेन के विश्लेषण के बाद लिए गए व्यावसायिक निर्णयों का समर्थन करता है। |
डेटा अस्थिर रहता है यानी बदलता रहता है | डेटा को परिवर्तित नहीं किया जाना चाहिए। |
उनके पास सबसे हालिया डेटा है। | उनके पास ऐतिहासिक आंकड़े हैं। |
बिना किसी गणना के कच्चे डेटा को रखता है। | डेटा को संक्षेप और अच्छी तरह से गणना किए गए डेटा। |
डेटा को सामान्य किया जाएगा। | डेटा डी-सामान्यीकृत रहेगा। |
Oracle डेटाबेस का आकार 50MB से 100GB तक भिन्न हो सकता है। | Oracle डेटाबेस का आकार 100GB से 2TB तक भिन्न हो सकता है। |
कंट्रास्टिंग डेटा वेयरहाउस और डेटा मार्ट
डेटा वेयरहाउस और डेटामार्ट, दोनों ही शब्द एक जैसे नहीं लगते और डेटा स्टोरेज से संबंधित प्रतीत होते हैं।
हां, वे संबंधित हैं और दोनों का उपयोग डेटा संग्रहीत करने के लिए किया जाता है। दोनों के बीच मुख्य अंतर डेटा को धारण करने की क्षमता है और यह अंतर अंतिम-उपयोगकर्ताओं को अपने सिस्टम के लिए सही भंडारण इकाई चुनने में मदद करता है।
डेटा मार्ट में डेटा वेयरहाउस की तुलना में डेटा रखने की क्षमता कम होती है और इसलिए इसे इसका सबसेट माना जा सकता है। डेटा मौसा आमतौर पर सीमित डेटा को स्टोर करने के लिए पहचाने जाते हैं जो किसी विशेष विभाग या व्यवसाय की रेखा के हो सकते हैं जबकि डेटा वेयरहाउस का उपयोग सभी के लिए समेकित डेटा को रखने के लिए किया जा सकता है।
आइए हम एक ई-कॉमर्स वेबसाइट का उदाहरण लेते हैं जिसमें विभिन्न श्रेणियों जैसे कि फैशन, सहायक उपकरण, घरेलू सामान, किताबें और स्कूल की आपूर्ति, इलेक्ट्रॉनिक्स उपकरण, आदि हैं।
इसलिए, डेटा मौसा को उत्पाद डेटा श्रेणी के अनुसार स्टोर करने के लिए डिज़ाइन किया जा सकता है, जबकि डेटा वेयरहाउस का उपयोग एक जगह में इतिहास सहित संपूर्ण वेबसाइट डेटा को संग्रहीत करने के लिए किया जा सकता है।
डेटा मौसा आकार में छोटे होते हैं, उन्हें बहुत अधिक विश्लेषण के बिना बहुत तेज़ी से बनाया जा सकता है, जैसा कि डेटा वेयरहाउस को डिज़ाइन करने के लिए आवश्यक है। हालाँकि, यह कई डेटा marts को सिंक में रखने के लिए बहुत प्रयास करता है ताकि डेटा स्थिरता बनाए रखी जा सके।
ETL प्रक्रिया का अवलोकन
ETL (एक्सट्रैक्शन, ट्रांसफॉर्मेशन, एंड लोडिंग) विभिन्न सोर्स सिस्टम से डेटा निकालने, उसे डेटा वेयरहाउस सिस्टम में बदलने और लोड करने की एक प्रक्रिया है। यह एक जटिल प्रक्रिया है जिसे डेटा निष्कर्षण के लिए विभिन्न प्रकार के स्रोत प्रणालियों के साथ बातचीत करने की आवश्यकता है और इसलिए तकनीकी रूप से भी चुनौतीपूर्ण है।
स्रोत प्रणालियों के प्रारूप को समझने और डेटा को सामान्य प्रारूप में लाने के लिए परिवर्तन को फिर से बहुत विश्लेषण की आवश्यकता होती है ताकि डेटा वेयरहाउस में उसी डेटा को संग्रहीत किया जा सके।
ईटीएल प्रक्रिया एक आवर्ती नौकरी है जो व्यवसाय की आवश्यकता के आधार पर दैनिक, साप्ताहिक या मासिक रूप से चल सकती है।
डेटा वेयरहाउस आर्किटेक्चर
आइए एक डेटा वेयरहाउस की वास्तुकला को समझते हैं जो मुख्य रूप से पूर्वनिर्धारित व्यावसायिक आवश्यकताओं के लिए परिष्कृत डेटा को संग्रहीत करने के लिए डिज़ाइन किया गया है। वास्तुकला में ऊपर से नीचे तक डेटा प्रवाह के साथ 5 घटक होते हैं।
घटक इस प्रकार हैं:
कंप्यूटर में डीवीडी कॉपी करने के लिए कार्यक्रम
- डाटा के स्रोत
- डेटा स्टेजिंग
- डेटा वेयरहाउस (डेटा संग्रहण)
- डेटा मार्च (डेटा संग्रहण)
- डेटा की प्रस्तुति
आइए हम एक-एक करके ऊपर दिए गए सभी चरणों को समझें।
# 1) डेटा स्रोत
विभिन्न स्रोत प्रणालियां हैं जो डेटा वेयरहाउस सिस्टम के इनपुट के रूप में कार्य करती हैं।
ये स्रोत प्रणालियाँ हो सकती हैं:
- ओरेकल, डीबी 2, माईएसक्यूएल, एमएस एक्सेस आदि जैसे रिलेशनल डेटाबेस, जिनका उपयोग किसी भी संगठन के दैनिक लेनदेन को रिकॉर्ड करने के लिए किया जा सकता है। ये दैनिक व्यापार लेनदेन ईआरपी, सीआरएम, बिक्री, वित्त और विपणन आदि से संबंधित हो सकते हैं।
- फ्लैट फ़ाइलें
- वेब सेवाएं
- आरएसएस फ़ीड और समान स्रोत।
# 2) डेटा स्टेजिंग
एक बार डेटा स्रोत होने के बाद, अगला चरण इस डेटा को सोर्स सिस्टम से वेयरहाउस स्टेजिंग एरिया में निकालना होगा।
चूंकि डेटा को अलग-अलग प्रणालियों से पुनर्प्राप्त किया गया है जो अलग-अलग स्टोरेज प्रारूपों का पालन करते हैं, इसलिए डेटा को पुन: व्यवस्थित करना आवश्यक है ताकि इसे एक सामान्य प्रारूप में लाया जा सके। इसलिए, डेटा परिवर्तन अगले चरण के रूप में होता है।
परिवर्तन के दौरान, डेटा क्लींजिंग होती है जिसमें व्यावसायिक नियम लागू करना, डेटा फ़िल्टर करना, अतिरेक हटाना, डेटा फ़ॉर्मेटिंग, डेटा सॉर्ट करना आदि शामिल हैं।
# 3) डेटा वेयरहाउस (डेटा संग्रहण)
एक बार जब डेटा निकाला और बदल दिया जाता है, तो इसे एक बहुआयामी वातावरण यानी डेटा वेयरहाउस में लोड किया जाएगा। अब, इस संसाधित डेटा का उपयोग अंतिम उपयोगकर्ताओं द्वारा विश्लेषण और अन्य उद्देश्यों के लिए किया जा सकता है।
# 4) डेटा मार्ट (डेटा संग्रहण)
जैसा कि ऊपर उल्लेख किया गया है कि डेटा अब एंड-यूजर्स द्वारा खपत किए जाने के लिए तैयार है, अगले चरण के रूप में डेटा मार्ट बनाने की एक वैकल्पिक प्रक्रिया है। इन डेटा मौतों का उपयोग किसी विशेष विभाग के सारांशित डेटा या समर्पित उपयोग के लिए व्यवसाय की एक पंक्ति को संग्रहीत करने के लिए किया जा सकता है।
उदाहरण के लिए, बिक्री, वित्त, और विपणन आदि विभागों के लिए एक अगले चरण के रूप में अलग-अलग डेटा marts को जोड़ा जा सकता है जो विशिष्ट डेटा को रखेगा और एक विश्लेषक को व्यावसायिक आवश्यकताओं के लिए विस्तृत प्रश्न करने की अनुमति देगा। यह हर दूसरे अंत-उपयोगकर्ता को पूर्ण गोदाम तक पहुंचने से रोकता है और इसलिए डेटा को सुरक्षित बनाता है।
# 5) डेटा एक्सेस टूल (डेटा प्रस्तुति)
कई पूर्वनिर्धारित बिजनेस इंटेलिजेंस टूल हैं, जिनका उपयोग उपयोगकर्ता डेटा वेयरहाउस या डेटा कार्ट को एक्सेस करने के लिए कर सकते हैं। ये फ्रंट-एंड टूल उपयोगकर्ताओं को डेटा एक्सेस करने के लिए कई तरह के विकल्प देकर एक बेहद उपयोगकर्ता-अनुकूल तरीके से डिज़ाइन किए गए हैं।
विकल्प नीचे दिए गए हैं:
- Oracle या किसी अन्य डेटाबेस से क्वेरी को सीधे SQL के माध्यम से लागू करने से।
- रिपोर्ट पीढ़ी।
- विकासशील अनुप्रयोग।
- डाटा माइनिंग टूल्स आदि का उपयोग करना।
बाजार में उपलब्ध कुछ लोकप्रिय वेयरहाउसिंग उपकरण हैं:
- एनालिटिक्स डी.एस.
- अमेज़न रेडशिफ्ट
- अब Initio सॉफ्टवेयर
- कोड फ्यूचर्स
- समग्र डेटा प्रबंधन
- सूचना निगम
क्लाउड डेटा वेयरहाउसिंग
डेटा वेयरहाउस को दुनिया द्वारा अत्यधिक मान्यता प्राप्त है। अगला सवाल जो उठता है: क्या हम डेटा वेयरहाउस को तैनात करने के लिए एक अनुकूलित दृष्टिकोण का उपयोग कर रहे हैं?
फिर क्लाउड डेटा वेयरहाउसिंग की शुरुआत की गई, जो एंटरप्राइज़ डेटा वेयरहाउसिंग (EDW) पर एक ऊपरी हाथ ले जाता है। क्लाउड-आधारित डेटा वेयरहाउस की अवधारणा ने विभिन्न लाभों की पेशकश की है।
ये इस प्रकार हैं:
(i) स्केलेबिलिटी: क्लाउड सिस्टम पर डेटा आसानी से बिना किसी झंझट के ऊपर और नीचे मापनीय होता है, जबकि पारंपरिक डेटा वेयरहाउस पर स्केलिंग करने के लिए बहुत समय और संसाधनों की खपत होती है।
(ii) लागत बचत: क्लाउड-आधारित डेटा वेयरहाउस ने वेयरहाउस सेटअप के लिए आवश्यक निवेश के लिए एक उल्लेखनीय अंतर बनाया है। उन्होंने लागत को कम करके थोक अपफ्रंट लागत को कम किया है
जावा में dijkstra की सबसे छोटी पथ एल्गोरिथ्म का कार्यान्वयन
-
- हार्डवेयर / सर्वर रूम बनाए रखना।
- रखरखाव के लिए आवश्यक कर्मचारी।
- अन्य परिचालन लागत।
(iii) प्रदर्शन: प्रदर्शन एक अन्य कारक है जिसने क्लाउड-आधारित सिस्टम को पारंपरिक लोगों पर हावी होने की अनुमति दी है। यदि व्यवसाय को विश्व स्तर पर विस्तारित किया जाता है और दुनिया के विभिन्न हिस्सों से त्वरित मोड़ के साथ डेटा को एक्सेस करने की आवश्यकता होती है, तो क्लाउड-आधारित वेयरहाउस का उपयोग करना सबसे अच्छा है।
बड़े पैमाने पर समानांतर प्रसंस्करण (एमपीपी) एक ही प्राप्त करने के लिए गोदामों द्वारा उपयोग किए जाने वाले सहयोगी प्रसंस्करण विधियों में से एक है।
(iv) कनेक्टिविटी: जैसा कि ऊपर उल्लेख किया गया है, यदि डेटा को कई भौगोलिक स्थानों से एक्सेस करने की आवश्यकता है, तो उपयोगकर्ताओं को इन गोदामों के लिए उत्कृष्ट कनेक्टिविटी की आवश्यकता होती है और क्लाउड-आधारित वेयरहाउस समान प्रदान करता है।
निष्कर्ष
हमें उम्मीद है कि उपरोक्त लेख को पढ़ने के बाद आप सभी को Oracle Data Warehousing प्रणाली के बारे में एक उचित विचार मिल गया होगा। यदि आपको डेटा वेयरहाउसिंग के आसपास किसी विशेष विषय पर किसी भी जानकारी की आवश्यकता है तो हमें बताएं ताकि हम आगामी ट्यूटोरियल में इसे कवर कर सकें।
PREV ट्यूटोरियल | अगले ट्यूटोरियल
अनुशंसित पाठ
- क्या एक डेटा झील है | डेटा वेयरहाउस बनाम डेटा लेक
- उदाहरणों के साथ डेटा वेयरहाउस टेस्टिंग ट्यूटोरियल | ईटीएल परीक्षण गाइड
- शीर्ष 10 लोकप्रिय डेटा वेयरहाउस उपकरण और परीक्षण प्रौद्योगिकी
- डेटा वेयरहाउस में आयामी डेटा मॉडल - उदाहरणों के साथ ट्यूटोरियल
- डेटा वेयरहाउस (ETL) में मेटाडेटा उदाहरणों के साथ समझाया गया
- ETL परीक्षण डेटा वेयरहाउस परीक्षण ट्यूटोरियल (एक पूर्ण गाइड)
- डेटा वेयरहाउस मॉडलिंग में स्कीमा प्रकार - स्टार और स्नोफ्लेक स्कीमा
- डेटा वेयरहाउस में ईटीएल (एक्सट्रैक्ट, ट्रांसफॉर्म, लोड) प्रक्रिया क्या है?