top 32 best datastage interview questions
सबसे अक्सर पूछे जाने वाले डेटास्टेट साक्षात्कार के प्रश्नों की सूची और आगामी साक्षात्कार के लिए तैयार करने में आपकी सहायता करने के लिए उत्तर:
DataStage एक बहुत लोकप्रिय ETL उपकरण है जो वर्तमान बाजार में उपलब्ध था।
इस लेख में, मैं आईबीएम डेटास्टेज साक्षात्कार के लिए बहुत उपयोगी सवाल-जवाब का एक सेट साझा कर रहा हूं। डाटेज इंटरव्यू के सवालों के नीचे से गुजरने से इंटरव्यू क्रैक करना आपके लिए आसान हो सकता है।
हमने डाटाजेज साक्षात्कार के प्रश्नों के विस्तृत उत्तर को कवर किया है जो कि फ्रेशर्स और अनुभवी पेशेवरों के लिए उपयोगी होंगे।
अनुशंसित पढ़ने => ईटीएल परीक्षण साक्षात्कार प्रश्न
अधिकांश सामान्य डेटास्टैव साक्षात्कार प्रश्न और उत्तर
चलो शुरू करते हैं!
Q # 1) डाटेज क्या है?
उत्तर: डाटेज एक है ETL उपकरण द्वारा दिए गए आईबीएम जो डेटा एकीकरण समाधानों को डिजाइन करने के लिए GUI का उपयोग करता है। यह पहला ईटीएल उपकरण था जिसने समानता की अवधारणा दी थी।
यह 3 अलग-अलग संस्करणों के बाद उपलब्ध है
- सर्वर संस्करण
- एंटरप्राइज़ संस्करण
- एमवीएस संस्करण
Q # 2) डेटास्टेट की मुख्य विशेषताओं पर प्रकाश डालिए?
उत्तर: डेटास्टेज की मुख्य विशेषताएं नीचे दी गई हैं:
- यह IBM Infosphere सूचना सर्वर का डेटा एकीकरण घटक है।
- यह एक GUI आधारित टूल है। हमें बस डाॅस्टाटेज वस्तुओं को खींचने और छोड़ने की जरूरत है और हम इसे डाटेजेज कोड में बदल सकते हैं।
- इसका उपयोग ETL ऑपरेशन (एक्सट्रेक्ट, ट्रांसफॉर्म, लोड) करने के लिए किया जाता है
- यह एक ही समय में कई स्रोतों और कई लक्ष्यों को कनेक्टिविटी प्रदान करता है
- यह विभाजन और समानता प्रसंस्करण तकनीक प्रदान करता है, जो डेटा की भारी मात्रा में डेटा को तेजी से संसाधित करने में सक्षम बनाता है।
- इसमें उद्यम स्तर की कनेक्टिविटी है।
Q # 3) डेटास्टेज टूल के प्राथमिक उपयोग क्या हैं?
उत्तर: डेटास्टेज एक ईटीएल उपकरण है जो मुख्य रूप से स्रोत प्रणालियों से डेटा निकालने के लिए उपयोग किया जाता है, उस डेटा को परिवर्तित करता है और अंत में इसे लक्ष्य प्रणालियों में लोड करता है।
Q # 4) डेटास्टेज के 7.x और 8.x संस्करण के बीच आपके द्वारा देखे गए मुख्य अंतर क्या हैं?
उत्तर: यहाँ दोनों संस्करणों के बीच मुख्य अंतर हैं
7.x | 8.x |
---|---|
7.x संस्करण प्लेटफॉर्म पर निर्भर था | यह संस्करण प्लेटफ़ॉर्म स्वतंत्र है |
इसमें 2-स्तरीय वास्तुकला है जहां यूनिक्स सर्वर के शीर्ष पर डेटास्टेज बनाया गया है | इसकी 3-स्तरीय वास्तुकला है जहाँ हमारे पास सबसे नीचे UNIX सर्वर डेटाबेस है फिर XMETA डेटाबेस है जो एक रिपॉजिटरी के रूप में कार्य करता है और फिर हमारे पास शीर्ष पर डेटास्टेज है। |
पैरामीटर सेट की कोई अवधारणा नहीं है | हमारे पास पैरामीटर सेट हैं जो परियोजना में कहीं भी उपयोग किए जा सकते हैं। |
हमारे पास दो अलग-अलग क्लाइंट्स के रूप में डिजाइनर और मैनेजर थे | इस संस्करण में, प्रबंधक क्लाइंट को डिजाइनर क्लाइंट में मिला दिया गया था |
हमें इस संस्करण में नौकरियों के लिए मैन्युअल रूप से खोजना पड़ा | यहां हमारे पास रिपॉजिटरी में त्वरित खोज विकल्प है जहां हम नौकरियों के लिए आसानी से खोज सकते हैं। |
Q # 5) क्या आप IBM Infosphere सूचना सर्वर की मुख्य विशेषताओं को उजागर कर सकते हैं?
उत्तर: IBM Infosphere सूचना सर्वर सुइट की मुख्य विशेषताएं हैं:
सॉफ्टवेयर यूट्यूब से डाउनलोड करने के लिए
- यह डेटा एकीकरण के लिए एक एकल मंच प्रदान करता है। यह कई स्रोत प्रणालियों से जुड़ने की क्षमता के साथ-साथ कई लक्ष्य प्रणालियों के लिए लिखता है।
- यह केंद्रीकृत परतों पर आधारित है। सुइट के सभी घटक सुइट के बेसलाइन आर्किटेक्चर को साझा करने में सक्षम हैं।
- इसमें एकीकृत मेटाडेटा सेवाओं और एक सामान्य समानांतर इंजन के लिए एकीकृत भंडार के लिए परतें हैं।
- यह डेटा के विश्लेषण, सफाई, निगरानी, रूपांतरण और वितरण के लिए उपकरण प्रदान करता है।
- इसमें व्यापक रूप से समानांतर प्रसंस्करण क्षमताएं हैं। यह प्रसंस्करण को बहुत तेज करता है।
Q # 6) सूचना सर्वर वास्तुकला में विभिन्न परतें क्या हैं?
उत्तर: नीचे सूचना सर्वर वास्तुकला की विभिन्न परतें हैं
- एकीकृत यूजर इंटरफेस
- सामान्य सेवाएं
- एकीकृत समानांतर प्रसंस्करण
- एकीकृत मेटाडेटा
- आम कनेक्टिविटी
Q # 7) डेटा सोर्स सिस्टम क्या हो सकता है?
उत्तर: यह एक डेटाबेस टेबल, एक फ्लैट-फाइल, या यहां तक कि बाहरी अनुप्रयोग जैसे नरम हो सकता है।
Q # 8) आप किस इंटरफ़ेस पर डेवलपर के रूप में काम करेंगे?
उत्तर: डेटास्टेज डेवलपर के रूप में, हम डेटास्टेज क्लाइंट इंटरफ़ेस पर काम करते हैं, जिसे डेटास्टेज डिजाइनर के रूप में जाना जाता है जिसे स्थानीय सिस्टम पर स्थापित करने की आवश्यकता होती है। बैकएंड में, यह डेटास्टेज सर्वर से जुड़ा है।
Q # 9) डेटास्टेज में विभिन्न सामान्य सेवाएं क्या हैं?
उत्तर: नीचे डेटास्टेट में सामान्य सेवाओं की सूची दी गई है:
- मेटाडेटा सेवाएं
- एकीकृत सेवा परिनियोजन
- सुरक्षा सुविधाएँ
- लूपिंग और रिपोर्टिंग सेवाएं।
Q # 10) आप डाटाजेज परियोजना को कैसे विकसित करना शुरू करते हैं?
उत्तर: Datastage सर्वर पर डेटास्टेज कार्य बनाने के लिए पहला कदम है। हमारे द्वारा बनाए गए सभी डेटास्टेज ऑब्जेक्ट डेटास्टेज प्रोजेक्ट में संग्रहीत किए जाते हैं। डेटासटेज परियोजना सर्वर पर नौकरियों, तालिकाओं, परिभाषाओं और दिनचर्या के लिए एक अलग वातावरण है।
डेटासटेज परियोजना सर्वर पर नौकरियों, तालिकाओं, परिभाषाओं और दिनचर्या के लिए एक अलग वातावरण है।
Q # 11) डाटास्टेज जॉब क्या है?
उत्तर: डेटास्टेज नौकरी बस एक डेटास्टेज कोड है जिसे हम एक डेवलपर के रूप में बनाते हैं। इसमें डेटा और प्रक्रिया प्रवाह को परिभाषित करने के लिए विभिन्न चरणों को एक साथ जोड़ा गया है।
चरणों के अलावा कुछ भी नहीं है कि कार्यक्षमताओं को लागू किया जाता है।
उदाहरण के लिए: मान लें कि मैं बिक्री राशि का योग करना चाहता हूं। यह एक 'समूह द्वारा' ऑपरेशन हो सकता है जो एक चरण में किया जाएगा।
अब, मैं परिणाम को लक्ष्य फ़ाइल में लिखना चाहता हूं। तो, यह ऑपरेशन किसी अन्य चरण द्वारा किया जाएगा। एक बार, मैंने दोनों चरणों को परिभाषित कर लिया है, मुझे अपने ’समूह से डेटा प्रवाह को लक्ष्य फ़ाइल चरण के चरण से परिभाषित करने की आवश्यकता है। यह डेटा प्रवाह DataStage लिंक द्वारा परिभाषित किया गया है।
एक बार, मैंने दोनों चरणों को परिभाषित कर लिया है, मुझे अपने ’समूह से डेटा प्रवाह को लक्ष्य फ़ाइल चरण के चरण से परिभाषित करने की आवश्यकता है। यह डेटा प्रवाह DataStage लिंक द्वारा परिभाषित किया गया है।
oracle sql साक्षात्कार प्रश्न और उत्तर
Q # 12) DataStage क्रम क्या हैं?
उत्तर: डेटास्टेज अनुक्रम डाटास्टेज नौकरियों को तार्किक प्रवाह में जोड़ता है।
Q # 13) यदि आप विभिन्न नौकरियों में समान कोड का उपयोग करना चाहते हैं, तो आप इसे कैसे प्राप्त करेंगे?
उत्तर: यह साझा कंटेनरों का उपयोग करके किया जा सकता है। हमने पुन: प्रयोज्यता के लिए कंटेनर साझा किए हैं। एक साझा कंटेनर चरणों और लिंक से मिलकर एक पुन: प्रयोज्य कार्य तत्व है। हम विभिन्न डेटास्टेज नौकरियों में एक साझा कंटेनर कह सकते हैं।
Q # 14) डाटेज जॉब कहां जमा होते हैं?
उत्तर: डेटासट जॉब्स भंडार में संग्रहीत हो जाते हैं। हमारे पास विभिन्न फ़ोल्डर हैं जिनमें हम डेटास्टेट नौकरियों को संग्रहीत कर सकते हैं।
Q # 15) आप डिजाइनर में विभिन्न चरणों को कहाँ देखते हैं?
उत्तर: सभी चरण एक खिड़की के भीतर उपलब्ध हैं जिसे कहा जाता है ' पैलेट ' । मंच प्रदान करता है कि समारोह के प्रकार के आधार पर इसमें विभिन्न श्रेणियां हैं।
पैलेट में चरणों की विभिन्न श्रेणियां हैं - सामान्य, डेटा गुणवत्ता, डेटाबेस, विकास, फ़ाइल, प्रसंस्करण, आदि।
Q # 16) प्रसंस्करण चरण क्या हैं?
उत्तर: प्रसंस्करण चरण हमें वास्तविक डेटा परिवर्तन को लागू करने की अनुमति देते हैं।
उदाहरण के लिए , ' प्रसंस्करण श्रेणी के तहत एग्रीगेटर का चरण हमें सभी ’समूह को संचालन द्वारा लागू करने की अनुमति देता है। इसी तरह, हमारे पास प्रसंस्करण में अन्य चरण हैं जैसे stage जॉइन 'चरण जो हमें दो अलग-अलग इनपुट धाराओं से आने वाले डेटा को एक साथ जोड़ने की अनुमति देता है।
Q # 17) एक साधारण बुनियादी डाटेज जॉब बनाने के लिए क्या कदम उठाने की आवश्यकता है?
उत्तर: फ़ाइल पर क्लिक करें -> नई पर क्लिक करें -> समानांतर नौकरी का चयन करें और ठीक पर क्लिक करें। एक समानांतर नौकरी की खिड़की खुल जाएगी। इस समानांतर नौकरी में, हम विभिन्न चरणों को एक साथ रख सकते हैं और उनके बीच डेटा प्रवाह को परिभाषित कर सकते हैं। सबसे आसान DataStage जॉब एक ETL जॉब है।
इसमें हमें सबसे पहले सोर्स सिस्टम से डेटा निकालने की जरूरत होती है, जिसके लिए हम फाइल स्टेज या डेटाबेस स्टेज का उपयोग कर सकते हैं क्योंकि मेरा सोर्स सिस्टम या तो डेटाबेस टेबल या फाइल हो सकता है।
मान लें कि हम एक पाठ फ़ाइल से डेटा पढ़ रहे हैं। इस स्थिति में, हम समानांतर नौकरी विंडो में 'अनुक्रमिक फ़ाइल' चरण को खींचकर छोड़ देंगे। अब, हमें इस डेटा के शीर्ष पर कुछ परिवर्तन करने की आवश्यकता है। हम 'ट्रांसफार्मर' चरण का उपयोग करेंगे जो प्रसंस्करण श्रेणी के तहत उपलब्ध है। ट्रांसफार्मर चरण के तहत हम कोई भी तर्क लिख सकते हैं।
अंत में, हमें संसाधित डेटा को कुछ लक्ष्य तालिका में लोड करने की आवश्यकता है। मान लीजिए कि मेरा लक्ष्य डेटाबेस DB2 है। तो, इसके लिए, हम DB2 कनेक्टर चरण का चयन करेंगे। फिर हम अनुक्रमिक लिंक के माध्यम से इन डेटा राज्यों को जोड़ेंगे।
इसके बाद , हमें चरणों को कॉन्फ़िगर करने की आवश्यकता है ताकि वे सही फाइल सिस्टम या डेटाबेस को इंगित करें।
उदाहरण के लिए, अनुक्रमिक फ़ाइल चरण के लिए, हमें फ़ाइल नाम, फ़ाइल स्थान, कॉलम मेटाडेटा जैसे अनिवार्य मापदंडों को परिभाषित करने की आवश्यकता है।
फिर हमें डाटेज काम संकलित करने की आवश्यकता है। नौकरी के सिंटैक्स के लिए नौकरी की जाँच को संकलित करना और डेटासट नौकरी के लिए एक निष्पादन योग्य फ़ाइल बनाता है जिसे रन टाइम पर निष्पादित किया जा सकता है।
Q # 18) डेटास्टेज में अलग-अलग छंटाई विधियों को नाम दें।
उत्तर: दो तरीके उपलब्ध हैं:
- लिंक प्रकार
- इनबिल्ट डेटास्टेज सॉर्ट
क्यू # 19) एक बैच में अगर कोई नौकरी बीच में विफल हो जाती है और आप उस विशेष नौकरी से बैच को फिर से शुरू करना चाहते हैं और खरोंच से नहीं तो आप क्या करेंगे?
उत्तर: डाटाजेज में, नौकरी अनुक्रम में एक विकल्प है - ‘चौकियों को जोड़ें ताकि अनुक्रम विफल होने पर फिर से शुरू हो सके’ । यदि इस विकल्प की जांच की जाती है, तो हम उस बिंदु से नौकरी के अनुक्रम को फिर से जोड़ सकते हैं जहां यह विफल रहा।
Q # 20) आप डेटासट जॉब को कैसे आयात और निर्यात करते हैं?
उत्तर: एफ या यह, इसके लिए कमांड-लाइन फ़ंक्शन के नीचे
- आयात: dsimport.exe
- निर्यात: dsexport.exe
Q # 21) डेटासट में क्या रूटीन हैं? विभिन्न प्रकार के दिनचर्या को सूचीबद्ध करें।
उत्तर: दिनचर्या डीएस प्रबंधक द्वारा परिभाषित कार्यों का एक समूह है। यह ट्रांसफार्मर चरण के माध्यम से चलाया जाता है।
दिनचर्या के 3 प्रकार हैं:
- समानांतर दिनचर्या
- मेनफ्रेम दिनचर्या
- सर्वर रूटीन
Q # 22) आप डेटास्टेज में डुप्लिकेट मान कैसे हटाते हैं?
उत्तर: डुप्लिकेट मानों को संभालने के दो तरीके हैं
- हम डुप्लिकेट को खत्म करने के लिए डुप्लिकेट चरण को हटा सकते हैं।
- हम डुप्लिकेट को हटाने के लिए सॉर्ट चरण का उपयोग कर सकते हैं। सॉर्टिंग चरण में एक संपत्ति है जिसे 'डुप्लिकेट की अनुमति दें' कहा जाता है। हमें इस संपत्ति को गलत के बराबर सेट करने पर आउटपुट में डुप्लिकेट मान नहीं मिले।
Q # 23) डेटासटेज निर्देशक में विभिन्न प्रकार के विचार क्या उपलब्ध हैं?
उत्तर: डाटाजेज निर्देशक में 3 तरह के विचार उपलब्ध हैं। वे:
- लॉग देखें
- स्थिति देखें
- नौकरी का दृश्य
Q # 24) सूचनात्मक और डेटास्टेट के बीच अंतर। आप किसे चुनेंगे और क्यों?
उत्तर: Informatica और DataStage दोनों शक्तिशाली ETL उपकरण हैं।
सूचीबद्ध उपकरण दोनों उपकरणों के बीच अंतर करते हैं:
कम्प्यूटिंग | डाटास्टेज | |
---|---|---|
समानांतर प्रसंस्करण | Informatica समानांतर प्रसंस्करण का समर्थन नहीं करता है। | इसके विपरीत, डेटास्टेज समानांतर प्रसंस्करण के लिए तंत्र प्रदान करता है। |
एससीडी को लागू करना | इंफॉर्मेटिका में एससीडी (धीरे-धीरे बदलते आयाम) को लागू करना काफी सरल है। | हालांकि, डेटास्टेज में एससीडी को लागू करना जटिल है। डेटास्टेज केवल कस्टम स्क्रिप्ट के माध्यम से एससीडी का समर्थन करता है। |
संस्करण नियंत्रण | Informatica चेक-इन और ऑब्जेक्ट के चेक-आउट के माध्यम से संस्करण को नियंत्रित करने का समर्थन करता है। | हालाँकि, हमारे पास यह कार्यक्षमता डेटास्टेट में उपलब्ध नहीं है। |
उपलब्ध रूपांतरण | कम परिवर्तन उपलब्ध हैं। | डेटास्टेज इंफॉर्मेटिका की तुलना में अधिक विविधता प्रदान करता है। |
देखने की शक्ति | Informatica बहुत शक्तिशाली गतिशील कैश लुकअप प्रदान करता है | हमारे पास डेटास्टेट में कोई समान चीज नहीं है। |
अपनी निजी राय में, मैं डेटासटेज पर इंफॉर्मेटिका के साथ जाऊंगा। कारण यह है कि मैंने DataStage की तुलना में Informatica को अधिक व्यवस्थित और उपयोगकर्ता के अनुकूल पाया है।
एक और मजबूत कारण यह है कि डेटस्टेज की तुलना में इनफॉर्मेटिका में डिबगिंग और एरर हैंडलिंग बहुत बेहतर है। इसलिए, इंफॉर्मेटिका में मुद्दों को ठीक करना आसान हो जाता है। डेटास्टेज पूर्ण त्रुटि हैंडलिंग समर्थन प्रदान नहीं करता है।
=> Informatica के बारे में अधिक जानना चाहते हैं? हमारे पास एक यहाँ विस्तृत विवरण।
क्यू # 25) सिस्टम चर का एक विचार दे।
उत्तर: सिस्टम वेरिएबल्स केवल पढ़ने के लिए शुरुआत वाले वेरिएबल हैं ‘@ ' जिसे ट्रांसफार्मर चरण या दिनचर्या द्वारा पढ़ा जा सकता है। उनका उपयोग सिस्टम की जानकारी प्राप्त करने के लिए किया जाता है।
Q # 26) निष्क्रिय अवस्था और सक्रिय अवस्था में क्या अंतर है?
उत्तर: निष्क्रिय चरणों का उपयोग निष्कर्षण और लोडिंग के लिए किया जाता है जबकि परिवर्तन के लिए सक्रिय चरणों का उपयोग किया जाता है।
Q # 27) डाटाजेज में विभिन्न प्रकार के कंटेनर क्या उपलब्ध हैं?
उत्तर: हमारे पास डाटेज में 2 कंटेनर हैं:
- स्थानीय कंटेनर
- साझा कंटेनर
Q # 28) अस्थायी रूप से या स्थायी रूप से संग्रहित चर का मूल्य है?
जावा में सूची कैसे घोषित करें
उत्तर: अस्थायी रूप से। यह एक अस्थायी चर है।
Q # 29) डेटासट में विभिन्न प्रकार की नौकरियां क्या हैं?
उत्तर: डाटाजेज में हमारे पास दो तरह की नौकरियां हैं:
- सर्वर नौकरियां (वे क्रमबद्ध तरीके से चलती हैं)
- समानांतर नौकरियां (वे समानांतर तरीके से निष्पादित होती हैं)
Q # 30) डेटास्टेज के निदेशक का क्या उपयोग है?
उत्तर: Datastage निदेशक के माध्यम से, हम एक नौकरी अनुसूची कर सकते हैं, नौकरी को मान्य कर सकते हैं, नौकरी निष्पादित कर सकते हैं और नौकरी की निगरानी कर सकते हैं।
Q # 31) हैश फाइल के विभिन्न प्रकार क्या हैं?
उत्तर: हमारे पास 2 प्रकार की हैश फाइलें हैं:
- स्टेटिक हैश फ़ाइल
- डायनामिक हैश फ़ाइल
क्यू # 32) एक गुणवत्ता चरण क्या है?
उत्तर: गुणवत्ता चरण (जिसे अखंडता चरण भी कहा जाता है) एक ऐसा चरण है जो विभिन्न स्रोतों से आने वाले डेटा को एक साथ जोड़ने में सहायता करता है।
निष्कर्ष
आपको Datastage वास्तुकला, इसकी मुख्य विशेषताओं पर एक आसान ज्ञान रखना चाहिए और आपको यह समझाने में सक्षम होना चाहिए कि यह कुछ अन्य लोकप्रिय ईटीएफ टूल से कैसे अलग है।
इसके साथ ही , आपके पास विभिन्न चरणों और उनके उपयोग पर एक उचित विचार होना चाहिए, डेटासटेज जॉब बनाने और इसे चलाने का एक तरीका है।
अनुशंसित पढ़ना => ईटीएल परीक्षण क्या है?
शुभकामनाएं!
अनुशंसित पाठ
- ईटीएल परीक्षण साक्षात्कार प्रश्न और उत्तर
- ETL प्रक्रिया में उपयोगी 10 सर्वश्रेष्ठ डेटा मानचित्रण उपकरण (2021 सूची)
- 2021 में 15 सर्वश्रेष्ठ ईटीएल उपकरण (पूरी अपडेट सूची)
- उदाहरणों के साथ डेटा वेयरहाउस टेस्टिंग ट्यूटोरियल | ईटीएल परीक्षण गाइड
- ETL परीक्षण डेटा वेयरहाउस परीक्षण ट्यूटोरियल (एक पूर्ण गाइड)
- ईटीएल बनाम डीबी टेस्टिंग - ईटीएल टेस्टिंग नीड, प्लानिंग और ईटीएल टूल्स पर एक नज़दीकी नज़र
- Informatica PowerCenter टूल का उपयोग करके ईटीएल परीक्षण कैसे करें
- डेटा वेयरहाउस (ETL) में मेटाडेटा उदाहरणों के साथ समझाया गया
- प्रेस रिलीज़ - iCEDQ सॉफ्ट नया संस्करण ETL परीक्षण और डेटा माइग्रेशन परीक्षण प्लेटफ़ॉर्म की रिलीज़
- 2021 में शीर्ष 10 ईटीएल परीक्षण उपकरण
- डेटा वेयरहाउस में ईटीएल (एक्सट्रैक्ट, ट्रांसफॉर्म, लोड) प्रक्रिया क्या है?