data mining techniques
डेटा खनन तकनीकों पर यह गहराई से ट्यूटोरियल उपयोगी डेटा निकालने के लिए एल्गोरिदम, डेटा खनन उपकरण और तरीके बताते हैं:
इस में सभी के लिए गहराई से खनन खनन प्रशिक्षण ट्यूटोरियल , हमने अपने पिछले ट्यूटोरियल में डेटा माइनिंग के बारे में खोजबीन की।
इस ट्यूटोरियल में, हम डेटा निष्कर्षण के लिए उपयोग की जाने वाली विभिन्न तकनीकों के बारे में जानेंगे। जैसा कि हम जानते हैं कि डेटा माइनिंग डेटा की विशाल मात्रा से उपयोगी जानकारी निकालने की एक अवधारणा है, उपयोगी जानकारी निकालने के लिए डेटा के बड़े सेट पर कुछ तकनीकों और तरीकों को लागू किया जाता है।
ये तकनीक मूल रूप से डेटा सेट पर लागू तरीकों और एल्गोरिदम के रूप में हैं। कुछ डेटा माइनिंग तकनीकों में शामिल हैं खनन आवृत्ति पैटर्न, संघ और सहसंबंध, वर्गीकरण, क्लस्टरिंग, आउटलेयर का पता लगाना, और सांख्यिकीय, दृश्य और ऑडियो डेटा खनन जैसी कुछ उन्नत तकनीकें।
आमतौर पर, डेटा खनन तकनीकों के लिए रिलेशनल डेटाबेस, ट्रांसेक्शनल डेटाबेस और डेटा वेयरहाउस का उपयोग किया जाता है। हालांकि, जटिल डेटा के लिए कुछ उन्नत खनन तकनीकें भी हैं जैसे समय श्रृंखला, प्रतीकात्मक अनुक्रम और जैविक अनुक्रमिक डेटा।
आप क्या सीखेंगे:
- डाटा माइनिंग तकनीकों का उद्देश्य
- डेटा निष्कर्षण तकनीकों की सूची
- शीर्ष डेटा खनन एल्गोरिदम
- डेटा निष्कर्षण के तरीके
- शीर्ष डेटा खनन उपकरण
- निष्कर्ष
- अनुशंसित पाठ
डाटा माइनिंग तकनीकों का उद्देश्य
प्रत्येक दिन बड़ी मात्रा में डेटा संग्रहीत किए जाने के साथ, व्यवसाय अब उनसे रुझानों का पता लगाने में रुचि रखते हैं। डेटा निष्कर्षण तकनीक कच्चे डेटा को उपयोगी ज्ञान में परिवर्तित करने में मदद करती है। भारी मात्रा में डेटा की खान के लिए, सॉफ्टवेयर की आवश्यकता होती है क्योंकि मानव के लिए डेटा की बड़ी मात्रा के माध्यम से मैन्युअल रूप से जाना असंभव है।
एक डेटा माइनिंग सॉफ़्टवेयर बड़े डेटाबेस में विभिन्न वस्तुओं के बीच संबंधों का विश्लेषण करता है जो निर्णय लेने की प्रक्रिया में मदद कर सकता है, ग्राहकों के बारे में अधिक जान सकता है, शिल्प विपणन रणनीतियों, बिक्री में वृद्धि और लागत को कम कर सकता है।
डेटा निष्कर्षण तकनीकों की सूची
डेटा खनन तकनीक जिसे लागू किया जाना है वह हमारे डेटा विश्लेषण के परिप्रेक्ष्य पर निर्भर करता है।
तो आइए विभिन्न तकनीकों पर चर्चा करें कि डेटा निष्कर्षण को विभिन्न तरीकों से कैसे किया जा सकता है:
# 1) बार-बार पैटर्न खनन / एसोसिएशन विश्लेषण
इस प्रकार की डेटा माइनिंग तकनीक दिए गए डेटासेट में आवर्ती रिश्तों की तलाश करती है। यह डेटाबेस में विभिन्न मदों के बीच दिलचस्प संघों और सहसंबंधों की तलाश करेगा और एक पैटर्न की पहचान करेगा।
एक उदाहरण, इस तरह के, 'शॉपिंग बास्केट एनालिसिस' होगा: यह पता लगाना कि 'ग्राहकों को स्टोर में एक साथ कौन से उत्पाद खरीदने की संभावना है?' जैसे कि रोटी और मक्खन।
आवेदन: स्टोर अलमारियों, विपणन, उत्पादों की क्रॉस-सेलिंग पर उत्पादों के प्लेसमेंट को डिजाइन करना।
पैटर्न को संघ के नियमों के रूप में दर्शाया जा सकता है। एसोसिएशन नियम कहता है कि समर्थन और विश्वास संबंधित वस्तुओं की उपयोगिता का पता लगाने के लिए पैरामीटर हैं। लेनदेन जो एक बार में एक साथ खरीदे गए दोनों वस्तुओं को एक समर्थन के रूप में जाना जाता है।
लेनदेन जहां ग्राहकों ने दोनों वस्तुओं को खरीदा लेकिन एक के बाद एक आत्मविश्वास है। खनन पैटर्न को दिलचस्प माना जाएगा अगर इसमें ए न्यूनतम समर्थन सीमा तथा न्यूनतम आत्मविश्वास सीमा मान। सीमा मान डोमेन विशेषज्ञों द्वारा तय किए जाते हैं।
रोटी => मक्खन [समर्थन = २%, आत्मविश्वास -६०%]
उपर्युक्त कथन संघ के शासन का एक उदाहरण है। इसका मतलब यह है कि 2% लेन-देन है जो ब्रेड और मक्खन को एक साथ खरीदता है और 60% ग्राहक हैं जिन्होंने ब्रेड के साथ-साथ बटर भी खरीदा है।
एसोसिएशन विश्लेषण को लागू करने के लिए कदम:
- बार-बार आइटम ढूंढना। आइटमसेट का अर्थ आइटम का एक सेट है। K आइटम वाला एक आइटम k- आइटमसेट है। एक आइटमसेट की आवृत्ति उन ट्रांजैक्शंस की संख्या होती है जिसमें आइटमसेट होता है।
- बार-बार आइटम से मजबूत संघ नियम बनाना। मजबूत एसोसिएशन नियमों से हमारा मतलब है कि न्यूनतम सीमा समर्थन और विश्वास को पूरा करती है।
एप्रीओरी एल्गोरिदम, पैटर्न ग्रोथ एप्रोच, और वर्टिकल डेटा फॉर्मेट का उपयोग करके खनन जैसे विभिन्न आइटम अक्सर खनन के तरीके हैं। इस तकनीक को आमतौर पर मार्केट बास्केट एनालिसिस के रूप में जाना जाता है।
# 2) सहसंबंध विश्लेषण
सहसंबंध विश्लेषण केवल एसोसिएशन नियमों का एक विस्तार है। कभी-कभी समर्थन और विश्वास पैरामीटर अभी भी उपयोगकर्ताओं को निर्बाध पैटर्न दे सकते हैं।
उपरोक्त कथन का समर्थन करने वाला एक उदाहरण हो सकता है: विश्लेषण किए गए 1000 लेनदेन में से 600 में केवल ब्रेड होता है, जबकि 750 में बटर और 400 में ब्रेड और बटर दोनों होते हैं। मान लीजिए कि एसोसिएशन शासन चलाने के लिए न्यूनतम समर्थन 30% है और न्यूनतम आत्मविश्वास 60% है।
समर्थन मूल्य 400/1000 = 40% और आत्मविश्वास मूल्य = 400/600 = 66% सीमा से मिलता है। हालांकि, हम देखते हैं कि मक्खन खरीदने की संभावना 75% है जो 66% से अधिक है। इसका मतलब यह है कि रोटी और मक्खन नकारात्मक रूप से सहसंबद्ध हैं क्योंकि एक की खरीद से दूसरे की खरीद में कमी आएगी। परिणाम धोखा दे रहे हैं।
उपरोक्त उदाहरण से, समर्थन और आत्मविश्वास को एक और दिलचस्पता माप के साथ पूरक किया जाता है अर्थात् सहसंबंध विश्लेषण, जो दिलचस्प पैटर्न को खनन करने में मदद करेगा।
ए => बी [समर्थन, आत्मविश्वास, सहसंबंध]।
सहसंबंध नियम को आइटम ए और बी के बीच समर्थन, विश्वास और सहसंबंध द्वारा मापा जाता है। सहसंबंध को लिफ्ट और ची-स्क्वायर द्वारा मापा जाता है।
वेबसाइट जो youtube वीडियो को mp4 में परिवर्तित करती है
(मैं उठाता हूं: जैसा कि शब्द ही कहता है, लिफ़्ट उस डिग्री का प्रतिनिधित्व करता है जिस पर एक आइटम की उपस्थिति अन्य आइटमों की घटना को बढ़ाती है।
A और B की घटना के बीच की लिफ्ट को इसके द्वारा मापा जा सकता है:
लिफ्ट (ए, बी) = पी (ए यू बी) / पी (ए)। पी (बी)।
अगर यह है<1, then A and B are negatively correlated.
अगर यह> 1 है। तब ए और बी सकारात्मक रूप से सहसंबद्ध होते हैं जिसका अर्थ है कि एक की घटना दूसरे की घटना का अर्थ है।
यदि यह = 1 है, तो उनके बीच कोई संबंध नहीं है।
(ii) ची-स्क्वायर: यह एक और सहसंबंध उपाय है। यह अपेक्षित मूल्य से विभाजित स्लॉट (ए और बी जोड़ी) के लिए देखे गए और अपेक्षित मूल्य के बीच के अंतर को मापता है।
यदि यह> 1 है, तो यह नकारात्मक रूप से सहसंबद्ध है।
# 3) वर्गीकरण
वर्गीकरण महत्वपूर्ण डेटा वर्गों के मॉडल बनाने में मदद करता है। क्लास लेबल की भविष्यवाणी करने के लिए एक मॉडल या एक क्लासिफायरियर का निर्माण किया जाता है। लेबल 'हां' या 'नहीं', 'सुरक्षित' या 'जोखिम भरा' जैसे असतत मूल्यों वाले परिभाषित वर्ग हैं। यह एक प्रकार की पर्यवेक्षित शिक्षा है क्योंकि लेबल वर्ग पहले से ही ज्ञात है।
डेटा वर्गीकरण दो चरणों वाली प्रक्रिया है:
- सीखने का चरण: मॉडल का निर्माण यहाँ किया गया है। एक पूर्व-परिभाषित एल्गोरिथ्म डेटा पर लागू होता है जिसे प्रदान किए गए वर्ग लेबल के साथ विश्लेषण करने के लिए और वर्गीकरण नियमों का निर्माण किया जाता है।
- वर्गीकरण चरण: मॉडल का उपयोग दिए गए डेटा के लिए वर्ग लेबल की भविष्यवाणी करने के लिए किया जाता है। वर्गीकरण नियमों की सटीकता का परीक्षण डेटा द्वारा अनुमान लगाया जाता है, जो यदि सटीक पाया जाता है तो नए डेटा ट्यूपल्स के वर्गीकरण के लिए उपयोग किया जाता है।
आइटम में आइटम वर्ग लेबल स्तर पर कार्यों की भविष्यवाणी करने के लिए लक्ष्य श्रेणियों को सौंपा जाएगा।
आवेदन: बैंक ऋण आवेदकों की पहचान निम्न, मध्यम या उच्च जोखिम वाले व्यवसायों के रूप में करते हैं, जो आयु वर्ग के वर्गीकरण के आधार पर विपणन अभियान डिजाइन करते हैं। `
# 4) निर्णय ट्री इंडक्शन
निर्णय पेड़ प्रेरण विधि वर्गीकरण विश्लेषण के अंतर्गत आता है। एक निर्णय वृक्ष एक वृक्ष जैसी संरचना है जो समझने में आसान और सरल और तेज़ है। इसमें, प्रत्येक गैर-पत्ती नोड एक विशेषता पर एक परीक्षण का प्रतिनिधित्व करता है और प्रत्येक शाखा परीक्षण के परिणाम का प्रतिनिधित्व करता है, और पत्ती नोड वर्ग लेबल का प्रतिनिधित्व करता है।
टपल में विशेषता मानों को निर्णय वृक्ष के मूल से लीफ नोड तक जांचा जाता है। निर्णय पेड़ लोकप्रिय हैं क्योंकि इसमें किसी भी डोमेन ज्ञान की आवश्यकता नहीं है। ये बहुआयामी डेटा का प्रतिनिधित्व कर सकते हैं। निर्णय पेड़ों को आसानी से वर्गीकरण नियमों में परिवर्तित किया जा सकता है।
आवेदन: निर्णय पेड़ों का निर्माण चिकित्सा, निर्माण, उत्पादन, खगोल विज्ञान आदि में किया जाता है। एक उदाहरण नीचे देखा जा सकता है:
# 5) बेयस वर्गीकरण
बायेसियन वर्गीकरण वर्गीकरण विश्लेषण का एक अन्य तरीका है। बेयस क्लासिफायर किसी विशेष वर्ग से संबंधित दिए गए टपल की संभावना की भविष्यवाणी करते हैं। यह बेयस प्रमेय पर आधारित है, जो संभावना और निर्णय सिद्धांत पर आधारित है।
बेयस वर्गीकरण निर्णय लेने की प्रक्रिया के लिए पूर्ववर्ती संभावना और पूर्व संभाव्यता पर काम करता है। पूर्ववर्ती संभाव्यता के द्वारा, परिकल्पना को दी गई जानकारी से बनाया गया है अर्थात् विशेषता मान ज्ञात हैं, जबकि पूर्व संभाव्यता के लिए, परिकल्पना को गुण मानों की परवाह किए बिना दिया जाता है।
# 6) क्लस्टरिंग विश्लेषण
यह डेटा के एक समूह को समूहों या वस्तुओं के समूह में विभाजित करने की एक तकनीक है। एल्गोरिदम का उपयोग करके क्लस्टरिंग की जाती है। यह एक प्रकार का अप्रशिक्षित शिक्षण है क्योंकि लेबल जानकारी ज्ञात नहीं है। क्लस्टरिंग विधियां उन डेटा की पहचान करती हैं जो एक दूसरे से समान या अलग हैं, और विशेषताओं का विश्लेषण किया जाता है।
क्लस्टर विश्लेषण को विभिन्न अन्य एल्गोरिदम जैसे लक्षण वर्णन, विशेषता सबसेट चयन, आदि के लिए पूर्व-चरण के रूप में उपयोग किया जा सकता है। क्लस्टर विश्लेषण का उपयोग बाह्य पहचान के लिए भी किया जा सकता है जैसे क्रेडिट कार्ड लेनदेन में उच्च खरीद।
अनुप्रयोग: छवि पहचान, वेब खोज और सुरक्षा।
# 7) बाहरी पहचान
डेटा ऑब्जेक्ट्स को खोजने की प्रक्रिया जो अन्य ऑब्जेक्ट्स से असाधारण व्यवहार रखती है, बाहरी रूपरेखा कहलाती है। बाह्य पहचान और क्लस्टर विश्लेषण एक दूसरे से संबंधित हैं। बाह्य तरीकों को सांख्यिकीय, निकटता-आधारित, क्लस्टरिंग-आधारित और वर्गीकरण आधारित में वर्गीकृत किया गया है।
आउटलेर के विभिन्न प्रकार हैं, उनमें से कुछ हैं:
- वैश्विक रूपरेखा: डेटा ऑब्जेक्ट बाकी डेटा सेट से काफी भटक गया।
- प्रासंगिक परिणाम: यह दिन, समय और स्थान जैसे कुछ कारकों पर निर्भर करता है। यदि कोई डेटा ऑब्जेक्ट किसी संदर्भ के संदर्भ में महत्वपूर्ण रूप से विचलन करता है।
- सामूहिक परिणाम: जब डेटा ऑब्जेक्ट के समूह में संपूर्ण डेटा सेट से अलग व्यवहार होता है।
आवेदन: क्रेडिट कार्ड धोखाधड़ी जोखिमों की पहचान, नवीनता का पता लगाना, आदि।
# 8) अनुक्रमिक पैटर्न
इस प्रकार के डेटा खनन में एक प्रवृत्ति या कुछ सुसंगत पैटर्न को मान्यता दी जाती है। दुकानों पर अपने उत्पादों को प्रदर्शित करने के लिए ग्राहक खरीद व्यवहार और अनुक्रमिक पैटर्न को समझते हैं।
आवेदन: ई-कॉमर्स उदाहरण जहां आप आइटम ए खरीदते हैं, यह दिखाएगा कि आइटम बी को अक्सर आइटम ए के साथ खरीदा जाता है जो पिछले क्रय इतिहास को देखते हैं।
# 9) प्रतिगमन विश्लेषण
इस प्रकार के विश्लेषण की निगरानी की जाती है और पहचान की जाती है कि विभिन्न संबंधों के बीच कौन से आइटम एक-दूसरे से संबंधित हैं या स्वतंत्र हैं। यह बिक्री, लाभ, तापमान, मानव व्यवहार के पूर्वानुमान आदि का अनुमान लगा सकता है। इसका एक डेटा सेट मूल्य है जो पहले से ही ज्ञात है।
जब कोई इनपुट प्रदान किया जाता है, तो प्रतिगमन एल्गोरिथ्म इनपुट और अपेक्षित मूल्य की तुलना करेगा, और त्रुटि की गणना सटीक परिणाम प्राप्त करने के लिए की जाती है।
आवेदन: विपणन और उत्पाद विकास प्रयासों की तुलना।
शीर्ष डेटा खनन एल्गोरिदम
डेटा माइनिंग तकनीकों को इसके पीछे एल्गोरिदम के माध्यम से लागू किया जाता है। ये एल्गोरिदम डेटा निष्कर्षण सॉफ्टवेयर पर चलते हैं और व्यावसायिक आवश्यकता के आधार पर लागू होते हैं।
डेटा सेट का विश्लेषण करने के लिए संगठनों द्वारा व्यापक रूप से उपयोग किए जाने वाले कुछ एल्गोरिदम नीचे परिभाषित किए गए हैं:
- K- साधन: यह एक लोकप्रिय क्लस्टर विश्लेषण तकनीक है जहां समान वस्तुओं के समूह को एक साथ जोड़ा जाता है।
- एपोरिओरी एल्गोरिदम: यह एक बार-बार आयटम खनन तकनीक है और एसोसिएशन के नियम इसे ट्रांसेक्शनल डेटाबेस पर लागू किए जाते हैं। यह लगातार वस्तुओं का पता लगाएगा और सामान्य रुझानों को उजागर करेगा।
- K निकटतम पड़ोसी: इस पद्धति का उपयोग वर्गीकरण और प्रतिगमन विश्लेषण के लिए किया जाता है। K निकटतम पड़ोसी आलसी शिक्षा है जहाँ यह प्रशिक्षण डेटा संग्रहीत करता है और जब एक नया अनलिस्टेड डेटा आता है, तो यह इनपुट डेटा को वर्गीकृत करेगा।
- जहाज जहाज: यह सरल संभाव्य वर्गीकरण एल्गोरिदम का एक समूह है जो यह मानता है कि प्रत्येक डेटा ऑब्जेक्ट सुविधाएँ दूसरे से स्वतंत्र हैं। यह बेयस प्रमेय का एक आवेदन पत्र है।
- AdaBoost: यह एक मशीन लर्निंग मेटा-एल्गोरिथ्म है, जिसका उपयोग प्रदर्शन को बेहतर बनाने के लिए किया जाता है। Adaboost शोर डेटा और आउटलेर्स के प्रति संवेदनशील है।
डेटा निष्कर्षण के तरीके
जटिल डेटा प्रकारों को संभालने के लिए कुछ उन्नत डेटा माइनिंग तरीके नीचे दिए गए हैं।
आज की दुनिया में डेटा सरल से जटिल डेटा तक विभिन्न प्रकार के होते हैं। जटिल डेटा प्रकारों के लिए, जैसे कि टाइम सीरीज़, मल्टी-डायमेंशनल, स्पेसियल और मल्टी-मीडिया डेटा, उन्नत एल्गोरिदम और तकनीकों की आवश्यकता होती है।
उनमें से कुछ नीचे वर्णित हैं:
- क्लिक करें: यह एक बहुआयामी उप-समूह में गुच्छों को खोजने के लिए पहली क्लस्टरिंग विधि थी।
- P3C: यह मध्यम से उच्च बहुआयामी डेटा के लिए एक प्रसिद्ध क्लस्टरिंग विधि है।
- LAKE: यह एक k- साधन आधारित पद्धति है जिसका उद्देश्य उच्च आयामी डेटा के लिए मध्यम से क्लस्टरिंग है। एल्गोरिथ्म संभव आउटलेर्स को हटाकर, तत्वों के डेटा को कश्मीर में विभाजित करता है।
- CURLER: यह एक सहसंबंध क्लस्टरिंग एल्गोरिथ्म है, यह रैखिक और गैर-रेखीय सहसंबंध दोनों को स्पॉट करता है।
शीर्ष डेटा खनन उपकरण
डेटा माइनिंग टूल्स सॉफ्टवेयर हैं जो डेटा का उपयोग करने के लिए किया जाता है। उपकरण बैकएंड पर एल्गोरिदम चलाते हैं। ये उपकरण बाजार में ओपन सोर्स, फ्री सॉफ्टवेयर और लाइसेंस संस्करण के रूप में उपलब्ध हैं।
डेटा निष्कर्षण उपकरण में से कुछ में शामिल हैं:
(1) रैपिडमैन
RapidMiner एनालिटिक्स टीमों के लिए एक ओपन-सोर्स सॉफ़्टवेयर प्लेटफ़ॉर्म है जो डेटा प्रस्तुत करने, मशीन सीखने और भविष्य कहनेवाला मॉडल परिनियोजन को एकजुट करता है। इस उपकरण का उपयोग डेटा खनन विश्लेषण करने और डेटा मॉडल बनाने के लिए किया जाता है। इसमें वर्गीकरण, क्लस्टरिंग, एसोसिएशन नियम खनन और प्रतिगमन एल्गोरिदम के लिए बड़े सेट हैं।
# 2) नारंगी
यह एक ओपन-सोर्स टूल है जिसमें डेटा विज़ुअलाइज़ेशन और विश्लेषण पैकेज है। ऑरेंज को किसी भी कामकाजी अजगर पर्यावरण में आयात किया जा सकता है। यह नए शोधकर्ताओं और छोटी परियोजनाओं के लिए अच्छी तरह से अनुकूल है।
# 3) भाषा
केईईएल (इवोल्यूशनरी लर्निंग पर आधारित ज्ञान निष्कर्षण) एक खुला स्रोत है ( GPLv3 ) जावा सॉफ्टवेयर टूल जिसका उपयोग बड़ी संख्या में विभिन्न ज्ञान डेटा खोज कार्यों के लिए किया जा सकता है।
# 4) SPSS
IBM SPSS मॉडलर IBM से डेटा माइनिंग और टेक्स्ट एनालिटिक्स सॉफ़्टवेयर एप्लिकेशन है। इसका उपयोग भविष्य कहनेवाला मॉडल बनाने और अन्य विश्लेषणात्मक कार्यों का संचालन करने के लिए किया जाता है।
# 5) KNIME
यह एक फ्री और ओपन-सोर्स टूल है जिसमें सेंटीमेंट एनालिसिस और सोशल नेटवर्क एनालिसिस के क्षेत्रों में डेटा क्लीनिंग एंड एनालिसिस पैकेज, स्पेशलाइज्ड एल्गोरिदम शामिल हैं। KNIME एक ही विश्लेषण में विभिन्न स्रोतों से डेटा को एकीकृत कर सकता है। इसमें जावा, पायथन और आर प्रोग्रामिंग के साथ एक इंटरफ़ेस है।
महत्वपूर्ण प्रश्न: वर्गीकरण भविष्यवाणी से कैसे भिन्न है?
विंडोज़ पर डाट फाइलें कैसे खोलें
वर्गीकरण डेटा का एक समूह है। वर्गीकरण का उदाहरण आयु वर्ग, चिकित्सा स्थिति आदि के आधार पर समूहित किया जाता है, जबकि भविष्यवाणी वर्गीकृत डेटा का उपयोग करके एक परिणाम प्राप्त कर रही है।
एक उदाहरण भविष्य कहनेवाला विश्लेषण आयु वर्ग के आधार पर हितों की भविष्यवाणी कर रहा है, एक चिकित्सा स्थिति के लिए उपचार। निरंतर मूल्यों के लिए भविष्यवाणी को अनुमान के रूप में भी जाना जाता है।
महत्वपूर्ण शब्द: प्रिडिक्टिव डेटा माइनिंग
प्रेडिक्टिव डेटा माइनिंग, बिजनेस इंटेलिजेंस और अन्य डेटा का उपयोग करके कुछ डेटा ट्रेंड की भविष्यवाणी या भविष्यवाणी करने के लिए किया जाता है। यह व्यवसायों को बेहतर विश्लेषण करने और बेहतर निर्णय लेने में मदद करता है। प्रिडिक्टिव एनालिटिक्स को अक्सर प्रिडिक्टिव डेटा माइनिंग के साथ जोड़ दिया जाता है।
प्रिडिक्टिव डेटा माइनिंग विश्लेषण के लिए प्रासंगिक डेटा का पता लगाता है। भविष्य कहनेवाला विश्लेषण परिणामों के पूर्वानुमान के लिए डेटा का उपयोग करता है।
निष्कर्ष
इस ट्यूटोरियल में, हमने विभिन्न डेटा माइनिंग तकनीकों पर चर्चा की है जो संगठनों और व्यवसायों को सबसे उपयोगी और प्रासंगिक जानकारी खोजने में मदद कर सकते हैं। इस जानकारी का उपयोग उन मॉडल बनाने के लिए किया जाता है जो व्यवसायों के लिए ग्राहकों के व्यवहार के बारे में भविष्यवाणी करेंगे।
डेटा माइनिंग तकनीकों के बारे में उपर्युक्त सभी जानकारी को पढ़कर कोई भी अपनी विश्वसनीयता और व्यवहार्यता को बेहतर तरीके से निर्धारित कर सकता है। डेटा निष्कर्षण तकनीकों में डेटा के साथ काम करना, डेटा में सुधार करना, डेटा का पुनर्गठन करना शामिल है। आवश्यक जानकारी का प्रारूप तकनीक और किए जाने वाले विश्लेषण पर आधारित है।
अंत में, सभी तकनीकों, विधियों और डेटा माइनिंग सिस्टम नए रचनात्मक नवाचारों की खोज में मदद करते हैं।
PREV ट्यूटोरियल | अगले ट्यूटोरियल
अनुशंसित पाठ
- डेटा माइनिंग: प्रक्रिया, तकनीक और डेटा विश्लेषण में प्रमुख मुद्दे
- 10 सर्वश्रेष्ठ डेटा मॉडलिंग उपकरण जटिल डिजाइन को प्रबंधित करने के लिए
- शीर्ष 15 सर्वश्रेष्ठ मुफ्त डेटा खनन उपकरण: सबसे व्यापक सूची
- डेटा इकट्ठा करने की रणनीतियों के साथ 10+ सर्वश्रेष्ठ डेटा संग्रह उपकरण
- शीर्ष 10 डेटाबेस डिज़ाइन उपकरण जटिल डेटा मॉडल बनाने के लिए
- 2021 में अपने डेटा आवश्यकताओं को पूरा करने के लिए 10+ सर्वश्रेष्ठ डेटा शासन उपकरण
- डाटा माइनिंग बनाम मशीन लर्निंग बनाम आर्टिफिशियल इंटेलिजेंस बनाम डीप लर्निंग
- 2021 में टॉप 14 बेस्ट टेस्ट डेटा मैनेजमेंट टूल्स