weka explorer visualization
यह ट्यूटोरियल बताता है कि WEKA एक्सप्लोरर का उपयोग करके डेटा विज़ुअलाइज़ेशन, K- साधन क्लस्टर विश्लेषण और एसोसिएशन नियम खनन कैसे करें:
में पिछला ट्यूटोरियल , हमने निर्णय वृक्ष के लिए WEKA डेटासेट, क्लासिफायर, और J48 एल्गोरिथम के बारे में सीखा।
जैसा कि हमने पहले देखा है, WEKA एक खुला स्रोत डेटा खनन उपकरण है जिसका उपयोग कई शोधकर्ता और छात्र कई मशीन सीखने के कार्यों को करने के लिए करते हैं। उपयोगकर्ता अपने मशीन सीखने के तरीकों का भी निर्माण कर सकते हैं और WEKA निर्देशिका में प्रदान किए गए नमूना डेटासेट पर प्रयोग कर सकते हैं।
WEKA में डेटा विज़ुअलाइज़ेशन .arff, .csv प्रारूप में नमूना डेटासेट या उपयोगकर्ता-निर्मित डेटासेट का उपयोग करके किया जा सकता है।
=> पूरी मशीन लर्निंग ट्रेनिंग सीरीज़ के माध्यम से पढ़ें
एसोसिएशन नियम खनन Apriori एल्गोरिथ्म का उपयोग किया जाता है। यह WEKA द्वारा लगातार पैटर्न खनन करने के लिए प्रदान किया गया एकमात्र एल्गोरिथ्म है।
WEKA में क्लस्टर विश्लेषण करने के लिए कई एल्गोरिदम मौजूद हैं जैसे कि FartherestFirst, FilteredCluster, और HierachicalCluster, आदि। इनमें से, हम SimpleKmeans का उपयोग करेंगे, जो कि क्लस्टरिंग की सबसे सरल विधि है।
आप क्या सीखेंगे:
- WEKA एक्सप्लोरर का उपयोग करके एसोसिएशन रूल माइनिंग
- K- साधन WEKA एक्सप्लोरर का उपयोग एल्गोरिथ्म
- WEKA का उपयोग करके डेटा विज़ुअलाइज़ेशन को लागू करें
- निष्कर्ष
WEKA एक्सप्लोरर का उपयोग करके एसोसिएशन रूल माइनिंग
आइए देखें कि WEKA एक्सप्लोरर का उपयोग करके एसोसिएशन रूल माइनिंग को कैसे लागू किया जाए।
एसोसिएशन नियम खनन
यह श्रीकांत और अग्रवाल द्वारा 1994 में विकसित और डिज़ाइन किया गया है। यह डेटा में पैटर्न खोजने में हमारी मदद करता है। यह एक डाटा माइनिंग प्रक्रिया है जो उन विशेषताओं को खोजती है जो एक साथ होती हैं या जो सहसंबद्ध हैं सुविधाएँ
कौन सा ऑपरेटिंग सिस्टम लैपटॉप के लिए सबसे अच्छा है
एसोसिएशन के नियमों के अनुप्रयोगों में एक बास्केट में खरीदी गई वस्तुओं का विश्लेषण करने के लिए मार्केट बास्केट एनालिसिस शामिल है; क्रॉस मार्केटिंग, अन्य व्यवसायों के साथ काम करने के लिए जो हमारे व्यवसाय उत्पाद मूल्य को बढ़ाता है जैसे वाहन डीलर और तेल कंपनी।
एक बड़े डेटासेट में लगातार आइटम पाए जाने के बाद एसोसिएशन के नियमों का पता लगाया जाता है। ये डेटासेट खनन एल्गोरिदम जैसे एप्रीओरी और एफपी ग्रोथ का उपयोग करते हुए पाए जाते हैं। समर्थन और विश्वास उपायों का उपयोग करके बार-बार आइटमसेट खनन खानों का डेटा।
समर्थन और आत्मविश्वास
सहयोग इस संभावना को मापता है कि दो वस्तुओं को एक ही लेनदेन में खरीदा जाता है जैसे कि रोटी और मक्खन। विश्वास एक ऐसा उपाय है जो इस संभावना को बताता है कि दो आइटम एक के बाद एक खरीदे जाते हैं लेकिन लैपटॉप और कंप्यूटर एंटीवायरस सॉफ़्टवेयर जैसे एक साथ नहीं।
न्यूनतम सीमा समर्थन और न्यूनतम सीमा विश्वास मूल्यों को लेन-देन की भविष्यवाणी करने और सबसे अक्सर होने वाले आइटम का पता लगाने के लिए माना जाता है।
WEKA एक्सप्लोरर का उपयोग कर कार्यान्वयन
WEKA का कार्यान्वयन होता है एपोरिओरी एल्गोरिदम सीखने के नियमों के लिए नियम। Apriori केवल बाइनरी विशेषताओं, श्रेणीबद्ध डेटा (नाममात्र डेटा) के साथ काम करता है, इसलिए यदि डेटा सेट में कोई संख्यात्मक मान शामिल हैं, तो उन्हें पहले नाममात्र में परिवर्तित करें।
Apriori न्यूनतम समर्थन और विश्वास दहलीज के साथ सभी नियमों का पता लगाता है।
नीचे दिए गए चरणों का पालन करें:
# 1) एक एक्सेल फ़ाइल डाटासेट तैयार करें और इसे ' apriori.csv ”।
#दो) WEKA एक्सप्लोरर खोलें और Preprocess टैब के तहत 'apriori.csv' फ़ाइल चुनें।
# 3) फाइल अब WEKA एक्सप्लोरर में लोड हो जाती है।
# 4) चेकबॉक्स को चेक करके और नीचे की छवि में दिखाए अनुसार निकालें पर क्लिक करके लेनदेन क्षेत्र को हटा दें। अब फ़ाइल को 'apyritest.arff' के रूप में सहेजें।
# 5) एसोसिएट टैब पर जाएं। एप्रीओरी नियमों का यहां से खनन किया जा सकता है।
# 6) समर्थन और विश्वास पैरामीटर सेट करने के लिए चुनें पर क्लिक करें। यहाँ सेट किए जा सकने वाले विभिन्न पैरामीटर निम्न हैं:
- ' लोअरबाउंडमाइनसुपोर्ट ' तथा ' अपरबाउंडमाइनसुपोर्ट ”, यह समर्थन स्तर अंतराल है जिसमें हमारा एल्गोरिथ्म काम करेगा।
- डेल्टा समर्थन में वृद्धि है। इस मामले में, 0.05 0.1 से 1 तक समर्थन की वृद्धि है।
- मेट्रिक टाइप 'आत्मविश्वास', 'लिफ्ट', 'उत्तोलन' और 'रूपांतरण' हो सकता है। यह बताता है कि हम एसोसिएशन के नियमों को कैसे रैंक करते हैं। आम तौर पर, कॉन्फिडेंस को चुना जाता है।
- अंक खनन नियमों की संख्या बताता है। डिफ़ॉल्ट रूप से, इसे 10 के रूप में सेट किया गया है।
- महत्वपूर्ण स्तर दर्शाया गया है कि आत्मविश्वास स्तर का महत्व क्या है।
# 7) बटन चुनने के लिए अगला टेक्स्टबॉक्स, 'दिखाता है' Apriori-N-10-T-0-C-0.9-D 0.05-U1.0-M0.1-S-1.0-c-1 ', जो सेटिंग टैब में एल्गोरिथ्म के लिए निर्धारित सारांश नियमों को दर्शाता है।
# 8) स्टार्ट बटन पर क्लिक करें। एसोसिएशन के नियम दाहिने पैनल में उत्पन्न होते हैं। इस पैनल में 2 खंड हैं। पहले एल्गोरिथ्म है, जिसे चलाने के लिए डेटासेट चुना जाता है। दूसरा भाग एप्रीओरी सूचना को दर्शाता है।
आइए हम सही पैनल में रन जानकारी को समझते हैं:
- योजना ने हमें अप्रीरी का उपयोग किया।
- उदाहरण और विशेषताएँ: इसके 6 उदाहरण और 4 विशेषताएँ हैं।
- न्यूनतम समर्थन और न्यूनतम आत्मविश्वास क्रमशः 0.4 और 0.9 है। 6 उदाहरणों में से, 2 उदाहरण मिनट समर्थन के साथ पाए जाते हैं,
- खनन संघ नियम के लिए निष्पादित चक्रों की संख्या 12 है।
- उत्पन्न बड़े आइटम 3: एल (1), एल (2), एल (3) हैं, लेकिन ये क्रमबद्ध नहीं हैं क्योंकि उनके आकार क्रमशः 7, 11 और 5 हैं।
- पाए गए नियमों को रैंक दी गई है। इन नियमों की व्याख्या इस प्रकार है:
- बटर टी 4 => बीयर एफ 4: का मतलब है 6 में से 4 उदाहरण बताते हैं कि मक्खन के लिए, बीयर झूठी है। यह एक मजबूत एसोसिएशन देता है। आत्मविश्वास का स्तर 0.1 है।
उत्पादन
Apriori एल्गोरिथम के साथ WEKA एक्सप्लोरर का उपयोग करके एसोसिएशन के नियमों का पता लगाया जा सकता है। यह एल्गोरिथ्म WEKA निर्देशिका में उपलब्ध सभी प्रकार के डेटासेट के साथ-साथ उपयोगकर्ता द्वारा बनाए गए अन्य डेटासेट पर भी लागू किया जा सकता है। एल्गोरिथ्म की सेटिंग विंडो का उपयोग करके समर्थन और आत्मविश्वास और अन्य मापदंडों को सेट किया जा सकता है।
K- साधन WEKA एक्सप्लोरर का उपयोग एल्गोरिथ्म
आइए देखें कि WEKA एक्सप्लोरर का उपयोग करके क्लस्टरिंग के लिए K- साधन एल्गोरिथ्म को कैसे लागू किया जाए।
क्लस्टर विश्लेषण क्या है
क्लस्टरिंग एल्गोरिदम एक प्रकार की विशेषताओं के साथ डेटा के समूह बनाने के लिए उपयोग किए जाने वाले सीखने वाले एल्गोरिदम हैं। यह समूहों और उपसमूहों में समानताओं के साथ वस्तुओं को एकत्रित करता है जिससे डेटासेट का विभाजन होता है। क्लस्टर विश्लेषण सबसेट में डेटासेट के विभाजन की प्रक्रिया है। इन सबसेट को क्लस्टर कहा जाता है और क्लस्टर के सेट को क्लस्टरिंग कहा जाता है।
क्लस्टर इंटेलिजेंस का उपयोग कई अनुप्रयोगों में किया जाता है जैसे छवि पहचान, पैटर्न मान्यता, वेब खोज, और सुरक्षा, व्यवसाय खुफिया में जैसे समान समान वाले ग्राहकों का समूह।
K- साधन क्लस्टरिंग क्या है
K का अर्थ है क्लस्टरिंग सबसे सरल क्लस्टरिंग एल्गोरिथम है। K- क्लस्टरिंग एल्गोरिथ्म में, डेटासेट को K- क्लस्टर में विभाजित किया जाता है। एक उद्देश्य फ़ंक्शन का उपयोग विभाजन की गुणवत्ता का पता लगाने के लिए किया जाता है ताकि समान ऑब्जेक्ट्स एक समूह में हों और अन्य समूहों में भिन्न वस्तुओं।
इस विधि में, क्लस्टर का प्रतिनिधित्व करने के लिए क्लस्टर का केंद्रक पाया जाता है। सेंट्रोइड को क्लस्टर के केंद्र के रूप में लिया जाता है जिसे क्लस्टर के भीतर बिंदुओं के औसत मूल्य के रूप में गणना की जाती है। अब बिंदु और केंद्र के बीच यूक्लिडियन दूरी को मापने के द्वारा क्लस्टरिंग की गुणवत्ता पाई जाती है। यह दूरी अधिकतम होनी चाहिए।
कैसे K- मीन क्लस्टरिंग एल्गोरिदम काम करता है
चरण 1: K का मान चुनें जहाँ K, समूहों की संख्या है।
चरण 2: प्रत्येक बिंदु को Iterate करें और उस क्लस्टर को असाइन करें जो इसके निकटतम केंद्र है। जब प्रत्येक तत्व पुनरावृत्त होता है तो सभी समूहों के केंद्रक की गणना करें।
चरण 3: डेटासेट से हर तत्व को अलग करें और बिंदु और हर क्लस्टर के केंद्रक के बीच यूक्लिडियन दूरी की गणना करें। यदि कोई बिंदु क्लस्टर में मौजूद है, जो उसके निकटतम नहीं है, तो उस बिंदु को निकटतम क्लस्टर में पुन: असाइन करें और डेटासेट में सभी बिंदुओं पर यह प्रदर्शन करने के बाद, फिर से प्रत्येक क्लस्टर के केंद्रक की गणना करें।
चरण 4: चरण # 3 का प्रदर्शन तब तक करें जब तक कि कोई नया असाइनमेंट न हो जो लगातार दो पुनरावृत्तियों के बीच हुआ हो।
K- मतलब क्लस्टरिंग कार्यान्वयन WEKA का उपयोग करना
वीका का उपयोग करते हुए कार्यान्वयन के चरण इस प्रकार हैं:
# 1) WEKA एक्सप्लोरर खोलें और Preprocess टैब में ओपन फाइल पर क्लिक करें। डेटासेट 'वोट.फ़र' चुनें।
#दो) 'क्लस्टर' टैब पर जाएं और 'चुनें' बटन पर क्लिक करें। 'SimpleKMeans' के रूप में क्लस्टरिंग विधि का चयन करें।
# 3) सेटिंग्स चुनें और फिर निम्नलिखित फ़ील्ड सेट करें:
- यूक्लिडियन के रूप में दूरी समारोह
- समूहों की संख्या के रूप में 6. समूहों की अधिक संख्या के साथ, चुकता त्रुटि का योग कम हो जाएगा।
- बीज के रूप में 10.
ओके पर क्लिक करें और एल्गोरिथ्म शुरू करें।
# 4) बाएं पैनल में स्टार्ट पर क्लिक करें। एल्गोरिथ्म सफेद स्क्रीन पर प्रदर्शित करता है। चलिए जानकारी का विश्लेषण करते हैं:
- स्कीम, रिलेशन, इंस्टेंसेस और एट्रीब्यूट्स डेटासेट की प्रॉपर्टी और उपयोग की जाने वाली क्लस्टरिंग विधि का वर्णन करते हैं। इस स्थिति में, वोट.फिर डेटासेट में 435 इंस्टेंस और 13 विशेषताएँ होती हैं।
- Kmeans क्लस्टर के साथ, पुनरावृत्तियों की संख्या 5 है।
- चुकता त्रुटि का योग 1098.0 है। यह त्रुटि समूहों की संख्या में वृद्धि के साथ कम हो जाएगी।
- केन्द्रक के साथ 5 अंतिम समूहों को एक तालिका के रूप में दर्शाया गया है। हमारे मामले में, क्लस्टर के सेंट्रोइड्स 168.0, 47.0, 37.0, 122.0.33.0 और 28.0 हैं।
- क्लस्टर इंस्टेंसेस क्लस्टर में गिरने वाले कुल इंस्टेंस की संख्या और प्रतिशत का प्रतिनिधित्व करते हैं।
# 5) 'क्लासेस टू क्लस्टर्स इवैल्यूएशन्स' चुनें और स्टार्ट पर क्लिक करें।
एल्गोरिथ्म वर्ग लेबल को क्लस्टर में असाइन करेगा। क्लस्टर 0 गणतंत्र का प्रतिनिधित्व करता है और क्लस्टर 3 लोकतंत्र का प्रतिनिधित्व करता है। गलत रूप से क्लस्टर किया गया उदाहरण 39.77% है जिसे महत्वहीन विशेषताओं की अनदेखी करके कम किया जा सकता है।
# 6) महत्वहीन विशेषताओं को अनदेखा करना। 'विशेषताओं पर ध्यान न दें' बटन पर क्लिक करें और हटाए जाने वाले विशेषताओं का चयन करें।
# 7) क्लस्टरिंग एल्गोरिदम परिणाम की कल्पना करने के लिए 'विज़ुअलाइज़' टैब का उपयोग करें। टैब पर जाएं और किसी भी बॉक्स पर क्लिक करें। जटर को अधिकतम पर ले जाएं।
- X- अक्ष और Y- अक्ष विशेषता का प्रतिनिधित्व करते हैं।
- नीला रंग वर्ग लेबल लोकतंत्र का प्रतिनिधित्व करता है और लाल रंग वर्ग लेबल गणराज्य का प्रतिनिधित्व करता है।
- क्लस्टर्स को देखने के लिए जटर का उपयोग किया जाता है।
- एक्स कोऑर्डिनेट विशेषता को बदलने और अन्य विशेषताओं के संबंध में क्लस्टरिंग को देखने के लिए विंडो के दाईं ओर स्थित बॉक्स पर क्लिक करें।
उत्पादन
K का अर्थ है क्लस्टरिंग एक सरल क्लस्टर विश्लेषण विधि है। सेटिंग टैब का उपयोग करके समूहों की संख्या निर्धारित की जा सकती है। प्रत्येक क्लस्टर के केन्द्रक की गणना क्लस्टर के भीतर सभी बिंदुओं के माध्यम के रूप में की जाती है। समूहों की संख्या में वृद्धि के साथ, वर्ग त्रुटियों का योग कम हो जाता है। क्लस्टर के भीतर की वस्तुएँ समान विशेषताओं और गुणों को प्रदर्शित करती हैं। क्लस्टर वर्ग लेबल का प्रतिनिधित्व करते हैं।
WEKA का उपयोग करके डेटा विज़ुअलाइज़ेशन को लागू करें
डेटा विज़ुअलाइज़ेशन
डेटा को स्पष्ट रूप से समझने के उद्देश्य से ग्राफ और भूखंडों के माध्यम से डेटा का प्रतिनिधित्व करने का तरीका डेटा विज़ुअलाइज़ेशन है।
डेटा का प्रतिनिधित्व करने के कई तरीके हैं। उनमें से कुछ इस प्रकार हैं:
(1) पिक्सेल उन्मुख दृश्य: यहां पिक्सेल का रंग आयाम मान का प्रतिनिधित्व करता है। पिक्सेल का रंग संगत मूल्यों का प्रतिनिधित्व करता है।
# 2) ज्यामितीय प्रतिनिधित्व: बहुआयामी डेटासेट 2 डी, 3 डी और 4 डी तितर बितर भूखंडों में दर्शाए गए हैं।
# 3) चिह्न आधारित दृश्य: डेटा को चेर्नॉफ के चेहरों और छड़ी के आंकड़ों का उपयोग करके दर्शाया गया है। चेर्नॉफ के चेहरे चेहरे की विशेषताओं और उनके बीच अंतर को पहचानने की मानव मन की क्षमता का उपयोग करते हैं। छड़ी आंकड़ा बहुआयामी डेटा का प्रतिनिधित्व करने के लिए 5 छड़ी के आंकड़ों का उपयोग करता है।
# 4) पदानुक्रमित डेटा विज़ुअलाइज़ेशन: डेटासेट ट्रेपैप्स का उपयोग करके दर्शाया जाता है। यह नेस्टेड त्रिकोण के सेट के रूप में पदानुक्रमित डेटा का प्रतिनिधित्व करता है।
WEKA एक्सप्लोरर का उपयोग कर डेटा विज़ुअलाइज़ेशन
WEKA का उपयोग करके डेटा विज़ुअलाइज़ेशन IRIS.arff डेटासेट पर किया जाता है।
शामिल कदम इस प्रकार हैं:
# 1) प्रीप्रोसेस टैब पर जाएं और IRIS.arff डेटासेट खोलें।
#दो) डेटासेट में 4 विशेषताएँ और 1 वर्ग लेबल होता है। इस डेटासेट में विशेषताएँ हैं:
- सिपाही गति: प्रकार -numeric
- अलगाव: टाइप- न्यूमेरिक
- Petalength: टाइप-न्यूमेरिक
- पेटलावद: टाइप-न्यूमेरिक
- वर्ग: प्रकार-नाममात्र
# 3) डेटासेट की कल्पना करने के लिए, विज़ुअलाइज़ टैब पर जाएँ। टैब विशेषता प्लॉट मैट्रिक्स को दर्शाता है। डेटासेट विशेषताओं को x- अक्ष और y- अक्ष पर चिह्नित किया जाता है जबकि उदाहरण प्लॉट किए जाते हैं। X- अक्ष विशेषता और y- अक्ष विशेषता वाले बॉक्स को बड़ा किया जा सकता है।
# 4) विस्तार करने के लिए प्लॉट के बॉक्स पर क्लिक करें। उदाहरण के लिए, x: पेटलावृंद और y: पंखुड़ियाँ। विभिन्न रंगों में वर्ग लेबल का प्रतिनिधित्व किया जाता है।
- क्लास लेबल- आइरिस-सेटोसा: नीला रंग
- वर्ग लेबल- आइरिस-वर्सीकलर: लाल
- क्लास लेबल-आइरिस-वर्जिनिका-ग्रीन
इन रंगों को बदला जा सकता है। रंग बदलने के लिए, सबसे नीचे वर्ग लेबल पर क्लिक करें, एक रंग विंडो दिखाई देगी।
# 5) प्लॉट में ’x’ द्वारा दर्शाई गई आवृत्ति पर क्लिक करें। यह उदाहरण का विवरण देगा। उदाहरण के लिए:
- उदाहरण संख्या: 91
- सुरक्षा: 5.5
- अलगाव: 2.6
- Petalength: 4.4
- पेटलावद: 1.2
- वर्ग: आइरिस-वर्सीकलर
भूखंड के कुछ बिंदु अन्य बिंदुओं की तुलना में गहरे दिखाई देते हैं। ये बिंदु एक ही वर्ग लेबल के साथ 2 या अधिक उदाहरणों का प्रतिनिधित्व करते हैं और समान मूल्य के गुण जैसे कि रेखांकन और पंखुड़ियों के रूप में ग्राफ पर प्लॉट किए जाते हैं।
नीचे दिया गया आंकड़ा 2 उदाहरण की जानकारी के साथ एक बिंदु को दर्शाता है।
# 6) एक्स और वाई-एक्सिस विशेषताओं को विज़ुअलाइज़ ग्राफ में दाहिने पैनल से बदला जा सकता है। उपयोगकर्ता विभिन्न भूखंडों को देख सकता है।
# 7) कबाड़ में यादृच्छिकता को जोड़ने के लिए जिटर का उपयोग किया जाता है। कभी-कभी अंक ओवरलैप हो जाते हैं। घबराहट के साथ, गहरे रंग के धब्बे कई उदाहरणों का प्रतिनिधित्व करते हैं।
# 8) डेटासेट का एक स्पष्ट दृश्य प्राप्त करने और आउटलेर्स को हटाने के लिए, उपयोगकर्ता ड्रॉपडाउन से एक उदाहरण का चयन कर सकता है। 'चयन उदाहरण' ड्रॉपडाउन पर क्लिक करें। 'आयत' चुनें। इसके साथ, उपयोगकर्ता एक आयत की साजिश रचकर भूखंड में बिंदुओं का चयन करने में सक्षम होगा।
# 9) 'सबमिट' पर क्लिक करें। केवल चयनित डेटासेट बिंदु प्रदर्शित किए जाएंगे और अन्य बिंदुओं को ग्राफ़ से बाहर रखा जाएगा।
सेलेनियम स्वचालन परीक्षण साक्षात्कार सवाल और जवाब
नीचे दिया गया आंकड़ा चयनित आयताकार आकार से अंक दिखाता है। भूखंड केवल 3 वर्ग लेबल के साथ अंक का प्रतिनिधित्व करता है। उपयोगकर्ता किसी अन्य उदाहरण को चुनने के लिए डेटासेट या 'रीसेट' को बचाने के लिए 'सहेजें' पर क्लिक कर सकता है। डेटासेट एक अलग .ARFF फ़ाइल में सहेजा जाएगा।
आउटपुट:
WEKA का उपयोग करके डेटा विज़ुअलाइज़ेशन को बॉक्स प्लॉट की मदद से सरल किया जाता है। उपयोगकर्ता किसी भी स्तर की बारीकियों को देख सकता है। विशेषताएँ एक्स-एक्स और वाई-अक्ष पर प्लॉट की जाती हैं, जबकि एक्स और वाई-एक्सिस के खिलाफ इंस्टेंसेस प्लॉट किए जाते हैं। कुछ बिंदु कई उदाहरणों का प्रतिनिधित्व करते हैं जो गहरे रंग के साथ बिंदुओं द्वारा दर्शाए जाते हैं।
निष्कर्ष
WEKA कई डेटा माइनिंग कार्यों के साथ-साथ डेटासेट पर नए तरीकों के साथ प्रयोग करने के लिए एक कुशल डेटा माइनिंग टूल है। WEKA को कंप्यूटर विज्ञान विभाग, न्यूजीलैंड में वाइकाटो विश्वविद्यालय द्वारा विकसित किया गया है।
आज की दुनिया सुपरमार्केट में खरीदारी से लेकर हमारे घर पर सुरक्षा कैमरों तक के डेटा से अभिभूत है। डेटा माइनिंग इस कच्चे डेटा का उपयोग करता है, इसे पूर्वानुमान बनाने के लिए सूचना में परिवर्तित करता है। एपीआरओआई एल्गोरिदम की मदद से WEKA डेटासेट में एसोसिएशन के नियमों में मदद करता है। Apriori एक लगातार पैटर्न खनन एल्गोरिथ्म है जो लेनदेन में किसी आइटम के आने की संख्या को गिनाता है।
क्लस्टर विश्लेषण डेटा के समूहों का पता लगाने की एक तकनीक है जो समान विशेषताओं का प्रतिनिधित्व करता है। WEKA क्लस्टर विश्लेषण करने के लिए कई एल्गोरिदम प्रदान करता है जिसमें से सरल किमी का अत्यधिक उपयोग किया जाता है।
WEKA में डेटा विज़ुअलाइज़ेशन WEKA निर्देशिका में सभी डेटासेट पर किया जा सकता है। कच्चे डेटासेट को अन्य एल्गोरिदम जैसे वर्गीकरण, क्लस्टरिंग और एसोसिएशन के अन्य परिणामी डेटासेट के रूप में देखा जा सकता है और WEKA का उपयोग करके कल्पना की जा सकती है।
=> एक्सक्लूसिव मशीन लर्निंग सीरीज के लिए यहां जाएं
अनुशंसित पाठ
- वीका ट्यूटोरियल - कैसे डाउनलोड करें, इंस्टॉल करें और वीका टूल का उपयोग करें
- WEKA डेटासेट, क्लासिफायर और निर्णय पेड़ के लिए J48 एल्गोरिथम
- 2021 में 15 सर्वश्रेष्ठ डेटा विज़ुअलाइज़ेशन उपकरण और सॉफ्टवेयर
- D3.js ट्यूटोरियल - शुरुआती के लिए डेटा विज़ुअलाइज़ेशन फ्रेमवर्क
- D3.js डेटा विज़ुअलाइज़ेशन ट्यूटोरियल - आकृतियाँ, ग्राफ़, एनीमेशन
- सॉफ्टवेयर परीक्षण के 7 सिद्धांत: दोष क्लस्टरिंग और पेरेटो सिद्धांत
- डेटा माइनिंग: प्रक्रिया, तकनीक और डेटा विश्लेषण में प्रमुख मुद्दे
- डेटा माइनिंग तकनीक: एल्गोरिथम, तरीके और शीर्ष डेटा खनन उपकरण