weka tutorial how download
यह WEKA ट्यूटोरियल बताता है कि वीका मशीन लर्निंग टूल, इसकी विशेषताएं और वीका मशीन लर्निंग सॉफ़्टवेयर को डाउनलोड, इंस्टॉल और उपयोग कैसे करें:
में पिछला ट्यूटोरियल , हमने ML में सपोर्ट वेक्टर मशीन और संबंधित अवधारणाओं जैसे हाइपरप्लेन, सपोर्ट वैक्टर और एसवीएम के अनुप्रयोगों के बारे में सीखा।
मशीन लर्निंग विज्ञान का एक क्षेत्र है जहां मशीनें एक कृत्रिम रूप से बुद्धिमान प्रणाली के रूप में कार्य करती हैं। मशीनें बिना किसी स्पष्ट कोडिंग की आवश्यकता के स्वयं सीख सकती हैं। यह एक पुनरावृत्त प्रक्रिया है जो डेटा तक पहुंचती है, खुद से सीखती है, और परिणाम की भविष्यवाणी करती है। मशीन सीखने के कार्यों को निष्पादित करने के लिए कई उपकरण और स्क्रिप्ट की आवश्यकता होती है।
WEKA एक मशीन लर्निंग प्लेटफ़ॉर्म है जिसमें कई उपकरण हैं जो कई मशीन सीखने की गतिविधियों की सुविधा प्रदान करते हैं।
=> कम्प्लीट मशीन लर्निंग ट्रेनिंग सीरीज़ के माध्यम से पढ़ें
iPhone के लिए सबसे अच्छा सेल फोन स्पाइवेयर
आप क्या सीखेंगे:
- WEKA क्या है
- निष्कर्ष
WEKA क्या है
वेका एक खुला-स्रोत उपकरण है जिसे वैकाटो, न्यूजीलैंड विश्वविद्यालय में वैज्ञानिकों / शोधकर्ताओं द्वारा डिजाइन और विकसित किया गया है। WEKA ज्ञान विश्लेषण के लिए वाइकाटो पर्यावरण के लिए खड़ा है। यह अंतर्राष्ट्रीय वैज्ञानिक समुदाय द्वारा विकसित किया गया है और मुफ्त GNU GPL लाइसेंस के तहत वितरित किया गया है।
WEKA जावा में पूरी तरह से विकसित है। यह जावा डेटाबेस कनेक्टिविटी का उपयोग करके SQL डेटाबेस के साथ एकीकरण प्रदान करता है। यह डेटा खनन कार्यों को लागू करने के लिए कई मशीन लर्निंग एल्गोरिदम प्रदान करता है। इन एल्गोरिदम को या तो सीधे WEKA उपकरण का उपयोग किया जा सकता है या जावा प्रोग्रामिंग भाषा का उपयोग करके अन्य अनुप्रयोगों के साथ उपयोग किया जा सकता है।
यह डेटा प्रीप्रोसेसिंग, वर्गीकरण, क्लस्टरिंग, रिग्रेशन एनालिसिस, एसोसिएशन रूल क्रिएशन, फ़ीचर एक्सट्रैक्शन, और डेटा विज़ुअलाइज़ेशन के लिए बहुत सारे उपकरण प्रदान करता है। यह एक शक्तिशाली उपकरण है जो मशीन लर्निंग में नए एल्गोरिदम के विकास का समर्थन करता है।
WEKA मशीन लर्निंग टूल का उपयोग क्यों करें
WEKA के साथ, मशीन लर्निंग एल्गोरिदम उपयोगकर्ताओं के लिए आसानी से उपलब्ध है। एमएल विशेषज्ञ इन तरीकों का उपयोग डेटा की उच्च मात्रा से उपयोगी जानकारी निकालने के लिए कर सकते हैं। यहां, विशेषज्ञ नई मशीन सीखने के तरीकों को विकसित करने और उन्हें वास्तविक डेटा पर लागू करने के लिए एक वातावरण बना सकते हैं।
WEKA का उपयोग मशीन लर्निंग द्वारा किया जाता है और विज्ञान के शोधकर्ताओं ने शिक्षण उद्देश्यों के लिए इसका उपयोग किया है। यह कई डेटा माइनिंग कार्यों को करने के लिए एक कुशल उपकरण है।
WEKA डाउनलोड और स्थापना
# 1) से सॉफ्टवेयर डाउनलोड करें यहाँ ।
कंप्यूटर सिस्टम के कॉन्फ़िगरेशन की जांच करें और इस पृष्ठ से WEKA (वर्तमान में 3.8) का स्थिर संस्करण डाउनलोड करें।
#दो) सफल डाउनलोड के बाद, फ़ाइल स्थान खोलें और डाउनलोड की गई फ़ाइल पर डबल क्लिक करें। स्टेप अप विज़ार्ड दिखाई देगा। Next पर क्लिक करे।
# 3) लाइसेंस अनुबंध की शर्तें खुलेंगी। इसे अच्छी तरह से पढ़ें और 'I Agree' पर क्लिक करें।
# 4) अपनी आवश्यकताओं के अनुसार, स्थापित किए जाने वाले घटकों का चयन करें। पूर्ण घटक स्थापना की सिफारिश की जाती है। Next पर क्लिक करे।
# 5) गंतव्य फ़ोल्डर का चयन करें और अगला पर क्लिक करें।
# 6) फिर, स्थापना शुरू हो जाएगी।
# 7) यदि जावा सिस्टम में स्थापित नहीं है, तो यह पहले जावा को स्थापित करेगा।
# 8) स्थापना पूर्ण होने के बाद, निम्न विंडो दिखाई देगी। Next पर क्लिक करे।
# 9) स्टार्ट वीका चेकबॉक्स चुनें। समाप्त पर क्लिक करें।
# 10) WEKA टूल और एक्सप्लोरर विंडो खुलती है।
#ग्यारह) WEKA मैनुअल से डाउनलोड किया जा सकता है यहां।
WEKA का ग्राफिकल यूजर इंटरफेस
WEKA का GUI पांच विकल्प देता है: एक्सप्लोरर, प्रायोगिक, ज्ञान प्रवाह, कार्यक्षेत्र और सरल सीएलआई। आइए हम इनमें से प्रत्येक को व्यक्तिगत रूप से समझें।
(1) सरल सीएलआई
साधारण सीएलआई कमांड लाइन और आउटपुट के साथ वीका शेल है। 'सहायता' के साथ, सभी आदेशों का अवलोकन देखा जा सकता है। साधारण सीएलआई सभी कक्षाओं जैसे क्लासिफायर, क्लस्टर, और फिल्टर आदि तक पहुंच प्रदान करता है।
कुछ साधारण सीएलआई कमांड हैं:
- टूटना: वर्तमान धागे को रोकने के लिए
- बाहर जाएं: सीएलआई से बाहर निकलें
- हाथ बटाना() : निर्दिष्ट कमांड के लिए मदद को आउटपुट करता है
- -जावा weka.classifiers.trees.J48 -t c: /temp/iris.arff: एक WEKA वर्ग आह्वान करने के लिए, इसे जावा के साथ उपसर्ग करें। यह कमांड WEKA को कक्षा को लोड करने और दिए गए मापदंडों के साथ निष्पादित करने के लिए निर्देशित करेगा। इस कमांड में J48 क्लासिफायर IRIS डेटासेट पर लगाया जाता है।
# 2) एक्सप्लोरर
WEKA एक्सप्लोरर विंडो प्रीप्रोसेस के साथ शुरू होने वाले विभिन्न टैब दिखाती हैं। प्रारंभ में, प्रीप्रोसेस टैब सक्रिय होता है, क्योंकि पहले डेटा सेट को एल्गोरिदम लागू करने से पहले प्रीप्रोसेस किया जाता है और डेटासेट की खोज की जाती है।
टैब इस प्रकार हैं:
- प्रीप्रोसेस: लोड किए गए डेटा को चुनें और संशोधित करें।
- वर्गीकृत: उस डेटा को प्रशिक्षण और परीक्षण एल्गोरिदम लागू करें जो डेटा को वर्गीकृत और पुनः प्राप्त करेगा।
- क्लस्टर: डेटा से प्रपत्र क्लस्टर।
- सहयोगी: डेटा के लिए एसोसिएशन शासन बाहर खदान।
- विशेषताओं का चयन करें: गुण चयन उपाय लागू होते हैं।
- कल्पना करें: डेटा का 2 डी प्रतिनिधित्व देखा जाता है।
- स्टेटस बार: विंडो का बॉटलमॉस्ट अनुभाग स्थिति बार दिखाता है। यह अनुभाग दिखाता है कि संदेश के रूप में वर्तमान में क्या हो रहा है, जैसे कि फ़ाइल लोड की जा रही है। इस पर राइट क्लिक करें, याद जानकारी देखा जा सकता है, और भी Daud कूड़ा करकट एकत्र करनेवाला स्थान खाली करने के लिए चलाया जा सकता है।
- लॉग बटन: यह टाइमकास्ट के साथ वेका में सभी क्रियाओं के लॉग को संग्रहीत करता है। लॉग बटन पर क्लिक करने पर लॉग को एक अलग विंडो में दिखाया जाता है।
- WEKA बर्ड आइकन: निचले दाएं कोने पर मौजूद WEKA पक्षी दिखाता है कि समवर्ती (x) द्वारा चलने वाली प्रक्रियाओं की संख्या कितनी है। जब प्रक्रिया चल रही है तो पक्षी घूम जाएगा।
# 3) प्रायोगिक
WEKA प्रयोग बटन उपयोगकर्ताओं को डेटासेट पर एक प्रयोग में विभिन्न योजनाओं को बनाने, चलाने और संशोधित करने की अनुमति देता है। प्रयोग करने वाले के पास 2 प्रकार के विन्यास हैं: सरल और उन्नत। दोनों कॉन्फ़िगरेशन उपयोगकर्ताओं को स्थानीय और दूरस्थ कंप्यूटरों पर प्रयोगों को चलाने की अनुमति देते हैं।
- 'ओपन' और 'न्यू' बटन एक नया प्रयोग विंडो खोलेगा जो उपयोगकर्ता कर सकते हैं।
- परिणाम: ARFF, JDFC और CSV फ़ाइल से परिणाम गंतव्य फ़ाइल सेट करें।
- प्रयोग का प्रकार: उपयोगकर्ता क्रॉस-मान्यता और ट्रेन / परीक्षण प्रतिशत विभाजन के बीच चयन कर सकता है। उपयोगकर्ता उपयोग किए गए डेटासेट और क्लासिफायर पर वर्गीकरण और प्रतिगमन-आधारित के बीच चयन कर सकता है।
- डेटासेट: उपयोगकर्ता यहां से डेटासेट ब्राउज़ और चुन सकता है। अलग-अलग मशीनों पर काम करने पर संबंधित पथ चेकबॉक्स पर क्लिक किया जाता है। समर्थित डेटासेट का प्रारूप ARFF, C4.5, CSV, libsvm, bsi और XRFF है।
- परिवर्तन: डिफ़ॉल्ट पुनरावृत्ति संख्या 10 पर सेट है। डेटासेट्स पहले और एल्गोरिदम पहले डेटासेट और एल्गोरिदम के बीच स्विच करने में मदद करता है ताकि एल्गोरिदम को सभी डेटासेट पर चलाया जा सके।
- एल्गोरिदम: नए एल्गोरिदम को 'न्यू बटन' द्वारा जोड़ा जाता है। उपयोगकर्ता एक क्लासिफायरियर चुन सकता है।
- सहेजें बटन का उपयोग करके प्रयोग सहेजें।
- रन बटन का प्रयोग करके प्रयोग करें।
# 4) ज्ञान प्रवाह
ज्ञान प्रवाह WEKA एल्गोरिदम का एक चित्रमय प्रतिनिधित्व दर्शाता है। उपयोगकर्ता घटकों का चयन कर सकता है और डेटासेट का विश्लेषण करने के लिए एक वर्कफ़्लो बना सकता है। डेटा को बैच-वार या वृद्धिशील रूप से संभाला जा सकता है। समानांतर वर्कफ़्लोज़ को डिज़ाइन किया जा सकता है और प्रत्येक एक अलग थ्रेड में चलेगा।
उपलब्ध विभिन्न घटक हैं डेटासोर्स, डेटासेवर, फिल्टर, क्लासिफायर, क्लस्टर, मूल्यांकन, और विज़ुअलाइज़ेशन।
# 5) कार्यक्षेत्र
WEKA में वर्कबेंच मॉड्यूल है जिसमें सभी GUI सिंगल विंडो में हैं।
WEKA एक्सप्लोरर की विशेषताएं
# 1) डेटासेट
डेटासेट आइटम से बना होता है। यह एक वस्तु का प्रतिनिधित्व करता है उदाहरण के लिए: विपणन डेटाबेस में, यह ग्राहकों और उत्पादों का प्रतिनिधित्व करेगा। डेटासेट विशेषताओं द्वारा वर्णित हैं। डेटासेट में डेटाबेस में डेटा ट्यूपल्स होते हैं। डेटासेट में विशेषताएँ होती हैं जो नाममात्र, संख्यात्मक या स्ट्रिंग हो सकती हैं। वीका में, डेटासेट द्वारा प्रतिनिधित्व किया जाता है weka.core.Instances कक्षा।
5 उदाहरणों के साथ डेटासेट का प्रतिनिधित्व:
@डेटा
धूप, FALSE, 85,85, नहीं
धूप, TRUE, 80,90, नहीं
घटाटोप, FALSE, 83,86, हाँ
बरसात, FALSE, 70,96, हाँ
बरसात, FALSE, 68,80, हाँ
एक विशेषता क्या है?
एक विशेषता एक डेटा फ़ील्ड है जो डेटा ऑब्जेक्ट की विशेषता का प्रतिनिधित्व करता है। उदाहरण के लिए, एक ग्राहक डेटाबेस में, विशेषताएँ customer_id, customer_email, customer_address आदि होंगी। विशेषताएँ अलग-अलग प्रकार की होती हैं।
ये संभावित प्रकार हैं:
ए) नाममात्र के गुण: विशेषता जो एक नाम से संबंधित है और इसमें रंग, मौसम जैसे पूर्वनिर्धारित मूल्य हैं। इन विशेषताओं को कहा जाता है स्पष्ट गुण । इन विशेषताओं का कोई आदेश नहीं है और उनके मूल्यों को गणना भी कहा जाता है।
@ आत्मीय दृष्टिकोण {धूप, तूफान, बरसात}: नाममात्र विशेषता की घोषणा।
बी) द्विआधारी गुण: ये विशेषताएँ केवल 0 और 1 मानों का प्रतिनिधित्व करती हैं। ये केवल 2 श्रेणियों के साथ नाममात्र विशेषताओं के प्रकार हैं। इन विशेषताओं को बुलियन भी कहा जाता है।
सी) साधारण गुण: वे विशेषताएँ जो उनके बीच कुछ क्रम या रैंकिंग को संरक्षित करती हैं, क्रमिक विशेषताएँ हैं। क्रमिक मूल्यों की भविष्यवाणी नहीं की जा सकती, लेकिन केवल आदेश बनाए रखा जाता है। उदाहरण: आकार, ग्रेड, आदि
डी) संख्यात्मक विशेषताएं: औसत दर्जे की मात्रा का प्रतिनिधित्व करने वाले गुण संख्यात्मक विशेषताएं हैं। इन्हें वास्तविक संख्याओं या पूर्णांकों द्वारा दर्शाया जाता है। उदाहरण: तापमान, आर्द्रता।
@ आर्द्रता आर्द्रता वास्तविक: एक संख्यात्मक विशेषता की घोषणा
ई) स्ट्रिंग विशेषताएँ: ये विशेषताएँ दोहरे-उद्धरणों में दर्शाए गए पात्रों की एक सूची का प्रतिनिधित्व करती हैं।
# 2) ARFF डेटा प्रारूप
WEKA डेटा विश्लेषण के लिए ARFF फाइल पर काम करता है। ARFF का मतलब अटैचमेंट रिलेशन फाइल फॉर्मेट है। इसके 3 खंड हैं: संबंध, गुण और डेटा। हर खंड “@” से शुरू होता है।
ARFF फाइल्स नॉमिनल, न्यूमेरिक, स्ट्रिंग, डेट और रिलेशनल डेटा एट्रिब्यूट लेती हैं। WEKA में ARFF के रूप में कुछ प्रसिद्ध मशीन लर्निंग डेटासेट मौजूद हैं।
ARFF के लिए प्रारूप है:
@रिश्ता
@ सत्कर्म
@डेटा
ARFF फाइल का एक उदाहरण है:
@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes
# 3) एक्सआरएफएफ डेटा प्रारूप
एक्सआरएफएफ एक्सएमएल विशेषता रिलेशन फाइल फॉर्मेट के लिए है। यह ऐसे डेटा का प्रतिनिधित्व करता है जो टिप्पणियों, विशेषताओं और उदाहरण भार को संग्रहीत कर सकता है। इसमें .xrff एक्सटेंशन और .xrff.gz (कंप्रेस्ड फॉर्मेट) फाइल एक्सटेंशन है। एक्सआरएफएफ फाइलें एक्सएमएल प्रारूप में डेटा का प्रतिनिधित्व करती हैं।
# 4) डेटाबेस कनेक्टिविटी
WEKA के साथ, JDBC ड्राइवर का उपयोग कर डेटाबेस से जुड़ना आसान है। JDBC ड्राइवर को डेटाबेस से जोड़ने के लिए आवश्यक है, उदाहरण:
एमएस SQL सर्वर (com.microsoft.jdbc.sqlserver.SQLServerDriver)
आकाशवाणी (oracle.jdbc.driver.OracleDriver)
# 5) क्लासिफायर
आउटपुट डेटा की भविष्यवाणी करने के लिए WEKA में क्लासिफायरियर हैं। सीखने के लिए उपलब्ध वर्गीकरण एल्गोरिदम निर्णय-वृक्ष, वेक्टर मशीन, उदाहरण-आधारित क्लासिफायर, और लॉजिस्टिक प्रतिगमन, और बायोसियन नेटवर्क हैं। परीक्षण और परीक्षण का उपयोग करने की आवश्यकता के आधार पर, उपयोगकर्ता डेटा के विश्लेषण के लिए एक उपयुक्त एल्गोरिथ्म का पता लगा सकता है। क्लासिफायर का उपयोग विशेषताओं की विशेषताओं के आधार पर डेटा सेट को वर्गीकृत करने के लिए किया जाता है।
# 6) क्लस्टरिंग
WEKA डेटासेट में समानता का अनुमान लगाने के लिए क्लस्टर टैब का उपयोग करता है। क्लस्टरिंग के आधार पर, उपयोगकर्ता विश्लेषण के लिए उपयोगी विशेषताओं का पता लगा सकता है और अन्य विशेषताओं को अनदेखा कर सकता है। WEKA में क्लस्टरिंग के लिए उपलब्ध एल्गोरिदम k- साधन, EM, Cobweb, X- साधन, और FarhtestFirst हैं।
# 7) एसोसिएशन
एसोसिएशन के नियमों का पता लगाने के लिए WEKA में उपलब्ध एकमात्र एल्गोरिथ्म Apriori है।
# 8) धारा के उपायों की विशेषता
WEKA गणना उद्देश्य के लिए सर्वश्रेष्ठ विशेषता चयन के लिए 2 दृष्टिकोणों का उपयोग करता है:
- खोज विधि एल्गोरिथ्म का उपयोग करना: बेस्ट-फ़र्स्ट, फ़ॉरवर्ड सिलेक्शन, रैंडम, एग्जॉस्ट, जेनेटिक एल्गोरिदम और रैंकिंग एल्गोरिथम।
- मूल्यांकन विधि एल्गोरिदम का उपयोग करना: सहसंबंध आधारित, आवरण, सूचना लाभ, ची-चुकता।
# 9) विज़ुअलाइज़ेशन
WEKA डेटा के 2D प्रतिनिधित्व, रोटेशन के साथ 3D विज़ुअलाइज़ेशन और एकल विशेषता के 1D प्रतिनिधित्व का समर्थन करता है। यह नाममात्र विशेषताओं और 'छिपा' डेटा बिंदुओं के लिए 'घबराना' विकल्प है।
WEKA की अन्य मुख्य विशेषताएं हैं:
- यह 'एक्सप्लोरर', 'एक्सपेरिमेंट' और 'नॉलेज फ़्लो' के रूप में ग्राफिकल यूजर इंटरफेस के साथ एक ओपन-सोर्स टूल है।
- यह प्लेटफॉर्म-स्वतंत्र है।
- इसमें 49 डेटा प्रीप्रोसेसिंग टूल शामिल हैं।
- WEKA में 76 वर्गीकरण और प्रतिगमन एल्गोरिदम, 8 क्लस्टरिंग एल्गोरिदम मौजूद हैं
- इसमें 15 विशेषता चयन एल्गोरिदम और 10 सुविधा चयन एल्गोरिदम हैं।
- इसमें एसोसिएशन नियम खोजने के लिए 3 एल्गोरिदम हैं।
- WEKA का उपयोग करके, उपयोगकर्ता मशीन सीखने के लिए कस्टम कोड विकसित कर सकते हैं।
निष्कर्ष
इस WEKA ट्यूटोरियल में, हमने ओपन-सोर्स WEKA मशीन लर्निंग सॉफ़्टवेयर के लिए एक परिचय प्रदान किया और स्टेप डाउनलोड और इंस्टॉलेशन प्रक्रिया के बारे में बताया। हमने Weka Graphical User Interface, एक्सप्लोरर, एक्सपेरिमेंट, नॉलेज फ्लो, वर्कबेंच और सिंपल सीएलआई के लिए उपलब्ध पांच विकल्पों को भी देखा है।
हमने उदाहरण के साथ WEKA की विशेषताओं के बारे में भी जाना है। सुविधाओं में डेटासेट, ARFF डेटा प्रारूप, डेटाबेस कनेक्टिविटी, आदि शामिल हैं।
=> एक्सक्लूसिव मशीन लर्निंग सीरीज के लिए यहां जाएं
अनुशंसित पाठ
- WEKA डेटासेट, क्लासिफायर और निर्णय पेड़ के लिए J48 एल्गोरिथम
- WEKA एक्सप्लोरर: विज़ुअलाइज़ेशन, क्लस्टरिंग, एसोसिएशन रूल माइनिंग
- 2021 में 11 सबसे लोकप्रिय मशीन लर्निंग सॉफ्टवेयर टूल्स
- मशीन लर्निंग में कृत्रिम तंत्रिका नेटवर्क के लिए एक पूर्ण गाइड
- डाटा माइनिंग बनाम मशीन लर्निंग बनाम आर्टिफिशियल इंटेलिजेंस बनाम डीप लर्निंग
- मशीन लर्निंग ट्यूटोरियल: एमएल और इसके अनुप्रयोगों का परिचय
- शीर्ष 13 सर्वश्रेष्ठ मशीन लर्निंग कंपनियां (अद्यतित 2021 सूची)
- मशीन लर्निंग में सपोर्ट वेक्टर मशीन (SVM) क्या है