types machine learning
यह ट्यूटोरियल मशीन लर्निंग के प्रकारों का वर्णन करता है यानी सुपरवाइज्ड, अनसुपरवाइज्ड, रीइनफोर्समेंट एंड सेमी-सुपरवाइज्ड लर्निंग विद सिंपल उदाहरण। आप सुपरवाइज्ड बनाम अनसुपरवाइज्ड लर्निंग के बीच अंतर भी जानेंगे:
में पिछला ट्यूटोरियल , हमने मशीन लर्निंग, इसके काम और अनुप्रयोगों के बारे में सीखा है। हमने मशीन लर्निंग बनाम आर्टिफिशियल इंटेलिजेंस की तुलना भी देखी है।
मशीन लर्निंग विज्ञान का एक क्षेत्र है जो अनुभव के माध्यम से सीखने और उत्पादन की भविष्यवाणी करने वाले कंप्यूटर कार्यक्रमों से संबंधित है।
एमएल की मुख्य विशेषता अनुभव से सीख रही है। शिक्षण तब होता है जब प्रशिक्षण इनपुट डेटा के साथ खिलाया गया सिस्टम अपने मापदंडों में बदलाव करता है और वांछित आउटपुट देने के लिए खुद को समायोजित करता है। आउटपुट प्रशिक्षण डेटा में परिभाषित लक्ष्य मूल्य है।
=> कम्प्लीट मशीन लर्निंग ट्रेनिंग सीरीज़ के माध्यम से पढ़ें
आप क्या सीखेंगे:
- मशीन लर्निंग के प्रकार
- सुपरवाइज्ड एंड अनसुप्रवाइज्ड लर्निंग का वास्तविक जीवन उदाहरण
- सुपरवाइज़्ड बनाम अनसुप्राइज़्ड लर्निंग के बीच अंतर
- सेमी-सुपरवाइज्ड लर्निंग
- निष्कर्ष
मशीन लर्निंग के प्रकार
मशीन लर्निंग प्रोग्राम को नीचे दिखाए गए अनुसार 3 प्रकारों में वर्गीकृत किया गया है।
- देखरेख
- के चलते किसी
- सुदृढीकरण सीखना
आइये इनमे से प्रत्येक को विस्तार से समझें !!
(१) सुपरवाइज्ड लर्निंग
पर्यवेक्षित शिक्षण एक पर्यवेक्षक की उपस्थिति में होता है, जैसे एक छोटे बच्चे द्वारा अपने शिक्षक की मदद से किया गया सीखना। एक बच्चे को एक शिक्षक की देखरेख में फलों, रंगों, नंबरों को पहचानने के लिए प्रशिक्षित किया जाता है, इस पद्धति का पर्यवेक्षण शिक्षण है।
इस पद्धति में, बच्चे के प्रत्येक चरण को शिक्षक द्वारा जांचा जाता है और बच्चा उस आउटपुट से सीखता है जिसे उसे उत्पादन करना है।
कैसे काम करता है सीखना?
पर्यवेक्षित एमएल एल्गोरिथ्म में, आउटपुट पहले से ही ज्ञात है। आउटपुट के साथ इनपुट की मैपिंग है। इसलिए, एक मॉडल बनाने के लिए, मशीन को बहुत सारे प्रशिक्षण इनपुट डेटा (इनपुट और संबंधित आउटपुट ज्ञात) के साथ खिलाया जाता है।
प्रशिक्षण डेटा निर्मित डेटा मॉडल के लिए सटीकता के स्तर को प्राप्त करने में मदद करता है। निर्मित मॉडल अब नए इनपुट डेटा के साथ खिलाया जा सकता है और परिणामों की भविष्यवाणी कर सकता है।
एक लेबल डेटासेट क्या है?
किसी इनपुट के लिए ज्ञात आउटपुट वाले डेटासेट को लेबलडैटसेट कहा जाता है। उदाहरण के लिए, फलों के नाम के साथ फल की एक छवि जानी जाती है। इसलिए जब फल की एक नई छवि दिखाई जाती है, तो वह उत्तर की भविष्यवाणी करने के लिए प्रशिक्षण सेट की तुलना करता है।
सुपरवाइज्ड लर्निंग उच्च सटीकता के साथ एक फास्ट लर्निंग तंत्र है। पर्यवेक्षित शिक्षण समस्याओं में प्रतिगमन और वर्गीकरण समस्याएं शामिल हैं।
कुछ पर्यवेक्षित शिक्षण एल्गोरिदम हैं:
- निर्णय के पेड़,
- K- निकटतम पड़ोसी,
- रेखीय प्रतिगमन,
- समर्थन वेक्टर मशीन और
- तंत्रिका - तंत्र।
सुपरवाइज्ड लर्निंग का उदाहरण
- पहले चरण में, मशीन लर्निंग एल्गोरिदम को एक प्रशिक्षण डेटा सेट खिलाया जाता है।
- प्रशिक्षण डेटासेट के साथ, लॉजिकल मॉडल बनाने के लिए मापदंडों में बदलाव करके, मशीन खुद को समायोजित करती है।
- अंतर्निहित मॉडल का उपयोग परिणाम का अनुमान लगाने के लिए डेटा के एक नए सेट के लिए किया जाता है।
पर्यवेक्षित शिक्षण एल्गोरिदम के प्रकार
- वर्गीकरण: इस प्रकार की समस्याओं में, हम विशिष्ट वर्गों के रूप में प्रतिक्रिया की भविष्यवाणी करते हैं, जैसे 'हाँ' या 'नहीं'। जब केवल 2 कक्षाएं मौजूद होती हैं, तो इसे बाइनरी वर्गीकरण कहा जाता है। 2 से अधिक वर्ग मानों के लिए, इसे बहु-श्रेणी वर्गीकरण कहा जाता है। अनुमानित प्रतिक्रिया मूल्य असतत मूल्य हैं। उदाहरण के लिए, क्या यह सूर्य या चंद्रमा की छवि है? वर्गीकरण एल्गोरिदम डेटा को कक्षाओं में अलग करता है।
- प्रतिगमन: प्रतिगमन समस्याएं प्रतिक्रिया को निरंतर मानों के रूप में अनुमान लगाती हैं जैसे कि एक मूल्य की भविष्यवाणी करना जो -infinity से अनंत तक होता है। इसमें कई मान हो सकते हैं। उदाहरण के लिए, रेखीय प्रतिगमन एल्गोरिथ्म जो लागू किया जाता है, कई मापदंडों जैसे स्थान, पास के हवाई अड्डे, घर के आकार, आदि के आधार पर घर की लागत की भविष्यवाणी करता है।
# 2) अनसुनी लर्निंग
एक पर्यवेक्षक की मदद के बिना अनसुनी शिक्षा होती है जैसे एक मछली खुद से तैरना सीखती है। यह एक स्वतंत्र सीखने की प्रक्रिया है।
इस मॉडल में, चूंकि इनपुट के साथ कोई आउटपुट मैप नहीं किया गया है, लक्ष्य मान अज्ञात / गैर-सूचीबद्ध हैं। सिस्टम को स्वयं डेटा इनपुट से इसे सीखने और छिपे हुए पैटर्न का पता लगाने की आवश्यकता है।
अनलिस्टेड डेटासेट क्या है?
सभी इनपुट मानों के लिए अज्ञात आउटपुट मान वाले डेटासेट को अनलिस्टेड डेटासेट कहा जाता है।
कैसे काम करता है Unsupervised Learning?
जैसा कि कोई ज्ञात आउटपुट मान नहीं है, जिसका उपयोग इनपुट और आउटपुट के बीच एक तार्किक मॉडल बनाने के लिए किया जा सकता है, कुछ तकनीकों का उपयोग डेटा नियमों, पैटर्न और डेटा के समूहों को समान प्रकारों के साथ करने के लिए किया जाता है। ये समूह डेटा को बेहतर तरीके से समझने के साथ-साथ सार्थक आउटपुट खोजने में एंड-यूजर्स की मदद करते हैं।
खिलाया गया इनपुट ठीक संरचना के रूप में नहीं है, जैसे प्रशिक्षण डेटा (पर्यवेक्षित शिक्षण में) है। इसमें आउटलेयर, नॉइज़ डेटा आदि हो सकते हैं। ये इनपुट सिस्टम को एक साथ फीड किए जाते हैं। मॉडल को प्रशिक्षित करते समय, क्लस्टर बनाने के लिए इनपुट का आयोजन किया जाता है।
अनुपलब्ध शिक्षण एल्गोरिदम में क्लस्टरिंग और एसोसिएशन एल्गोरिदम शामिल हैं:
- संभवतः,
- K- साधन क्लस्टरिंग और अन्य एसोसिएशन नियम खनन एल्गोरिदम।
जब नया डेटा मॉडल को खिलाया जाता है, तो यह एक श्रेणी लेबल के रूप में परिणाम की भविष्यवाणी करेगा, जिसमें इनपुट होता है। यदि क्लास लेबल मौजूद नहीं है, तो एक नया वर्ग उत्पन्न होगा।
डेटा में पैटर्न की खोज की प्रक्रिया से गुजरने के दौरान, मॉडल अपने मापदंडों को खुद से समायोजित करता है इसलिए इसे स्व-आयोजन भी कहा जाता है। आदानों के बीच समानता का पता लगाकर समूहों का गठन किया जाएगा।
c ++ स्ट्रिंग को चेंज करें
उदाहरण के लिए, उत्पादों को ऑनलाइन खरीदते समय, अगर बटर गाड़ी में डाल दिया जाता है, तो यह ब्रेड, पनीर आदि खरीदने का सुझाव देता है। अनसुनी मॉडल डेटा बिंदुओं को देखता है और उत्पाद के साथ जुड़ी अन्य विशेषताओं की भविष्यवाणी करता है।
अप्रशिक्षित अधिगम का उदाहरण
Unsupervised एल्गोरिथम के प्रकार
- क्लस्टरिंग एल्गोरिथ्म : एक ही आकार, आकार, रंग, मूल्य आदि जैसे डेटा आइटम के बीच समानता खोजने और उन्हें क्लस्टर बनाने के लिए समूहित करने के तरीके क्लस्टर विश्लेषण हैं।
- बाहरी पता लगाना : इस विधि में, डेटा में किसी भी तरह की असमानता और विसंगतियों के लिए डेटासेट खोज है। उदाहरण के लिए, धोखाधड़ी का पता लगाने के लिए सिस्टम द्वारा क्रेडिट कार्ड पर एक उच्च-मूल्य लेनदेन का पता लगाया जाता है।
- एसोसिएशन नियम खनन : इस प्रकार के खनन में, यह तत्वों के बीच सबसे अधिक होने वाली वस्तुओं या संघों का पता लगाता है। संघ जैसे 'उत्पादों को अक्सर एक साथ खरीदा जाता है', आदि।
- ऑटोएन्कोडर्स: इनपुट को एक कोडित रूप में संपीड़ित किया जाता है और शोर डेटा निकालने के लिए पुनः बनाया जाता है। इस तकनीक का उपयोग छवि और वीडियो की गुणवत्ता में सुधार के लिए किया जाता है।
# 3) सुदृढीकरण सीखना
इस प्रकार के सीखने में, एल्गोरिथ्म प्रतिक्रिया तंत्र और पिछले अनुभवों से सीखता है। यह हमेशा वांछित होता है कि एल्गोरिथ्म में प्रत्येक चरण को एक लक्ष्य तक पहुंचने के लिए लिया जाता है।
इसलिए जब भी अगला कदम उठाया जाता है, तो उसे पिछले चरण से प्रतिक्रिया प्राप्त होती है, साथ ही अनुभव से सीखने के साथ यह अनुमान लगाने के लिए कि अगला सबसे अच्छा कदम क्या हो सकता है। इस प्रक्रिया को लक्ष्य तक पहुँचने के लिए एक परीक्षण और त्रुटि प्रक्रिया भी कहा जाता है।
सुदृढीकरण सीखना एक दीर्घकालिक पुनरावृत्ति प्रक्रिया है। फीडबैक की संख्या जितनी अधिक होगी, सिस्टम उतना ही सटीक होगा। बुनियादी सुदृढीकरण सीखने को मार्कोव निर्णय प्रक्रिया भी कहा जाता है।
सुदृढीकरण सीखने का उदाहरण
सुदृढीकरण सीखना का उदाहरण वीडियो गेम है, जहां खिलाड़ी एक गेम के कुछ स्तरों को पूरा करते हैं और इनाम अंक अर्जित करते हैं। खेल खिलाड़ी को उसके प्रदर्शन में सुधार करने के लिए बोनस चाल के माध्यम से प्रतिक्रिया प्रदान करता है।
सुदृढीकरण सीखना का उपयोग प्रशिक्षण रोबोट, स्व-चालित कारों, इन्वेंट्री के स्वचालित प्रबंधन आदि में किया जाता है।
सुदृढीकरण सीखने के कुछ लोकप्रिय एल्गोरिदम में शामिल हैं:
- क्यू-लर्निंग,
- गहन सलाहकार नेटवर्क
- टेम्पोरल अंतर
नीचे दिया गया आंकड़ा सुदृढीकरण सीखने की प्रतिक्रिया तंत्र का वर्णन करता है।
- इनपुट एजेंट द्वारा मनाया जाता है जो एआई तत्व है।
- यह AI एजेंट पर्यावरण पर किए गए निर्णय के अनुसार कार्य करता है।
- पर्यावरण की प्रतिक्रिया प्रतिक्रिया के रूप में पुरस्कार के रूप में एआई को भेजी जाती है।
- पर्यावरण पर किए गए राज्य और कार्य भी सहेजे जाते हैं।
(छवि स्रोत )
सुपरवाइज्ड एंड अनसुप्रवाइज्ड लर्निंग का वास्तविक जीवन उदाहरण
पर्यवेक्षित शिक्षण के लिए:
# 1) आइए हम प्याज, गाजर, मूली, टमाटर, आदि सब्जियों की एक टोकरी का एक उदाहरण लेते हैं, और हम उन्हें समूहों के रूप में व्यवस्थित कर सकते हैं।
#दो) हम सुपरवाइज्ड लर्निंग को समझने के लिए एक प्रशिक्षण डेटा टेबल बनाते हैं।
प्रशिक्षण डेटा तालिका सब्जियों पर आधारित है:
- आकार
- रंग
- आकार
आकार | रंग | आकार | सबजी |
---|---|---|---|
यह अनूपर्वेटेड लर्निंग से अधिक सटीक है क्योंकि इनपुट डेटा और संबंधित आउटपुट अच्छी तरह से ज्ञात है, और मशीन को केवल भविष्यवाणियां देने की आवश्यकता है। | इसमें कम सटीकता है क्योंकि इनपुट डेटा अनलेब है। इस प्रकार मशीन को पहले डेटा को समझना और लेबल करना होता है और फिर पूर्वानुमान देना होता है। | ||
गोल | भूरा | बड़े | प्याज |
गोल | जाल | माध्यम है | टमाटर |
बेलनाकार | सफेद | बड़े | मूली |
बेलनाकार | जाल | माध्यम है | गाजर |
जब यह प्रशिक्षण डेटा तालिका मशीन को खिलाया जाता है, तो यह परिणाम (सब्जी) की भविष्यवाणी करने के लिए आकार, रंग, सब्जी के आकार आदि का उपयोग करके एक तार्किक मॉडल का निर्माण करेगा।
जैसा कि एक नया इनपुट इस मॉडल को खिलाया गया है, एल्गोरिथ्म मापदंडों का विश्लेषण करेगा और फल का नाम आउटपुट करेगा।
अप्रशिक्षित शिक्षा के लिए:
अनियोजित शिक्षण में, यह विशेषताओं के आधार पर समूह या समूह बनाता है। उपरोक्त नमूना डेटासेट में, सब्जी के पैरामीटर हैं:
# 1) आकृति
सब्जियों को आकार के आधार पर समूहीकृत किया जाता है।
- गोल: प्याज और टमाटर।
- बेलनाकार: मूली और गाजर।
आकार के रूप में एक और पैरामीटर लें।
# 2) का आकार
सब्जियों को आकार और आकार के आधार पर समूहीकृत किया जाता है:
- मध्यम आकार और गोल आकार: टमाटर
- बड़ा आकार और गोल आकार: प्याज
अप्रशिक्षित शिक्षा में, हमारे पास कोई प्रशिक्षण डाटासेट और परिणाम चर नहीं है, जबकि पर्यवेक्षित शिक्षण में, प्रशिक्षण डेटा ज्ञात है और एल्गोरिथ्म को प्रशिक्षित करने के लिए उपयोग किया जाता है।
सुपरवाइज़्ड बनाम अनसुप्राइज़्ड लर्निंग के बीच अंतर
देखरेख | के चलते किसी |
---|---|
पर्यवेक्षित शिक्षण एल्गोरिदम में, दिए गए इनपुट के लिए आउटपुट ज्ञात है। | अनियोजित शिक्षण एल्गोरिदम में, दिए गए इनपुट के लिए आउटपुट अज्ञात है। |
एल्गोरिदम डेटा के लेबल सेट से सीखते हैं। यह डेटा प्रशिक्षण डेटा पर सटीकता का मूल्यांकन करने में मदद करता है। | एल्गोरिथ्म अनलेब किए गए डेटा के साथ प्रदान किया जाता है जहां यह डेटा आइटम के बीच पैटर्न और संघों को खोजने की कोशिश करता है। |
यह एक प्रीडिक्टिव मॉडलिंग तकनीक है जो भविष्य के परिणामों की सटीक भविष्यवाणी करती है। | यह एक वर्णनात्मक मॉडलिंग तकनीक है जो तत्वों के तत्वों और इतिहास के बीच वास्तविक संबंध की व्याख्या करती है। |
इसमें वर्गीकरण और प्रतिगमन एल्गोरिदम शामिल हैं। | इसमें एल्गोरिदम सीखने वाले क्लस्टरिंग और एसोसिएशन नियम शामिल हैं। |
पर्यवेक्षित शिक्षण के कुछ एल्गोरिदम रैखिक प्रतिगमन, नाओवे बेय और तंत्रिका नेटवर्क हैं। | अप्रशिक्षित सीखने के लिए कुछ एल्गोरिदम k- मतलब क्लस्टरिंग, अप्रीरी, आदि हैं। |
इस प्रकार का सीखना अपेक्षाकृत जटिल है क्योंकि इसमें लेबल डेटा की आवश्यकता होती है। | यह कम जटिल है क्योंकि डेटा को समझने और लेबल करने की कोई आवश्यकता नहीं है। |
यह डेटा विश्लेषण की एक ऑनलाइन प्रक्रिया है और इसमें मानव सहभागिता की आवश्यकता नहीं है। | यह डेटा का वास्तविक समय विश्लेषण है। |
सेमी-सुपरवाइज्ड लर्निंग
अर्ध-पर्यवेक्षित शिक्षण दृष्टिकोण लेबल और लेबल रहित प्रशिक्षण डेटा इनपुट दोनों को लेता है। इस प्रकार की सीख तब उपयोगी है जब अनलिस्टेड डेटा (पर्यवेक्षित दृष्टिकोण) से उपयोगी सुविधाओं को निकालना मुश्किल होता है और डेटा विशेषज्ञों को इनपुट डेटा (अनपेक्षित दृष्टिकोण) को लेबल करना मुश्किल लगता है।
इन एल्गोरिदम में केवल थोड़ी मात्रा में लेबल किए गए डेटा से मॉडल की सटीकता हो सकती है।
उदाहरण अर्ध-पर्यवेक्षित शिक्षण में सीटी स्कैन और एमआरआई शामिल हैं, जहां एक चिकित्सा विशेषज्ञ किसी भी बीमारी के लिए स्कैन में कुछ बिंदुओं को लेबल कर सकता है, जबकि सभी स्कैन को लेबल करना मुश्किल है।
निष्कर्ष
मशीन लर्निंग के कामों को मोटे तौर पर सुपरवाइज्ड, अनसुप्रवाइज्ड, सेमी-सुपरवाइज्ड और रीइनफोर्समेंट लर्निंग टास्क में वर्गीकृत किया जाता है।
सुपरवाइज्ड लर्निंग लेबल डेटा की मदद से सीख रहा है। एमएल एल्गोरिदम को एक प्रशिक्षण डेटासेट के साथ खिलाया जाता है जिसमें प्रत्येक इनपुट डेटा के लिए आउटपुट को जाना जाता है, भविष्य के परिणामों की भविष्यवाणी करने के लिए।
यह मॉडल अत्यधिक सटीक और तेज है, लेकिन इसके निर्माण के लिए उच्च विशेषज्ञता और समय की आवश्यकता होती है। यदि डेटा में परिवर्तन होता है, तो भी इन मॉडलों को पुनर्निर्माण की आवश्यकता होती है। प्रतिगमन और वर्गीकरण जैसे एमएल कार्यों को एक पर्यवेक्षित शिक्षण वातावरण के तहत किया जाता है।
विंडोज 7 के लिए सबसे अच्छा मुफ्त अनुकूलक
पर्यवेक्षक की मदद के बिना अनसुनी शिक्षा प्राप्त होती है। एमएल एल्गोरिदम को खिलाया गया इनपुट डेटा बिना लेबल का होता है यानी हर इनपुट के लिए कोई आउटपुट ज्ञात नहीं होता है। एल्गोरिथ्म स्वयं इनपुट डेटा में रुझानों और पैटर्न का पता लगाता है और इनपुट के विभिन्न गुणों के बीच एक जुड़ाव बनाता है।
इस प्रकार की सीख डेटा में पैटर्न खोजने, डेटा के क्लस्टर बनाने और वास्तविक समय विश्लेषण के लिए उपयोगी है। क्लस्टरिंग, केएनएन एल्गोरिदम, आदि जैसे कार्य, अप्रशिक्षित सीखने के अंतर्गत आते हैं।
सेमी-सुपरवाइज्ड लर्निंग कार्यों ने लेबल और अनलिस्टेड डेटा दोनों का उपयोग करके परिणामों की भविष्यवाणी करके पर्यवेक्षित और अप्रकाशित एल्गोरिदम दोनों का लाभ उठाया है। सुदृढीकरण सीखना एक प्रकार का प्रतिक्रिया तंत्र है जहाँ मशीन अपने लक्ष्य को प्राप्त करने के लिए पर्यावरण से निरंतर प्रतिक्रिया से सीखती है।
इस प्रकार के सीखने में, AI एजेंट डेटा पर कुछ कार्य करते हैं और पर्यावरण एक इनाम देता है। सुदृढीकरण सीखने का उपयोग बच्चों, स्वयं-ड्राइविंग कारों आदि के लिए मल्टीप्लेयर गेम द्वारा किया जाता है।
मशीन लर्निंग और कृत्रिम तंत्रिका नेटवर्क के बारे में अधिक जानने के लिए हमारे आगामी ट्यूटोरियल के लिए बने रहें!
=> एक्सक्लूसिव मशीन लर्निंग सीरीज के लिए यहां जाएं
अनुशंसित पाठ
- डाटा माइनिंग बनाम मशीन लर्निंग बनाम आर्टिफिशियल इंटेलिजेंस बनाम डीप लर्निंग
- 2021 में 11 सबसे लोकप्रिय मशीन लर्निंग सॉफ्टवेयर टूल्स
- मशीन लर्निंग ट्यूटोरियल: एमएल और इसके अनुप्रयोगों का परिचय
- पायथन डेटा प्रकार
- C ++ डेटा प्रकार
- सॉफ्टवेयर परियोजनाओं में जोखिम के प्रकार
- प्रवासन परीक्षण के प्रकार: प्रत्येक प्रकार के लिए परीक्षण परिदृश्यों के साथ
- 15 सर्वश्रेष्ठ शिक्षण प्रबंधन प्रणाली (वर्ष 2021 का एलएमएस)