Decision tree algorithm என்பது மேற்பார்வையிடப்பட்ட கற்றல் நுட்பமாகும், இது வகைப்படுத்துதல் மற்றும் பின்னடைவு போன்ற பிரச்சினைகள் இரண்டிற்கும் பயன்படுத்தலாம், ஆனால் பெரும்பாலும் இது வகைப்படுத்துதல் சிக்கல்களைத் தீர்க்க பயன்படுகிறது. இது ஒரு மரத்தால் கட்டமைக்கப்பட்ட வகைப்பாடாகும், அங்கு உள் முனைகள் தரவுத்தொகுப்பின் அம்சங்களைக் குறிக்கின்றன, கிளைகள் முடிவு விதிகளை குறிக்கும் மற்றும் ஒவ்வொரு இலை முனையும் முடிவை குறிக்கும்.ஒரு Decision tree இல், இரண்டு முனைகள் உள்ளன, அவை முடிவு முனை மற்றும் இலை முனை. முடிவெடுக்கும் முனைகள் எந்தவொரு முடிவையும் எடுக்கப் பயன்படுகின்றன மற்றும் பல கிளைகளைக் கொண்டுள்ளன, அதேசமயம் இலை முனைகள் அந்த முடிவுகளின் வெளியீடு மற்றும் மேலும் அவை கிளைகளைக் கொண்டிருக்கவில்லை.
முடிவுகள் அல்லது சோதனை கொடுக்கப்பட்ட தரவுத்தொகுப்பின் அம்சங்களின் அடிப்படையில் செய்யப்படுகிறது.கொடுக்கப்பட்ட நிபந்தனைகளின் அடிப்படையில் ஒரு சிக்கல் / முடிவுக்கு சாத்தியமான அனைத்து தீர்வுகளையும் பெறுவதற்கான வரைகலைப் பிரதிநிதித்துவம்.
இது ஒரு Decision tree என்று அழைக்கப்படுகிறது, ஏனெனில், ஒரு மரத்தைப் போலவே, இது ரூட் முனையுடன் தொடங்குகிறது, இது மேலும் கிளைகளில் விரிவடைந்து, மரம் போன்ற கட்டமைப்பை உருவாக்குகிறது.ஒரு மரத்தை உருவாக்க,வகைப்பாடு மற்றும் பின்னடைவு மர வழிமுறையை குறிக்கும் CART வழிமுறையைப் பயன்படுத்துகிறோம். ஒரு Decision tree வேண்டுமென்றே ஒரு கேள்வியைக் கேட்கிறது, மேலும் பதிலின் அடிப்படையில் (ஆம் / இல்லை), இது மரத்தை மேலும் துணைப் பிரிவுகளாகப் பிரிக்கிறது.
Root Node: decision tree தொடங்கும் இடத்திலிருந்து root node ஆரம்பிக்கிறது. இது முழு தரவுத்தொகுப்பையும் குறிக்கிறது, இது மேலும் இரண்டு அல்லது அதற்கு மேற்பட்ட ஒரேவிதமான தொகுப்புகளாக பிரிக்கப்படுகிறது.
Leaf Node: leaf Nodes இறுதி வெளியீட்டு முனை, மற்றும் இலை முனை கிடைத்த பிறகு மரத்தை மேலும் பிரிக்க முடியாது.
Splitting: splitting என்பது கொடுக்கப்பட்ட நிபந்தனைகளுக்கு ஏற்ப முடிவு முனை / root முனையை துணை முனைகளாக பிரிக்கும் செயல்முறையாகும்.Branch/Sub Tree: மரத்தை பிரிப்பதன் மூலம் உருவாகும் மரம்.
Pruning: மரத்திலிருந்து தேவையற்ற கிளைகளை அகற்றும் செயல்முறையாகும்.Parent/Child node: மரத்தின் வேர் முனை பெற்றோர் முனை என்றும், மற்ற முனைகள் குழந்தை முனைகள் என்றும் அழைக்கப்படுகின்றன.Decision tree வழிமுறை எவ்வாறு செயல்படுகிறது:ஒரு decision treeல், கொடுக்கப்பட்ட தரவுத்தொகுப்பின் வகுப்பைக் கணிக்க, வழிமுறை மரத்தின் மூல முனையிலிருந்து தொடங்குகிறது. இந்த வழிமுறை root பண்புக்கூறுகளின் மதிப்புகளை பதிவு (உண்மையான தரவுத்தொகுப்பு) பண்புடன் ஒப்பிடுகிறது, மேலும் ஒப்பீட்டின் அடிப்படையில், கிளையைப் பின்பற்றி அடுத்த முனைக்கு தாவுகிறது.
அடுத்த கணுவுக்கு, வழிமுறை மீண்டும் பண்புக்கூறு மதிப்பை மற்ற துணை முனைகளுடன் ஒப்பிட்டு மேலும் நகரும். இது மரத்தின் இலை முனையை அடையும் வரை செயல்முறையைத் தொடர்கிறது. கீழேயுள்ள வழிமுறையைப் பயன்படுத்தி முழுமையான செயல்முறையை நன்கு புரிந்து கொள்ள முடியும்:
1) root முனையுடன் மரத்தைத் தொடங்குகிறது, முழுமையான தரவுத்தொகுப்பைக் கொண்ட S.
2) பண்புக்கூறு தேர்வு அளவீடு (ASM) ஐப் பயன்படுத்தி தரவுத்தொகுப்பில் சிறந்த பண்புகளைக் கண்டறியலாம்.
3)சிறந்த பண்புகளுக்கான சாத்தியமான மதிப்புகளைக் கொண்ட துணைக்குழுக்களாக S பிரிக்கப்படுகிறது.
4) Decision tree முனையை உருவாக்கி, அதில் சிறந்த பண்பு உள்ளது.
5) 3 இல் உருவாக்கப்பட்ட தரவுத்தொகுப்பின் துணைக்குழுக்களைப் பயன்படுத்தி மீண்டும் மீண்டும் புதிய முடிவு மரங்களை உருவாக்கி, முனைகளை மேலும் வகைப்படுத்த முடியாத ஒரு கட்டத்தை அடையும் வரை இறுதி செயல்முறையை இலை முனை என்று அழைக்கும் வரை இந்த செயல்முறையை தொடர்கின்ன்ற.
Comments
Crapersoft, well knowledged in Bigdata, datamining and iot working environment in coimbatore.
Replygot good website... with advanced technologies...
ReplyI have published my research paper to Scopus at short duration thanks to help of crapersoft.
Reply