Decision Tree Algorithm

Decision tree algorithm என்பது மேற்பார்வையிடப்பட்ட கற்றல் நுட்பமாகும், இது வகைப்படுத்துதல் மற்றும் பின்னடைவு போன்ற பிரச்சினைகள் இரண்டிற்கும் பயன்படுத்தலாம், ஆனால் பெரும்பாலும் இது வகைப்படுத்துதல் சிக்கல்களைத் தீர்க்க பயன்படுகிறது. இது ஒரு மரத்தால் கட்டமைக்கப்பட்ட வகைப்பாடாகும், அங்கு உள் முனைகள் தரவுத்தொகுப்பின் அம்சங்களைக் குறிக்கின்றன, கிளைகள் முடிவு விதிகளை குறிக்கும் மற்றும் ஒவ்வொரு இலை முனையும் முடிவை குறிக்கும்.ஒரு Decision tree இல், இரண்டு முனைகள் உள்ளன, அவை முடிவு முனை மற்றும் இலை முனை. முடிவெடுக்கும் முனைகள் எந்தவொரு முடிவையும் எடுக்கப் பயன்படுகின்றன மற்றும் பல கிளைகளைக் கொண்டுள்ளன, அதேசமயம் இலை முனைகள் அந்த முடிவுகளின் வெளியீடு மற்றும் மேலும் அவை கிளைகளைக் கொண்டிருக்கவில்லை.

முடிவுகள் அல்லது சோதனை கொடுக்கப்பட்ட தரவுத்தொகுப்பின் அம்சங்களின் அடிப்படையில் செய்யப்படுகிறது.கொடுக்கப்பட்ட நிபந்தனைகளின் அடிப்படையில் ஒரு சிக்கல் / முடிவுக்கு சாத்தியமான அனைத்து தீர்வுகளையும் பெறுவதற்கான வரைகலைப் பிரதிநிதித்துவம்.

இது ஒரு Decision tree என்று அழைக்கப்படுகிறது, ஏனெனில், ஒரு மரத்தைப் போலவே, இது ரூட் முனையுடன் தொடங்குகிறது, இது மேலும் கிளைகளில் விரிவடைந்து, மரம் போன்ற கட்டமைப்பை உருவாக்குகிறது.ஒரு மரத்தை உருவாக்க,வகைப்பாடு மற்றும் பின்னடைவு மர வழிமுறையை குறிக்கும் CART வழிமுறையைப் பயன்படுத்துகிறோம். ஒரு Decision tree வேண்டுமென்றே ஒரு கேள்வியைக் கேட்கிறது, மேலும் பதிலின் அடிப்படையில் (ஆம் / இல்லை), இது மரத்தை மேலும் துணைப் பிரிவுகளாகப் பிரிக்கிறது.

Decision Tree Terminologies:

Root Node: decision tree தொடங்கும் இடத்திலிருந்து root node ஆரம்பிக்கிறது. இது முழு தரவுத்தொகுப்பையும் குறிக்கிறது, இது மேலும் இரண்டு அல்லது அதற்கு மேற்பட்ட ஒரேவிதமான தொகுப்புகளாக பிரிக்கப்படுகிறது.

Leaf Node: leaf Nodes இறுதி வெளியீட்டு முனை, மற்றும் இலை முனை கிடைத்த பிறகு மரத்தை மேலும் பிரிக்க முடியாது.

Splitting: splitting என்பது கொடுக்கப்பட்ட நிபந்தனைகளுக்கு ஏற்ப முடிவு முனை / root முனையை துணை முனைகளாக பிரிக்கும் செயல்முறையாகும்.Branch/Sub Tree: மரத்தை பிரிப்பதன் மூலம் உருவாகும் மரம்.

Pruning: மரத்திலிருந்து தேவையற்ற கிளைகளை அகற்றும் செயல்முறையாகும்.Parent/Child node: மரத்தின் வேர் முனை பெற்றோர் முனை என்றும், மற்ற முனைகள் குழந்தை முனைகள் என்றும் அழைக்கப்படுகின்றன.Decision tree வழிமுறை எவ்வாறு செயல்படுகிறது:ஒரு decision treeல், கொடுக்கப்பட்ட தரவுத்தொகுப்பின் வகுப்பைக் கணிக்க, வழிமுறை மரத்தின் மூல முனையிலிருந்து தொடங்குகிறது. இந்த வழிமுறை root பண்புக்கூறுகளின் மதிப்புகளை பதிவு (உண்மையான தரவுத்தொகுப்பு) பண்புடன் ஒப்பிடுகிறது, மேலும் ஒப்பீட்டின் அடிப்படையில், கிளையைப் பின்பற்றி அடுத்த முனைக்கு தாவுகிறது.

அடுத்த கணுவுக்கு, வழிமுறை மீண்டும் பண்புக்கூறு மதிப்பை மற்ற துணை முனைகளுடன் ஒப்பிட்டு மேலும் நகரும். இது மரத்தின் இலை முனையை அடையும் வரை செயல்முறையைத் தொடர்கிறது. கீழேயுள்ள வழிமுறையைப் பயன்படுத்தி முழுமையான செயல்முறையை நன்கு புரிந்து கொள்ள முடியும்:

1) root முனையுடன் மரத்தைத் தொடங்குகிறது, முழுமையான தரவுத்தொகுப்பைக் கொண்ட S.

2) பண்புக்கூறு தேர்வு அளவீடு (ASM) ஐப் பயன்படுத்தி தரவுத்தொகுப்பில் சிறந்த பண்புகளைக் கண்டறியலாம்.

3)சிறந்த பண்புகளுக்கான சாத்தியமான மதிப்புகளைக் கொண்ட துணைக்குழுக்களாக S பிரிக்கப்படுகிறது.

4) Decision tree முனையை உருவாக்கி, அதில் சிறந்த பண்பு உள்ளது.

5) 3 இல் உருவாக்கப்பட்ட தரவுத்தொகுப்பின் துணைக்குழுக்களைப் பயன்படுத்தி மீண்டும் மீண்டும் புதிய முடிவு மரங்களை உருவாக்கி, முனைகளை மேலும் வகைப்படுத்த முடியாத ஒரு கட்டத்தை அடையும் வரை இறுதி செயல்முறையை இலை முனை என்று அழைக்கும் வரை இந்த செயல்முறையை தொடர்கின்ன்ற.

Comments

  1. author

    Crapersoft, well knowledged in Bigdata, datamining and iot working environment in coimbatore.

    Reply
    1. author

      got good website... with advanced technologies...

      Reply
  2. author

    I have published my research paper to Scopus at short duration thanks to help of crapersoft.

    Reply

Leave A Comment

Gallery