Ero päätöksentekopuun ja satunnaisen metsän välillä - Ero-Välillä

Ero päätöksentekopuun ja satunnaisen metsän välillä

tärkein ero päätöspuun ja satunnaisen metsän välillä on se päätöspuu on kaavio, joka käyttää haarautumismenetelmää havainnollistaakseen päätöksen mahdollisia tuloksia, kun taas satunnainen metsä on joukko päätöksentekopuita, jotka antavat lopputuloksen kaikkien päätöksentekonsa tulosten perusteella.

Koneoppiminen on keinotekoisen älykkyyden sovellus, joka antaa järjestelmälle mahdollisuuden oppia ja parantaa aiempien kokemusten perusteella. Päätöspuu ja satunnainen metsä ovat kaksi tekniikkaa koneen oppimisessa. Päätöksessä on kartoitettu mahdollisten tulosten joukko niihin liittyviä valintoja. Se on suosittu, koska se on yksinkertainen ja helpompi ymmärtää. Kun aineisto muuttuu paljon suuremmaksi, yksittäinen päätöksentekopuu ei riitä ennusteen löytämiseen. Satunnainen metsä, joka on päätöspuun kokoelma, on vaihtoehto tähän ongelmaan. Satunnaisten metsien tuotanto perustuu kaikkien päätöksentekopuidensa tuloksiin.

Avainalueet katettu

1. Mikä on päätöspuu
- Määritelmä, toiminnallisuus, esimerkit
2. Mikä on satunnainen metsä
- Määritelmä, toiminnallisuus, esimerkit
3. Ero päätöksentekopuun ja satunnaisen metsän välillä
- Avainerojen vertailu

Avainkäsitteet

Päätöspuu, koneoppiminen, satunnainen metsä


Mikä on päätöksentekopuu

Päätöksentekopuu on puun muotoinen kaavio, jota käytetään toimintatavan määrittämiseen. Jokainen puun haara edustaa mahdollista päätöstä, esiintymistä tai reaktiota.

Päätöksentekoon liittyy useita termejä. Entropia on ennustamattomuuden mittaaminen aineistossa. Tietokannan jakamisen jälkeen entropian taso pienenee, kun ennustamattomuus pienenee. Tietovoitto on entropian väheneminen tietokannan piilottamisen jälkeen. On tärkeää jakaa tiedot siten, että tiedon saaminen kasvaa. Lopullisia päätöksiä tai luokituksia kutsutaan lehtisolmuiksi. Ylintä tai pääsolmua kutsutaan juurisolmuksi. Aineisto on jaettava, kunnes lopullinen entropia tulee nollaan.

Yksinkertainen päätöspuu on seuraava.


Kuva 1: Päätöspuu

Päätöksen puu luokittelee joukon hedelmiä. On 4 viinirypäleitä, 2 omenaa ja 2 appelsiinia. Kun tarkastellaan halkaisijaa alle 5, rypäleet luokitellaan yhdelle puolelle, kun taas appelsiinit ja omenat toiselle puolelle. Viinirypäleitä ei voi luokitella edelleen, koska sillä on nolla entropiaa. Kun luokitellaan värin perusteella, eli onko punainen punainen vai ei, omenat luokitellaan yhdelle puolelle, kun taas appelsiinit luokitellaan toiselle puolelle. Tämä päätöksentekopuu luokittelee omenan, rypäleen tai oranssin 100% tarkkuudella.

Kaiken kaikkiaan päätöksentekopuu on helppo ymmärtää, sitä on helpompi tulkita ja visualisoida. Se ei vaadi paljon tietojen valmistelua. Se pystyy käsittelemään sekä numeerisia että kategorisia tietoja. Toisaalta tietojen melu voi aiheuttaa ylikorostuksen. Lisäksi malli voi myös olla epävakaa pienten muunnelmien vuoksi.

Mikä on Random Forest

Satunnainen metsä on menetelmä, joka toimii rakentamalla useita päätöksentekopuita koulutusvaiheen aikana. Useimpien puiden päätökset ovat satunnaisen metsän lopullinen päätös. Yksinkertainen esimerkki on seuraava.

Oletetaan, että on olemassa joukko hedelmiä (kirsikat, omenat ja appelsiinit). Seuraavassa on kolme päätöksentekoa, jotka luokittelevat nämä kolme hedelmätyyppiä.


Kuva 2: Päätöspuu 1


Kuva 3: Päätöspuu 2


Kuva 4: Päätöspuu 3

Mallille annetaan uusi hedelmä, jonka halkaisija on 3. Tämä hedelmä on oranssinvärinen ja kasvaa kesällä. Ensimmäinen päätöspuu luokittelee sen oranssiksi. Toinen päätöspuu luokittelee sen kirsikkaaksi, kun taas kolmas päätöspuu luokittelee sen oranssiksi. Kaikkia kolmea puuta harkittaessa on kaksi oranssia. Siksi satunnaisen metsän lopputulos on oranssi.

Kaiken kaikkiaan satunnainen metsä antaa tarkkoja tuloksia suuremmalle tietokannalle. Se vähentää myös ylikuormituksen riskiä.

Ero päätöksentekopuun ja satunnaisen metsän välillä

Määritelmä

Päätöspuu on päätöksentekotyökalu, joka käyttää puumaisia ​​kaavioita tai päätöksentekomalleja ja niiden mahdollisia seurauksia, mukaan lukien mahdollisuustapahtumien tulokset, resurssien kustannukset ja hyödyllisyys. Satunnaiset metsät ovat ensemble-oppimismenetelmä, joka toimii rakentamalla lukuisia päätöksentekopuita koulutuksen aikana ja antamalla luokan riippuen yksittäisistä puista.

overfitting

On olemassa mahdollisuus, että päätöksentekopuu on liian suuri. Useiden puiden käyttö satunnaisessa metsässä pienentää ylikorostumisriskiä.

tarkkuus

Satunnainen metsä antaa tarkempia tuloksia kuin päätöspuu.

Monimutkaisuus

Päätöspuu on yksinkertaisempi ja helpompi ymmärtää, tulkita ja visualisoida kuin satunnainen metsä, joka on suhteellisen monimutkaisempi.

johtopäätös

Päätöspuun ja satunnaisten metsien välinen ero on se, että päätöksentekopuu on kaavio, joka käyttää haaroitusmenetelmää havainnollistaakseen päätöksen kaikkia mahdollisia tuloksia, kun taas satunnainen metsä on joukko päätöspuita, jotka antavat lopputuloksen kaikkien tulosten perusteella sen päätöksentekopuut.

Viite:

1. Random Forest Algorithm - Satunnainen metsä selitetty | Satunnainen metsä koneopetuksessa , Simplilearn, 12. maaliskuuta 2018,