Lineaarisen regressioon ja logistiseen regressioon liittyvä ero - Ero-Välillä

Lineaarisen regressioon ja logistiseen regressioon liittyvä ero

tärkein ero lineaarisen regression ja logistisen regression välillä on se, että lineaarista regressiota käytetään jatkuvan arvon ennustamiseen, kun taas logistista regressiota käytetään diskreetin arvon ennustamiseen.

Koneen oppimisjärjestelmät voivat ennustaa tulevia tuloksia aiempien panosten koulutuksen perusteella. Koneen oppimisen päätyyppiä kutsutaan valvotuksi oppimiseksi ja valvomattomaksi oppimiseksi. Regressio ja luokittelu kuuluvat valvotun oppimisen piiriin, kun taas klusterointi kuuluu valvomattomaan oppimiseen. Valvotut oppimisalgoritmit käyttävät merkityt tiedot dataryhmän kouluttamiseksi. Lineaarinen regressio ja logistinen regressio ovat kahdenlaisia ​​valvottuja oppimisalgoritmeja. Lineaarista regressiota käytetään, kun riippuva muuttuja on jatkuva, ja malli on lineaarinen. Logistista regressiota käytetään, kun riippuva muuttuja on erillinen, ja malli on epälineaarinen.

Avainalueet katettu

1. Mikä on lineaarinen regressio
- Määritelmä, toiminnallisuus
2. Mikä on logistinen regressio
- Määritelmä, toiminnallisuus
3. Lineaarisen regressioon ja logistiseen regressioon liittyvä ero
- Avainerojen vertailu

Avainkäsitteet

Lineaarinen regressio, logistinen regressio, koneoppiminen


Mikä on lineaarinen regressio

Lineaarinen regressio löytää riippumattoman ja riippuvaisen muuttujan välisen suhteen. Molemmat ovat vierekkäisiä. Riippumaton muuttuja on muuttuja, jota muut muuttujat eivät muutu. Se on merkitty x: llä. Voidaan myös olla useita riippumattomia muuttujia, kuten x1, x2, x3 jne. Riippuvainen muuttuja muuttuu riippumattoman muuttujan mukaan ja on merkitty y: llä.

Kun on yksi riippumaton muuttuja, regressioyhtälö on seuraava.

y = b0 + b1x

Oletetaan esimerkiksi, että x edustaa sateita ja y edustaa satotuottoa.


Kuva 1: Lineaarinen regressio

Aineisto näyttää edellä. Sitten valitaan rivi, joka kattaa useimmat datapisteet. Tämä rivi edustaa ennustettuja arvoja.


Kuva 2: Todellisten datapisteiden ja ennustettujen arvojen välinen etäisyys

Sitten etäisyys kustakin datapisteestä linjaan nähdään kuten yllä olevassa kaaviossa on esitetty. Tämä on todellisen arvon ja ennustetun arvon välinen etäisyys. Tätä etäisyyttä kutsutaan myös virheeksi tai jäännöksiksi. Parhaiten sopivan linjan pitäisi olla vähintään virheiden summa. Kun annetaan uusi sademäärä (x), on mahdollista löytää vastaava sato (y) tällä linjalla.

Reaalimaailmassa voi olla useita riippumattomia muuttujia (x1, x2, x3…). Tätä kutsutaan moninkertaiseksi lineaariseksi regressioksi. Moninkertainen lineaarinen regressioyhtälö on seuraava.

Mikä on logistinen regressio

Logistista regressiota voidaan käyttää kahden luokan luokitteluun. Se tunnetaan myös nimellä binäärinen luokitus. Muita esimerkkejä logistisesta regressiosta tarkistetaan, onko sähköpostiviesti roskapostia tai ennustaa, ostaako tuote tuotteen vai ei, ennustaa, onko mahdollista saada tarjous vai ei.


Kuva 3: Logistinen regressio

Oletetaan, että tuntien määrä opiskelijaa päivässä on itsenäinen muuttuja. Tämän perusteella lasketaan tentin läpäisy todennäköisyys. Arvo 0,5, jota pidetään kynnysarvona. Kun uusi tuntien lukumäärä on annettu, on mahdollista löytää vastaava todennäköisyys, että tentti suoritetaan tämän kaavion avulla. Jos todennäköisyys on yli 0,5, sitä pidetään 1 tai passina. Jos todennäköisyys on alle 0,5, se katsotaan 0: ksi tai epäonnistuu.

Lineaarisen regressioyhtälön soveltaminen sigmoidifunktioon antaa logistisen regressioyhtälön.

Sigmoid-toiminto on


Toinen tärkeä huomionarvoinen seikka on se, että logistinen regressio soveltuu vain kahden luokan luokitteluun. Sitä ei käytetä moniluokkaan luokitteluun.

Lineaarisen regressioon ja logistiseen regressioon liittyvä ero

Määritelmä

Lineaarinen regressio on lineaarinen lähestymistapa, joka mittaa riippuvan muuttujan ja yhden tai useamman riippumattoman muuttujan välistä suhdetta. Sitä vastoin logistinen regressio on tilastollinen malli, joka ennustaa todennäköisyyden tulokseen, jolla voi olla vain kaksi arvoa.

Käyttö

Vaikka regressio-ongelmien ratkaisemiseksi käytetään lineaarista regressiota, luokitusongelmien ratkaisemiseksi käytetään logistista regressiota (binäärinen luokitus).

Metodologia

Lineaarinen regressio arvioi riippuvan muuttujan, kun itsenäisessä muuttujassa on muutos. Logistinen regressio laskee tapahtuman mahdollisuuden. Tämä on yksi tärkeä ero lineaarisen regressioon ja logistiseen regressioon.

Lähtöarvo

Myös lineaarisessa regressiossa lähtöarvo on jatkuva. Logistisessa regressiossa lähtöarvo on erillinen.

Malli

Vaikka lineaarinen regressio käyttää suoraa linjaa, logistinen regressio käyttää S-käyrää tai sigmoiditoimintaa. Tämä on toinen tärkeä ero lineaarisen regressioon ja logistiseen regressioon.

esimerkit

Maan bruttokansantuotteen ennustaminen, tuotteen hinnan ennustaminen, talon myyntihinnan ennustaminen, pisteet ennustavat joitakin esimerkkejä lineaarisesta regressiosta. Ennakoimalla, onko sähköpostiviesti roskapostia tai ei, ennustaa, onko luottokorttitoiminta petos vai ei, ennustaa, ottaako asiakas lainan vai eivät, ovat esimerkkejä logistisesta regressiosta.

johtopäätös

Lineaarisen regressioon ja logistiseen regressioon nähden ero on, että lineaarista regressiota käytetään jatkuvan arvon ennustamiseen, kun taas logistista regressiota käytetään diskreetin arvon ennustamiseen. Lyhyesti sanottuna lineaarista regressiota käytetään regressioon, kun taas luokittelussa käytetään logistista regressiota.

Viite:

1. Lineaarinen regressioanalyysi Lineaarinen regressio Pythonissa | Koneen oppimisalgoritmit | Simplilearn, 26. maaliskuuta 2018