logo

Koneoppimisen tyypit

Koneoppiminen on tekoälyn osajoukko, jonka avulla kone voi oppia automaattisesti datasta, parantaa suorituskykyä aiempien kokemusten perusteella ja tehdä ennusteita. . Koneoppiminen sisältää joukon algoritmeja, jotka toimivat valtavalla datamäärällä. Näille algoritmeille syötetään tietoja niiden kouluttamiseksi, ja koulutuksen perusteella he rakentavat mallin ja suorittavat tietyn tehtävän.

Koneoppimisen tyypit

Nämä ML-algoritmit auttavat ratkaisemaan erilaisia ​​liiketoimintaongelmia, kuten regressiota, luokittelua, ennustamista, klusterointia ja assosiaatioita jne.

Oppimismenetelmien ja -tapojen perusteella koneoppiminen jaetaan pääosin neljään tyyppiin, jotka ovat:

  1. Valvottu koneoppiminen
  2. Valvomaton koneoppiminen
  3. Puoliohjattu koneoppiminen
  4. Vahvistusoppiminen
Koneoppimisen tyypit

Tässä aiheessa annamme yksityiskohtaisen kuvauksen koneoppimisen tyypeistä ja niitä vastaavista algoritmeista:

1. Valvottu koneoppiminen

Kuten nimikin kertoo, Valvottua koneoppimista perustuu valvontaan. Se tarkoittaa, että ohjatussa oppimistekniikassa koulutamme koneet 'merkitty' tietojoukon avulla ja koulutuksen perusteella kone ennustaa tulosteen. Tässä merkityt tiedot määrittelevät, että osa tuloista on jo kartoitettu lähtöön. Vielä arvokkaammin voimme sanoa; ensin koulutamme koneen syötteellä ja vastaavalla lähdöllä, ja sitten pyydämme konetta ennustamaan lähdön testitietojoukon avulla.

Ymmärretään ohjattua oppimista esimerkin avulla. Oletetaan, että meillä on syöttötietojoukko kissoista ja koirista. Joten ensin tarjoamme koneelle koulutuksen kuvien ymmärtämiseksi, kuten kissan ja koiran hännän muoto ja koko, silmien muoto, väri, pituus (koirat ovat pidempiä, kissat pienempiä) jne. Koulutuksen päätyttyä syötämme kuvan kissasta ja pyydämme konetta tunnistamaan kohteen ja ennustamaan tulos. Nyt kone on hyvin koulutettu, joten se tarkistaa kohteen kaikki ominaisuudet, kuten korkeuden, muodon, värin, silmät, korvat, hännän jne., ja huomaa, että se on kissa. Joten se laittaa sen Kissa-luokkaan. Tämä on prosessi, jolla kone tunnistaa objektit valvotussa oppimisessa.

Valvotun oppimistekniikan päätavoite on kartoittaa syöttömuuttuja(x) lähtömuuttujaan(y). Jotkut ohjatun oppimisen todelliset sovellukset ovat Riskinarviointi, Petosten havaitseminen, Roskapostin suodatus, jne.

Ohjatun koneoppimisen luokat

Valvottu koneoppiminen voidaan luokitella kahteen ongelmatyyppiin, jotka on esitetty alla:

    Luokittelu Regressio

a) Luokittelu

Luokittelualgoritmeja käytetään ratkaisemaan luokitusongelmia, joissa lähtömuuttuja on kategorinen, kuten ' Kyllä tai ei, mies tai nainen, punainen tai sininen jne . Luokittelualgoritmit ennustavat tietojoukossa olevat luokat. Joitakin todellisia esimerkkejä luokittelualgoritmeista ovat Roskapostin tunnistus, sähköpostin suodatus jne.

merkkijono kokonaisluvuksi muuntaa

Alla on joitain suosittuja luokitusalgoritmeja:

    Satunnainen metsäalgoritmi Päätöspuun algoritmi Logistinen regressioalgoritmi Tuki Vector Machine Algorithm

b) Regressio

Regressioalgoritmeja käytetään ratkaisemaan regressioongelmia, joissa tulo- ja lähtömuuttujien välillä on lineaarinen suhde. Näitä käytetään ennustamaan jatkuvia tuotantomuuttujia, kuten markkinatrendejä, sääennusteita jne.

Alla on joitain suosittuja regressioalgoritmeja:

    Yksinkertainen lineaarinen regressioalgoritmi Monimuuttujaregressio-algoritmi Päätöspuun algoritmi Lasson regressio

Ohjatun oppimisen edut ja haitat

Edut:

  • Koska ohjattu oppiminen työskentelee merkityn tietojoukon kanssa, jotta voimme saada tarkan käsityksen objektiluokista.
  • Nämä algoritmit auttavat ennustamaan tulosten aikaisemman kokemuksen perusteella.

Haitat:

  • Nämä algoritmit eivät pysty ratkaisemaan monimutkaisia ​​tehtäviä.
  • Se voi ennustaa väärän tulosteen, jos testitiedot eroavat harjoitustiedoista.
  • Algoritmin harjoitteleminen vaatii paljon laskenta-aikaa.

Ohjatun oppimisen sovellukset

Alla on joitain yleisiä valvotun oppimisen sovelluksia:

    Kuvan segmentointi:
    Valvottuja oppimisalgoritmeja käytetään kuvien segmentoinnissa. Tässä prosessissa kuvien luokittelu suoritetaan eri kuvadatalle ennalta määritetyillä tarroilla.Lääketieteellinen diagnoosi:
    Valvottuja algoritmeja käytetään myös lääketieteen alalla diagnoositarkoituksiin. Se tehdään käyttämällä lääketieteellisiä kuvia ja aikaisempia merkittyjä tietoja, joissa on tarroja sairaustiloista. Tällaisen prosessin avulla kone voi tunnistaa taudin uusille potilaille.Petosten havaitseminen -Valvotun oppimisen luokittelualgoritmeja käytetään petostapahtumien, petosasiakkaiden jne. tunnistamiseen. Se tehdään käyttämällä historiallisia tietoja tunnistamaan mallit, jotka voivat johtaa mahdollisiin petoksiin.Roskapostin tunnistus -Roskapostin havaitsemisessa ja suodatuksessa käytetään luokitusalgoritmeja. Nämä algoritmit luokittelevat sähköpostin roskapostiksi tai ei roskapostiksi. Roskapostiviestit lähetetään roskapostikansioon.Puheentunnistus -Valvottuja oppimisalgoritmeja käytetään myös puheentunnistuksessa. Algoritmi on opetettu puhetiedolla, ja samalla voidaan tehdä erilaisia ​​tunnistuksia, kuten puheohjattuja salasanoja, äänikomentoja jne.

2. Valvomaton koneoppiminen

Ohjaamaton oppiminen g on erilainen kuin ohjattu oppimistekniikka; Kuten nimikin kertoo, valvontaa ei tarvita. Se tarkoittaa, että valvomattomassa koneoppimisessa kone on koulutettu käyttämällä merkitsemätöntä tietojoukkoa, ja kone ennustaa tulosteen ilman valvontaa.

Ohjaamattomassa oppimisessa mallit koulutetaan datalla, jota ei ole luokiteltu tai merkitty, ja malli toimii näiden tietojen perusteella ilman valvontaa.

Valvomattoman oppimisalgoritmin päätavoite on ryhmitellä tai luokitella lajittelematon tietojoukko samankaltaisuuksien, kuvioiden ja erojen mukaan. Koneita neuvotaan löytämään piilotetut kuviot syöttötietojoukosta.

Otetaan esimerkki ymmärtääksemme sitä tarkemmin; Oletetaan, että siellä on hedelmäkuvien kori, ja syötämme sen koneoppimismalliin. Kuvat ovat mallille täysin tuntemattomia, ja koneen tehtävänä on löytää esineiden kuviot ja kategoriat.

lataa youtube vlc:llä

Joten nyt kone löytää kuvionsa ja eronsa, kuten värieron, muotoeron, ja ennustaa tulosteen, kun sitä testataan testitietojoukon kanssa.

Valvomattoman koneoppimisen luokat

Ohjaamaton oppiminen voidaan edelleen luokitella kahteen tyyppiin, jotka on esitetty alla:

    Klusterointi yhdistys

1) Klusterointi

Klusterointitekniikkaa käytetään, kun haluamme löytää tiedosta luontaiset ryhmät. Se on tapa ryhmitellä objektit klusteriin siten, että kohteet, joilla on eniten yhtäläisyyksiä, jäävät yhteen ryhmään ja niillä on vähemmän tai ei ollenkaan yhtäläisyyksiä muiden ryhmien objektien kanssa. Esimerkki klusterointialgoritmista on asiakkaiden ryhmittely heidän ostokäyttäytymisensä mukaan.

Alla on joitain suosittuja klusterointialgoritmeja:

    K-Means-klusterointialgoritmi Keskiarvon siirtymäalgoritmi DBSCAN-algoritmi Pääkomponenttianalyysi Itsenäinen komponenttianalyysi

2) Yhdistys

Assosiaatiosäännön oppiminen on valvomaton oppimistekniikka, joka löytää mielenkiintoisia suhteita suuren tietojoukon muuttujien välillä. Tämän oppimisalgoritmin päätavoite on löytää yhden tietokohteen riippuvuus toisesta tietokohdasta ja kartoittaa nämä muuttujat vastaavasti, jotta se voi tuottaa suurimman voiton. Tätä algoritmia käytetään pääasiassa Markkinakori-analyysi, web-käytön louhinta, jatkuva tuotanto , jne.

paikallinen päivämäärä

Jotkut suosittuja assosiaatiosäännön oppimisalgoritmeja ovat Apriori-algoritmi, Eclat, FP-kasvualgoritmi.

Valvomattoman oppimisalgoritmin edut ja haitat

Edut:

  • Näitä algoritmeja voidaan käyttää monimutkaisiin tehtäviin verrattuna valvottuihin, koska nämä algoritmit toimivat merkitsemättömässä tietojoukossa.
  • Valvomattomat algoritmit ovat parempia erilaisiin tehtäviin, koska merkitsemättömän tietojoukon saaminen on helpompaa kuin merkitty tietojoukko.

Haitat:

  • Valvomattoman algoritmin tulos voi olla epätarkempi, koska tietojoukkoa ei ole merkitty eikä algoritmeja opeteta aiemman tarkan tulosteen perusteella.
  • Ohjaamattoman oppimisen kanssa työskentely on vaikeampaa, koska se toimii nimeämättömän tietojoukon kanssa, joka ei kartoitu tulosteen kanssa.

Ohjaamattoman oppimisen sovellukset

    Verkkoanalyysi:Ohjaamatonta oppimista käytetään plagioinnin ja tekijänoikeuksien tunnistamiseen tieteellisten artikkeleiden tekstidatan dokumenttiverkkoanalyysissä.Suositusjärjestelmät:Suositusjärjestelmät käyttävät laajalti valvomattomia oppimistekniikoita suositussovellusten rakentamiseen erilaisille verkkosovelluksille ja verkkokauppasivustoille.Anomalian tunnistus:Poikkeamien havaitseminen on suosittu valvomattoman oppimisen sovellus, joka voi tunnistaa epätavallisia tietopisteitä tietojoukosta. Sitä käytetään vilpillisten liiketoimien havaitsemiseen.Yksittäisen arvon hajoaminen:Singular Value Decomposition eli SVD:tä käytetään tiettyjen tietojen poimimiseen tietokannasta. Esimerkiksi kunkin tietyssä paikassa sijaitsevan käyttäjän tietojen poimiminen.

3. Puoliohjattu oppiminen

Puoliohjattu oppiminen on eräänlainen koneoppimisalgoritmi, joka sijaitsee valvotun ja valvomattoman koneoppimisen välissä . Se edustaa välimaata valvottujen (merkityillä harjoitustiedoilla) ja valvomattomien oppimisalgoritmien (ilman merkittyjä harjoitustietoja) välillä ja käyttää merkittyjen ja merkitsemättömien tietojoukkojen yhdistelmää harjoitusjakson aikana.

A Vaikka puoliohjattu oppiminen on keskitie ohjatun ja ohjaamattoman oppimisen välillä ja toimii muutamista tunnisteista koostuvalla tiedolla, se koostuu enimmäkseen nimeämättömistä tiedoista. Koska tarrat ovat kalliita, mutta yritystarkoituksiin, niissä voi olla vähän tarroja. Se on täysin erilaista kuin ohjattu ja ohjaamaton oppiminen, koska ne perustuvat tarrojen olemassaoloon ja puuttumiseen.

Ohjatun oppimisen ja ohjaamattomien oppimisalgoritmien haittojen voittamiseksi otetaan käyttöön puoliohjatun oppimisen käsite . Puoliohjatun oppimisen päätavoite on hyödyntää tehokkaasti kaikkea saatavilla olevaa dataa, ei vain merkittyä dataa, kuten ohjatussa oppimisessa. Aluksi samankaltaiset tiedot ryhmitellään yhdessä valvomattoman oppimisalgoritmin kanssa, ja lisäksi se auttaa nimeämään merkitsemättömät tiedot merkityiksi tiedoiksi. Tämä johtuu siitä, että merkitty data on verrattain kalliimpi hankinta kuin merkitsemätön data.

Voimme kuvitella nämä algoritmit esimerkin avulla. Ohjattu oppiminen on sitä, että opiskelija on ohjaajan valvonnassa kotona ja yliopistossa. Lisäksi, jos kyseinen opiskelija itse analysoi samaa käsitettä ilman ohjaajan apua, se kuuluu ohjaamattoman oppimisen piiriin. Puoliohjatussa oppimisessa opiskelijan on tarkistettava itseään analysoituaan samaa käsitettä korkeakoulun ohjaajan johdolla.

Puoliohjatun oppimisen edut ja haitat

Edut:

  • Algoritmi on yksinkertainen ja helppo ymmärtää.
  • Se on erittäin tehokas.
  • Sitä käytetään valvottujen ja valvomattomien oppimisalgoritmien haittojen ratkaisemiseen.

Haitat:

  • Iteraatioiden tulokset eivät välttämättä ole vakaita.
  • Emme voi soveltaa näitä algoritmeja verkkotason tietoihin.
  • Tarkkuus on alhainen.

4. Vahvistusoppiminen

Vahvistusoppiminen toimii palautepohjaisessa prosessissa, jossa tekoälyagentti (ohjelmistokomponentti) tutkii automaattisesti ympäristöään lyömällä ja jäljittämällä, ryhtymällä toimiin, oppimalla kokemuksista ja parantamalla suorituskykyään. Agentti palkitaan jokaisesta hyvästä toiminnasta ja saa rangaistuksen jokaisesta huonosta toiminnasta; siksi vahvistavan oppimisagentin tavoitteena on maksimoida palkkiot.

Vahvistusoppimisessa ei ole merkittyä dataa, kuten ohjattua oppimista, ja agentit oppivat vain kokemuksistaan.

Vahvistusoppimisprosessi on samanlainen kuin ihminen; esimerkiksi lapsi oppii erilaisia ​​asioita kokemusten kautta jokapäiväisessä elämässään. Vahvistusoppimisen esimerkkinä on pelata peliä, jossa Peli on ympäristö, agentin liikkeet kussakin vaiheessa määrittelevät tilat ja agentin tavoitteena on saada korkeat pisteet. Agentti saa palautetta rangaistuksista ja palkkioista.

Vahvistusoppimista hyödynnetään työskentelytapansa ansiosta eri aloilla, mm Peliteoria, toimintatutkimus, informaatioteoria, moniagenttijärjestelmät.

Vahvistusoppimisongelma voidaan formalisoida käyttämällä Markovin päätösprosessi (MDP). MDP:ssä agentti on jatkuvasti vuorovaikutuksessa ympäristön kanssa ja suorittaa toimia; jokaisessa toiminnassa ympäristö reagoi ja luo uuden tilan.

Vahvistusoppimisen luokat

Vahvistusoppiminen luokitellaan pääasiassa kahdentyyppisiin menetelmiin/algoritmiin:

mini työkalupalkki excel
    Positiivinen vahvistusoppiminen:Positiivinen vahvistusoppiminen määrittelee lisäämällä taipumusta siihen, että vaadittu käyttäytyminen toistuisi lisäämällä jotain. Se vahvistaa agentin käyttäytymisen vahvuutta ja vaikuttaa siihen positiivisesti.Negatiivinen vahvistusoppiminen:Negatiivinen vahvistusoppiminen toimii täsmälleen päinvastoin kuin positiivinen RL. Se lisää taipumusta, että tietty käyttäytyminen toistuisi välttämällä negatiivista tilaa.

Vahvistusoppimisen todelliset käyttötapaukset

    Videopelit:
    RL-algoritmit ovat erittäin suosittuja pelisovelluksissa. Sitä käytetään saavuttamaan yli-inhimillistä suorituskykyä. Jotkut suositut pelit, jotka käyttävät RL-algoritmeja, ovat AlphaGO ja AlphaGO Zero .Resurssienhallinta:
    Resurssien hallinta syvän vahvistusoppimisen avulla osoitti, että kuinka käyttää RL:ää tietokoneessa oppimaan automaattisesti ja ajoittamaan resurssit odottamaan erilaisia ​​töitä, jotta keskimääräinen työn hidastuminen voidaan minimoida.Robotiikka:
    RL on laajalti käytössä robotiikkasovelluksissa. Robotteja käytetään teollisuudessa ja valmistuksessa, ja näitä robotteja tehdään tehokkaammiksi vahvistusoppimisen avulla. Eri toimialoilla on visio rakentaa älykkäitä robotteja tekoäly- ja koneoppimisteknologian avulla.Tekstin louhinta
    Tekstinlouhinta, yksi NLP:n hienoista sovelluksista, on nyt toteutettu Salesforce-yrityksen Reinforcement Learningin avulla.

Vahvistusoppimisen edut ja haitat

Edut

  • Se auttaa ratkaisemaan monimutkaisia ​​reaalimaailman ongelmia, joita on vaikea ratkaista yleisillä tekniikoilla.
  • RL:n oppimismalli on samanlainen kuin ihmisten oppiminen; joten tarkimmat tulokset voidaan löytää.
  • Auttaa saavuttamaan pitkän aikavälin tuloksia.

Epäkohta

  • RL-algoritmeja ei suositella yksinkertaisiin ongelmiin.
  • RL-algoritmit vaativat valtavasti dataa ja laskelmia.
  • Liiallinen vahvistusoppiminen voi johtaa tilojen ylikuormitukseen, mikä voi heikentää tuloksia.

Ulottuvuuden kirous rajoittaa todellisten fyysisten järjestelmien vahvistamisoppimista.