Koneoppiminen on tekoälyn osajoukko, jonka avulla kone voi oppia automaattisesti datasta, parantaa suorituskykyä aiempien kokemusten perusteella ja tehdä ennusteita. . Koneoppiminen sisältää joukon algoritmeja, jotka toimivat valtavalla datamäärällä. Näille algoritmeille syötetään tietoja niiden kouluttamiseksi, ja koulutuksen perusteella he rakentavat mallin ja suorittavat tietyn tehtävän.
Nämä ML-algoritmit auttavat ratkaisemaan erilaisia liiketoimintaongelmia, kuten regressiota, luokittelua, ennustamista, klusterointia ja assosiaatioita jne.
Oppimismenetelmien ja -tapojen perusteella koneoppiminen jaetaan pääosin neljään tyyppiin, jotka ovat:
- Valvottu koneoppiminen
- Valvomaton koneoppiminen
- Puoliohjattu koneoppiminen
- Vahvistusoppiminen
Tässä aiheessa annamme yksityiskohtaisen kuvauksen koneoppimisen tyypeistä ja niitä vastaavista algoritmeista:
1. Valvottu koneoppiminen
Kuten nimikin kertoo, Valvottua koneoppimista perustuu valvontaan. Se tarkoittaa, että ohjatussa oppimistekniikassa koulutamme koneet 'merkitty' tietojoukon avulla ja koulutuksen perusteella kone ennustaa tulosteen. Tässä merkityt tiedot määrittelevät, että osa tuloista on jo kartoitettu lähtöön. Vielä arvokkaammin voimme sanoa; ensin koulutamme koneen syötteellä ja vastaavalla lähdöllä, ja sitten pyydämme konetta ennustamaan lähdön testitietojoukon avulla.
Ymmärretään ohjattua oppimista esimerkin avulla. Oletetaan, että meillä on syöttötietojoukko kissoista ja koirista. Joten ensin tarjoamme koneelle koulutuksen kuvien ymmärtämiseksi, kuten kissan ja koiran hännän muoto ja koko, silmien muoto, väri, pituus (koirat ovat pidempiä, kissat pienempiä) jne. Koulutuksen päätyttyä syötämme kuvan kissasta ja pyydämme konetta tunnistamaan kohteen ja ennustamaan tulos. Nyt kone on hyvin koulutettu, joten se tarkistaa kohteen kaikki ominaisuudet, kuten korkeuden, muodon, värin, silmät, korvat, hännän jne., ja huomaa, että se on kissa. Joten se laittaa sen Kissa-luokkaan. Tämä on prosessi, jolla kone tunnistaa objektit valvotussa oppimisessa.
Valvotun oppimistekniikan päätavoite on kartoittaa syöttömuuttuja(x) lähtömuuttujaan(y). Jotkut ohjatun oppimisen todelliset sovellukset ovat Riskinarviointi, Petosten havaitseminen, Roskapostin suodatus, jne.
Ohjatun koneoppimisen luokat
Valvottu koneoppiminen voidaan luokitella kahteen ongelmatyyppiin, jotka on esitetty alla:
a) Luokittelu
Luokittelualgoritmeja käytetään ratkaisemaan luokitusongelmia, joissa lähtömuuttuja on kategorinen, kuten ' Kyllä tai ei, mies tai nainen, punainen tai sininen jne . Luokittelualgoritmit ennustavat tietojoukossa olevat luokat. Joitakin todellisia esimerkkejä luokittelualgoritmeista ovat Roskapostin tunnistus, sähköpostin suodatus jne.
merkkijono kokonaisluvuksi muuntaa
Alla on joitain suosittuja luokitusalgoritmeja:
b) Regressio
Regressioalgoritmeja käytetään ratkaisemaan regressioongelmia, joissa tulo- ja lähtömuuttujien välillä on lineaarinen suhde. Näitä käytetään ennustamaan jatkuvia tuotantomuuttujia, kuten markkinatrendejä, sääennusteita jne.
Alla on joitain suosittuja regressioalgoritmeja:
Ohjatun oppimisen edut ja haitat
Edut:
- Koska ohjattu oppiminen työskentelee merkityn tietojoukon kanssa, jotta voimme saada tarkan käsityksen objektiluokista.
- Nämä algoritmit auttavat ennustamaan tulosten aikaisemman kokemuksen perusteella.
Haitat:
- Nämä algoritmit eivät pysty ratkaisemaan monimutkaisia tehtäviä.
- Se voi ennustaa väärän tulosteen, jos testitiedot eroavat harjoitustiedoista.
- Algoritmin harjoitteleminen vaatii paljon laskenta-aikaa.
Ohjatun oppimisen sovellukset
Alla on joitain yleisiä valvotun oppimisen sovelluksia:
Valvottuja oppimisalgoritmeja käytetään kuvien segmentoinnissa. Tässä prosessissa kuvien luokittelu suoritetaan eri kuvadatalle ennalta määritetyillä tarroilla.
Valvottuja algoritmeja käytetään myös lääketieteen alalla diagnoositarkoituksiin. Se tehdään käyttämällä lääketieteellisiä kuvia ja aikaisempia merkittyjä tietoja, joissa on tarroja sairaustiloista. Tällaisen prosessin avulla kone voi tunnistaa taudin uusille potilaille.
2. Valvomaton koneoppiminen
Ohjaamaton oppiminen g on erilainen kuin ohjattu oppimistekniikka; Kuten nimikin kertoo, valvontaa ei tarvita. Se tarkoittaa, että valvomattomassa koneoppimisessa kone on koulutettu käyttämällä merkitsemätöntä tietojoukkoa, ja kone ennustaa tulosteen ilman valvontaa.
Ohjaamattomassa oppimisessa mallit koulutetaan datalla, jota ei ole luokiteltu tai merkitty, ja malli toimii näiden tietojen perusteella ilman valvontaa.
Valvomattoman oppimisalgoritmin päätavoite on ryhmitellä tai luokitella lajittelematon tietojoukko samankaltaisuuksien, kuvioiden ja erojen mukaan. Koneita neuvotaan löytämään piilotetut kuviot syöttötietojoukosta.
Otetaan esimerkki ymmärtääksemme sitä tarkemmin; Oletetaan, että siellä on hedelmäkuvien kori, ja syötämme sen koneoppimismalliin. Kuvat ovat mallille täysin tuntemattomia, ja koneen tehtävänä on löytää esineiden kuviot ja kategoriat.
lataa youtube vlc:llä
Joten nyt kone löytää kuvionsa ja eronsa, kuten värieron, muotoeron, ja ennustaa tulosteen, kun sitä testataan testitietojoukon kanssa.
Valvomattoman koneoppimisen luokat
Ohjaamaton oppiminen voidaan edelleen luokitella kahteen tyyppiin, jotka on esitetty alla:
1) Klusterointi
Klusterointitekniikkaa käytetään, kun haluamme löytää tiedosta luontaiset ryhmät. Se on tapa ryhmitellä objektit klusteriin siten, että kohteet, joilla on eniten yhtäläisyyksiä, jäävät yhteen ryhmään ja niillä on vähemmän tai ei ollenkaan yhtäläisyyksiä muiden ryhmien objektien kanssa. Esimerkki klusterointialgoritmista on asiakkaiden ryhmittely heidän ostokäyttäytymisensä mukaan.
Alla on joitain suosittuja klusterointialgoritmeja:
2) Yhdistys
Assosiaatiosäännön oppiminen on valvomaton oppimistekniikka, joka löytää mielenkiintoisia suhteita suuren tietojoukon muuttujien välillä. Tämän oppimisalgoritmin päätavoite on löytää yhden tietokohteen riippuvuus toisesta tietokohdasta ja kartoittaa nämä muuttujat vastaavasti, jotta se voi tuottaa suurimman voiton. Tätä algoritmia käytetään pääasiassa Markkinakori-analyysi, web-käytön louhinta, jatkuva tuotanto , jne.
paikallinen päivämäärä
Jotkut suosittuja assosiaatiosäännön oppimisalgoritmeja ovat Apriori-algoritmi, Eclat, FP-kasvualgoritmi.
Valvomattoman oppimisalgoritmin edut ja haitat
Edut:
- Näitä algoritmeja voidaan käyttää monimutkaisiin tehtäviin verrattuna valvottuihin, koska nämä algoritmit toimivat merkitsemättömässä tietojoukossa.
- Valvomattomat algoritmit ovat parempia erilaisiin tehtäviin, koska merkitsemättömän tietojoukon saaminen on helpompaa kuin merkitty tietojoukko.
Haitat:
- Valvomattoman algoritmin tulos voi olla epätarkempi, koska tietojoukkoa ei ole merkitty eikä algoritmeja opeteta aiemman tarkan tulosteen perusteella.
- Ohjaamattoman oppimisen kanssa työskentely on vaikeampaa, koska se toimii nimeämättömän tietojoukon kanssa, joka ei kartoitu tulosteen kanssa.
Ohjaamattoman oppimisen sovellukset
3. Puoliohjattu oppiminen
Puoliohjattu oppiminen on eräänlainen koneoppimisalgoritmi, joka sijaitsee valvotun ja valvomattoman koneoppimisen välissä . Se edustaa välimaata valvottujen (merkityillä harjoitustiedoilla) ja valvomattomien oppimisalgoritmien (ilman merkittyjä harjoitustietoja) välillä ja käyttää merkittyjen ja merkitsemättömien tietojoukkojen yhdistelmää harjoitusjakson aikana.
A Vaikka puoliohjattu oppiminen on keskitie ohjatun ja ohjaamattoman oppimisen välillä ja toimii muutamista tunnisteista koostuvalla tiedolla, se koostuu enimmäkseen nimeämättömistä tiedoista. Koska tarrat ovat kalliita, mutta yritystarkoituksiin, niissä voi olla vähän tarroja. Se on täysin erilaista kuin ohjattu ja ohjaamaton oppiminen, koska ne perustuvat tarrojen olemassaoloon ja puuttumiseen.
Ohjatun oppimisen ja ohjaamattomien oppimisalgoritmien haittojen voittamiseksi otetaan käyttöön puoliohjatun oppimisen käsite . Puoliohjatun oppimisen päätavoite on hyödyntää tehokkaasti kaikkea saatavilla olevaa dataa, ei vain merkittyä dataa, kuten ohjatussa oppimisessa. Aluksi samankaltaiset tiedot ryhmitellään yhdessä valvomattoman oppimisalgoritmin kanssa, ja lisäksi se auttaa nimeämään merkitsemättömät tiedot merkityiksi tiedoiksi. Tämä johtuu siitä, että merkitty data on verrattain kalliimpi hankinta kuin merkitsemätön data.
Voimme kuvitella nämä algoritmit esimerkin avulla. Ohjattu oppiminen on sitä, että opiskelija on ohjaajan valvonnassa kotona ja yliopistossa. Lisäksi, jos kyseinen opiskelija itse analysoi samaa käsitettä ilman ohjaajan apua, se kuuluu ohjaamattoman oppimisen piiriin. Puoliohjatussa oppimisessa opiskelijan on tarkistettava itseään analysoituaan samaa käsitettä korkeakoulun ohjaajan johdolla.
Puoliohjatun oppimisen edut ja haitat
Edut:
- Algoritmi on yksinkertainen ja helppo ymmärtää.
- Se on erittäin tehokas.
- Sitä käytetään valvottujen ja valvomattomien oppimisalgoritmien haittojen ratkaisemiseen.
Haitat:
- Iteraatioiden tulokset eivät välttämättä ole vakaita.
- Emme voi soveltaa näitä algoritmeja verkkotason tietoihin.
- Tarkkuus on alhainen.
4. Vahvistusoppiminen
Vahvistusoppiminen toimii palautepohjaisessa prosessissa, jossa tekoälyagentti (ohjelmistokomponentti) tutkii automaattisesti ympäristöään lyömällä ja jäljittämällä, ryhtymällä toimiin, oppimalla kokemuksista ja parantamalla suorituskykyään. Agentti palkitaan jokaisesta hyvästä toiminnasta ja saa rangaistuksen jokaisesta huonosta toiminnasta; siksi vahvistavan oppimisagentin tavoitteena on maksimoida palkkiot.
Vahvistusoppimisessa ei ole merkittyä dataa, kuten ohjattua oppimista, ja agentit oppivat vain kokemuksistaan.
Vahvistusoppimisprosessi on samanlainen kuin ihminen; esimerkiksi lapsi oppii erilaisia asioita kokemusten kautta jokapäiväisessä elämässään. Vahvistusoppimisen esimerkkinä on pelata peliä, jossa Peli on ympäristö, agentin liikkeet kussakin vaiheessa määrittelevät tilat ja agentin tavoitteena on saada korkeat pisteet. Agentti saa palautetta rangaistuksista ja palkkioista.
Vahvistusoppimista hyödynnetään työskentelytapansa ansiosta eri aloilla, mm Peliteoria, toimintatutkimus, informaatioteoria, moniagenttijärjestelmät.
Vahvistusoppimisongelma voidaan formalisoida käyttämällä Markovin päätösprosessi (MDP). MDP:ssä agentti on jatkuvasti vuorovaikutuksessa ympäristön kanssa ja suorittaa toimia; jokaisessa toiminnassa ympäristö reagoi ja luo uuden tilan.
Vahvistusoppimisen luokat
Vahvistusoppiminen luokitellaan pääasiassa kahdentyyppisiin menetelmiin/algoritmiin:
mini työkalupalkki excel
Vahvistusoppimisen todelliset käyttötapaukset
RL-algoritmit ovat erittäin suosittuja pelisovelluksissa. Sitä käytetään saavuttamaan yli-inhimillistä suorituskykyä. Jotkut suositut pelit, jotka käyttävät RL-algoritmeja, ovat AlphaGO ja AlphaGO Zero .
Resurssien hallinta syvän vahvistusoppimisen avulla osoitti, että kuinka käyttää RL:ää tietokoneessa oppimaan automaattisesti ja ajoittamaan resurssit odottamaan erilaisia töitä, jotta keskimääräinen työn hidastuminen voidaan minimoida.
RL on laajalti käytössä robotiikkasovelluksissa. Robotteja käytetään teollisuudessa ja valmistuksessa, ja näitä robotteja tehdään tehokkaammiksi vahvistusoppimisen avulla. Eri toimialoilla on visio rakentaa älykkäitä robotteja tekoäly- ja koneoppimisteknologian avulla.
Tekstinlouhinta, yksi NLP:n hienoista sovelluksista, on nyt toteutettu Salesforce-yrityksen Reinforcement Learningin avulla.
Vahvistusoppimisen edut ja haitat
Edut
- Se auttaa ratkaisemaan monimutkaisia reaalimaailman ongelmia, joita on vaikea ratkaista yleisillä tekniikoilla.
- RL:n oppimismalli on samanlainen kuin ihmisten oppiminen; joten tarkimmat tulokset voidaan löytää.
- Auttaa saavuttamaan pitkän aikavälin tuloksia.
Epäkohta
- RL-algoritmeja ei suositella yksinkertaisiin ongelmiin.
- RL-algoritmit vaativat valtavasti dataa ja laskelmia.
- Liiallinen vahvistusoppiminen voi johtaa tilojen ylikuormitukseen, mikä voi heikentää tuloksia.
Ulottuvuuden kirous rajoittaa todellisten fyysisten järjestelmien vahvistamisoppimista.