Ohjattu oppiminen on koneoppimisen tyyppejä, joissa koneita koulutetaan hyvin 'merkityllä' harjoitusdatalla, jonka perusteella koneet ennustavat tulosten. Merkitty data tarkoittaa, että osa tulotiedoista on jo merkitty oikealla lähdöllä.
Ohjatussa oppimisessa koneille toimitettava koulutusdata toimii ohjaajana, joka opettaa koneita ennustamaan tulos oikein. Se soveltaa samaa käsitettä kuin opiskelija oppii opettajan ohjauksessa.
Valvottu oppiminen on prosessi, jossa koneoppimismalliin syötetään sekä oikeita lähtötietoja. Valvotun oppimisalgoritmin tavoitteena on etsi kartoitusfunktio yhdistämään tulomuuttuja(x) lähtömuuttujaan(y) .
Reaalimaailmassa ohjattua oppimista voidaan käyttää Riskinarviointi, kuvien luokittelu, petosten havaitseminen, roskapostin suodatus , jne.
Kuinka ohjattu oppiminen toimii?
Valvotussa oppimisessa malleja opetetaan käyttämällä merkittyä tietojoukkoa, jossa malli oppii kunkin tietotyypin. Kun koulutusprosessi on valmis, mallia testataan testidatan (harjoitusjoukon osajoukko) perusteella ja sen jälkeen se ennustaa tulosteen.
Ohjatun oppimisen toiminta on helppo ymmärtää alla olevan esimerkin ja kaavion avulla:
missä on kannettavan tietokoneen näppäimistön insert-näppäin
Oletetaan, että meillä on tietojoukko erityyppisiä muotoja, jotka sisältävät neliön, suorakulmion, kolmion ja monikulmion. Nyt ensimmäinen askel on, että meidän on koulutettava malli jokaiselle muodolle.
- Jos annetulla muodolla on neljä sivua ja kaikki sivut ovat yhtä suuret, se merkitään nimellä a Neliö .
- Jos annetulla muodolla on kolme sivua, se merkitään nimellä a kolmio .
- Jos annetulla muodolla on kuusi yhtä suurta puolta, se merkitään nimellä kuusikulmio .
Nyt treenin jälkeen testaamme malliamme testisarjan avulla ja mallin tehtävänä on tunnistaa muoto.
Kone on jo koulutettu kaikentyyppisiin muotoihin, ja kun se löytää uuden muodon, se luokittelee muodon useiden sivujen pohjalta ja ennustaa tuloksen.
Ohjatun oppimisen vaiheet:
- Määritä ensin harjoitustietojoukon tyyppi
- Kerää/kerää merkityt harjoitustiedot.
- Jaa harjoitustietojoukko harjoitukseksi tietojoukko, testitietojoukko ja validointitietojoukko .
- Määritä koulutustietojoukon syöttöominaisuudet, joilla pitäisi olla tarpeeksi tietoa, jotta malli voi ennustaa tulostuksen tarkasti.
- Määritä mallille sopiva algoritmi, kuten tukivektorikone, päätöspuu jne.
- Suorita algoritmi harjoitustietojoukossa. Joskus tarvitsemme vahvistusjoukkoja ohjausparametreiksi, jotka ovat harjoitustietojoukkojen osajoukko.
- Arvioi mallin tarkkuus antamalla testisarja. Jos malli ennustaa oikean tulosteen, se tarkoittaa, että mallimme on tarkka.
Valvottujen koneoppimisalgoritmien tyypit:
Ohjattu oppiminen voidaan jakaa edelleen kahdentyyppisiin ongelmiin:
1. Regressio
Regressioalgoritmeja käytetään, jos tulomuuttujan ja lähtömuuttujan välillä on suhde. Sitä käytetään jatkuvien muuttujien, kuten sääennusteiden, markkinatrendien jne. ennustamiseen. Alla on joitain suosittuja regressioalgoritmeja, jotka kuuluvat valvotun oppimisen piiriin:
- Lineaarinen regressio
- Regressiopuut
- Epälineaarinen regressio
- Bayesin lineaarinen regressio
- Polynomiregressio
2. Luokittelu
Luokittelualgoritmeja käytetään, kun tulosmuuttuja on kategorinen, mikä tarkoittaa, että on olemassa kaksi luokkaa, kuten kyllä-ei, mies-nainen, tosi-epätosi jne.
Roskapostin suodatus,
- Satunnainen metsä
- Päätöspuut
- Logistinen regressio
- Tuki vektorikoneet
Huomautus: Käsittelemme näitä algoritmeja yksityiskohtaisesti myöhemmissä luvuissa.
Ohjatun oppimisen edut:
- Ohjatun oppimisen avulla malli osaa ennustaa tuotoksen aikaisempien kokemusten perusteella.
- Ohjatussa oppimisessa saamme tarkan käsityksen esineluokista.
- Ohjattu oppimismalli auttaa meitä ratkaisemaan erilaisia reaalimaailman ongelmia, kuten petosten havaitseminen, roskapostin suodatus , jne.
Ohjatun oppimisen haitat:
- Ohjatut oppimismallit eivät sovellu monimutkaisten tehtävien hoitamiseen.
- Valvottu oppiminen ei voi ennustaa oikeaa tulosta, jos testidata poikkeaa harjoitustietojoukosta.
- Harjoittelu vaati paljon laskenta-aikoja.
- Ohjatussa oppimisessa tarvitsemme riittävästi tietoa objektiluokista.