logo

Ohjattua ja ohjaamatonta oppimista

Koneoppiminen on tietojenkäsittelytieteen ala, joka antaa tietokoneille kyvyn oppia ilman, että niitä on erikseen ohjelmoitu. Ohjattu oppiminen ja ohjaamaton oppiminen ovat kaksi päätyyppiä koneoppiminen .

Sisään ohjattua oppimista , kone on koulutettu käyttämään merkittyjä tietoja, mikä tarkoittaa, että syöttötiedot yhdistetään haluttuun lähtöön. Kone oppii sitten ennustamaan tulosteen uusille syöttötiedoille. Ohjattua oppimista käytetään usein tehtäviin, kuten luokitteluun, regressioon ja objektien havaitsemiseen.

Ohjaamattomassa oppimisessa kone on koulutettu joukolle merkitsemättömiä tietoja, mikä tarkoittaa, että syöttödataa ei ole yhdistetty haluttuun lähtöön. Kone oppii sitten löytämään tiedoista malleja ja suhteita. Ohjaamatonta oppimista käytetään usein tehtäviin, kuten klusterointi , mittasuhteiden vähentäminen ja poikkeamien havaitseminen.



Mitä on ohjattu oppiminen?

Ohjattu oppiminen on eräänlaista koneoppimisalgoritmi joka oppii merkityistä tiedoista. Merkitty data on tietoa, joka on merkitty oikealla vastauksella tai luokittelulla.

Ohjatussa oppimisessa, kuten nimikin kertoo, on ohjaajan läsnäolo opettajana. Ohjattu oppiminen on, kun opetamme tai koulutamme konetta käyttämällä hyvin merkittyjä tietoja. Tämä tarkoittaa, että osa tiedoista on jo merkitty oikealla vastauksella. Tämän jälkeen koneelle toimitetaan uusi joukko esimerkkejä (dataa), jotta valvottu oppimisalgoritmi analysoi opetusdatan (harjoitusesimerkkijoukon) ja tuottaa oikean tuloksen merkityistä tiedoista.

Esimerkiksi elefantin, kamelin ja lehmän kuvista koostuvassa tietojoukossa jokainen kuva on merkitty joko Elefantti tai Kamelilehmä.

Ohjattu oppiminen

Avainkohdat:

  • Ohjattu oppiminen tarkoittaa koneen kouluttamista merkittyjen tietojen perusteella.
  • Merkitty tieto koostuu esimerkeistä, joissa on oikea vastaus tai luokittelu.
  • Kone oppii syötteiden (hedelmäkuvat) ja tulosten (hedelmäetiketit) välisen suhteen.
  • Koulutettu kone voi sitten tehdä ennusteita uusista, merkitsemättömistä tiedoista.

Esimerkki:

Oletetaan, että sinulla on hedelmäkori, jonka haluat tunnistaa. Kone analysoi ensin kuvan saadakseen esiin ominaisuuksia, kuten sen muodon, värin ja tekstuurin. Sitten se vertaisi näitä ominaisuuksia niiden hedelmien ominaisuuksiin, joista se on jo oppinut. Jos uuden kuvan ominaisuudet muistuttavat eniten omenan ominaisuuksia, kone ennustaisi hedelmän olevan omena.

kuinka koulu keksittiin

Esimerkiksi Oletetaan, että sinulle annetaan kori, joka on täynnä erilaisia ​​hedelmiä. Nyt ensimmäinen askel on harjoitella konetta kaikilla eri hedelmillä yksitellen näin:

  • Jos esineen muoto on pyöristetty ja sen yläosassa on painauma, väriltään punainen, se merkitään seuraavasti: Omena .
  • Jos kohteen muoto on pitkä kaareva sylinteri, jonka väri on vihreä-keltainen, se merkitään - Banaani .

Oletetaan nyt tietojen harjoittamisen jälkeen, että olet antanut uuden erillisen hedelmän, sano banaani korista, ja pyytänyt tunnistamaan sen.

Koska kone on jo oppinut asiat aikaisemmista tiedoista ja tällä kertaa on käytettävä sitä viisaasti. Se luokittelee ensin hedelmät muodon ja värin perusteella ja vahvistaisi hedelmän nimeksi BANANA ja asettaisi sen banaaniluokkaan. Näin kone oppii asiat harjoitustiedoista (hedelmiä sisältävä kori) ja sitten soveltaa tietoa testitietoihin (uusi hedelmä).

Ohjatun oppimisen tyypit

Ohjattu oppiminen luokitellaan kahteen algoritmiluokkaan:

  • Regressio : Regressioongelma on, kun tulosmuuttuja on todellinen arvo, kuten dollari tai paino.
  • Luokittelu : Luokitteluongelma on, kun tulosmuuttuja on luokka, kuten punainen tai sininen , sairaus tai ei sairautta.

Ohjattu oppiminen käsittelee merkittyä dataa tai oppii niillä. Tämä tarkoittaa, että osa tiedoista on jo merkitty oikealla vastauksella.

1- Regressio

Regressio on eräänlainen ohjattu oppiminen, jota käytetään ennustamaan jatkuvia arvoja, kuten asuntojen hintoja, osakekursseja tai asiakkaiden vaihtuvuutta. Regressioalgoritmit oppivat funktion, joka kartoittaa syöteominaisuuksista lähtöarvoon.

awt java

Jotkut yleiset regressioalgoritmit sisältää:

  • Lineaarinen regressio
  • Polynomiregressio
  • Tuki Vector Machine Regression
  • Päätöspuun regressio
  • Satunnainen metsäregressio

2- Luokittelu

Luokittelu on ohjattua oppimista, jota käytetään ennustamaan kategorisia arvoja, kuten onko asiakas vaihtuva vai ei, onko sähköposti roskapostia vai onko lääketieteellisessä kuvassa kasvain vai ei. Luokittelualgoritmit oppivat funktion, joka kartoittaa syöteominaisuuksista tulosluokkien todennäköisyysjakauman.

Jotkut yleiset luokittelualgoritmit sisältää:

  • Logistinen regressio
  • Tuki Vector-koneita
  • Päätöspuut
  • Satunnaiset metsät
  • Naiivi Baye

Valvottujen oppimismallien arviointi

Valvottujen oppimismallien arviointi on tärkeä askel sen varmistamisessa, että malli on tarkka ja yleistettävissä. On olemassa useita erilaisia mittareita joita voidaan käyttää ohjattujen oppimismallien arvioimiseen, mutta joitain yleisimmistä malleista ovat:

Regressiota varten

  • Keskimääräinen neliövirhe (MSE): MSE mittaa ennustettujen arvojen ja todellisten arvojen keskimääräistä neliöeroa. Pienemmät MSE-arvot osoittavat parempaa mallin suorituskykyä.
  • Root Mean Squared Error (RMSE): RMSE on MSE:n neliöjuuri, joka edustaa ennustevirheiden keskihajontaa. MSE:n tapaan alhaisemmat RMSE-arvot osoittavat parempaa mallin suorituskykyä.
  • Keskimääräinen absoluuttinen virhe (MAE): MAE mittaa keskimääräistä absoluuttista eroa ennustettujen arvojen ja todellisten arvojen välillä. Se on vähemmän herkkä poikkeaville arvoille verrattuna MSE:hen tai RMSE:hen.
  • R-neliö (määrityskerroin): R-neliö mittaa mallin selittämän kohdemuuttujan varianssin osuutta. Suuremmat R-neliön arvot osoittavat parempaa mallin sopivuutta.

Luokittelua varten

  • Tarkkuus: Tarkkuus on prosenttiosuus ennusteista, jotka malli tekee oikein. Se lasketaan jakamalla oikeiden ennusteiden määrä ennusteiden kokonaismäärällä.
  • Tarkkuus: Tarkkuus on mallin tekemien positiivisten ennusteiden prosenttiosuus, jotka ovat todella oikeita. Se lasketaan jakamalla todellisten positiivisten määrä positiivisten ennusteiden kokonaismäärällä.
  • Palauttaa mieleen: Recall on prosenttiosuus kaikista positiivisista esimerkeistä, jotka malli tunnistaa oikein. Se lasketaan jakamalla todellisten positiivisten määrä positiivisten esimerkkien kokonaismäärällä.
  • F1-pisteet: F1-pisteet ovat tarkkuuden ja muistamisen painotettu keskiarvo. Se lasketaan ottamalla tarkkuuden ja muistin harmoninen keskiarvo.
  • Hämmennysmatriisi: Sekaannusmatriisi on taulukko, joka näyttää kunkin luokan ennusteiden lukumäärän sekä todelliset luokkatunnisteet. Sen avulla voidaan visualisoida mallin suorituskykyä ja tunnistaa alueita, joilla mallilla on vaikeuksia.

Ohjatun oppimisen sovellukset

Ohjattua oppimista voidaan käyttää monenlaisten ongelmien ratkaisemiseen, mukaan lukien:

  • Roskapostin suodatus: Valvottuja oppimisalgoritmeja voidaan kouluttaa tunnistamaan ja luokittelemaan roskapostit niiden sisällön perusteella, mikä auttaa käyttäjiä välttämään ei-toivotut viestit.
  • Kuvan luokitus: Valvottu oppiminen voi automaattisesti luokitella kuvat eri luokkiin, kuten eläimiin, esineisiin tai kohtauksiin, mikä helpottaa tehtäviä, kuten kuvahakua, sisällön valvontaa ja kuvapohjaisia ​​tuotesuosituksia.
  • Lääketieteellinen diagnoosi: Valvottu oppiminen voi auttaa lääketieteellisessä diagnoosissa analysoimalla potilastietoja, kuten lääketieteellisiä kuvia, testituloksia ja potilashistoriaa, tunnistaakseen kuvioita, jotka viittaavat tiettyihin sairauksiin tai tiloihin.
  • Petoksen havaitseminen: Valvotut oppimismallit voivat analysoida rahoitustapahtumia ja tunnistaa malleja, jotka viittaavat vilpilliseen toimintaan, mikä auttaa rahoituslaitoksia estämään petoksia ja suojelemaan asiakkaitaan.
  • Luonnollisen kielen käsittely (NLP): Ohjatulla oppimisella on keskeinen rooli NLP-tehtävissä, mukaan lukien tunteiden analysointi, konekäännös ja tekstin yhteenveto, minkä ansiosta koneet voivat ymmärtää ja käsitellä ihmisten kieltä tehokkaasti.

Ohjatun oppimisen edut

  • Ohjattu oppiminen mahdollistaa tiedon keräämisen ja tuottaa dataa aikaisemmista kokemuksista.
  • Auttaa optimoimaan suorituskykykriteerit kokemuksen avulla.
  • Valvottu koneoppiminen auttaa ratkaisemaan erilaisia ​​tosielämän laskentaongelmia.
  • Se suorittaa luokittelu- ja regressiotehtäviä.
  • Sen avulla tulos voidaan arvioida tai kartoittaa uuteen otokseen.
  • Meillä on täydellinen hallinta siihen, kuinka monta luokkaa valitsemme harjoitustietoihin.

Ohjatun oppimisen haitat

  • Big datan luokittelu voi olla haastavaa.
  • Ohjatun oppimisen koulutus vaatii paljon laskenta-aikaa. Joten se vaatii paljon aikaa.
  • Ohjattu oppiminen ei pysty käsittelemään kaikkia koneoppimisen monimutkaisia ​​tehtäviä.
  • Laskenta-aika on valtava ohjattuun oppimiseen.
  • Se vaatii merkityn tietojoukon.
  • Se vaatii koulutusprosessin.

Mitä on ohjaamaton oppiminen?

Valvomaton oppiminen on eräänlainen koneoppiminen, joka oppii merkitsemättömästä tiedosta. Tämä tarkoittaa, että tiedoilla ei ole olemassa olevia tunnisteita tai luokkia. Ohjaamattoman oppimisen tavoitteena on löytää tiedosta malleja ja suhteita ilman erityistä ohjausta.

Ohjaamaton oppiminen on koneen harjoittelua, jossa käytetään tietoa, jota ei ole luokiteltu tai merkitty ja jonka avulla algoritmi voi toimia näiden tietojen perusteella ilman ohjausta. Tässä koneen tehtävänä on ryhmitellä lajittelematonta tietoa yhtäläisyyksien, kaavojen ja erojen mukaan ilman tietojen ennakkokoulutusta.

Toisin kuin ohjattu oppiminen, opettajaa ei ole tarjolla, mikä tarkoittaa, että konetta ei kouluteta. Siksi kone on rajoitettu löytämään piilotetun rakenteen nimeämättömästä tiedosta itsestään.

Ohjaamattoman oppimisen avulla voit tarkastella kerättyä eläintietoa ja erottaa useita ryhmiä eläinten ominaisuuksien ja toiminnan mukaan. Nämä ryhmittelyt saattavat vastata eri eläinlajeja, jolloin voit luokitella olennot riippumatta jo olemassa olevista merkinnöistä.

Ohjaamatonta oppimista

Avainkohdat

mvc kevätrungossa
  • Valvomattoman oppimisen avulla malli voi löytää kuvioita ja suhteita merkitsemättömästä tiedosta.
  • Klusterialgoritmit ryhmittelevät samanlaiset datapisteet yhteen niiden luontaisten ominaisuuksien perusteella.
  • Ominaisuuksien poimiminen kerää tiedoista olennaisen tiedon, jolloin malli voi tehdä merkityksellisiä eroja.
  • Label-assosiaatio määrittää ryhmille luokkia poimittujen kuvioiden ja ominaisuuksien perusteella.

Esimerkki

Kuvittele, että sinulla on koneoppimismalli, joka on koulutettu suureen tietojoukkoon merkitsemättömistä kuvista, jotka sisältävät sekä koiria että kissoja. Malli ei ole koskaan nähnyt kuvaa koirasta tai kissasta, eikä sillä ole valmiita merkintöjä tai luokkia näille eläimille. Sinun tehtäväsi on käyttää ohjaamatonta oppimista tunnistaaksesi koirat ja kissat uudesta, näkemättömästä kuvasta.

Esimerkiksi Oletetaan, että sille annetaan kuva, jossa on sekä koiria että kissoja, joita se ei ole koskaan nähnyt.

Näin ollen koneella ei ole aavistustakaan koirien ja kissojen ominaisuuksista, joten emme voi luokitella sitä 'koiriksi ja kissoiksi'. Mutta se voi luokitella ne samankaltaisuuksien, kuvioiden ja erojen mukaan, eli voimme helposti luokitella yllä olevan kuvan kahteen osaan. Ensimmäinen saattaa sisältää kaikki kuvat koirat niissä ja toinen osa saattaa sisältää kaikki kuvat, joilla on kissat heissä. Täällä et ole oppinut mitään aiemmin, mikä tarkoittaa, ettei harjoitustietoja tai esimerkkejä ole.

Sen avulla malli voi toimia itsenäisesti löytääkseen kuvioita ja tietoja, joita ei aiemmin havaittu. Se käsittelee pääasiassa merkitsemättömiä tietoja.

Ohjaamattoman oppimisen tyypit

Ohjaamaton oppiminen luokitellaan kahteen algoritmiluokkaan:

  • Klusterointi : Klusteriongelma on silloin, kun haluat löytää tiedoista luontaiset ryhmittelyt, kuten asiakkaiden ryhmittelyn ostokäyttäytymisen mukaan.
  • yhdistys : Yhdistelmäsäännön oppimisongelmassa haluat löytää sääntöjä, jotka kuvaavat suurta osaa tiedoistasi, kuten ihmiset, jotka ostavat X:n, ostavat yleensä myös Y:tä.

Klusterointi

Klusteri on eräänlainen valvomaton oppiminen, jota käytetään ryhmittelemään samanlaisia ​​datapisteitä yhteen. Klusterointialgoritmit työskennellä siirtämällä tietopisteitä iteratiivisesti lähemmäs niiden klusterikeskuksia ja kauemmas muiden klustereiden datapisteistä.

  1. Yksinomainen (osiointi)
  2. Agglomeroituva
  3. Päällekkäinen
  4. Todennäköisyys

Klusterityypit: -

  1. Hierarkkinen klusterointi
  2. K- tarkoittaa klusterointia
  3. Pääkomponenttianalyysi
  4. Singular Value Decomposition
  5. Itsenäinen komponenttianalyysi
  6. Gaussin sekoitusmallit (GMM)
  7. Density-Based Spatial Clustering of Applications with Noise (DBSCAN)

Yhdistyksen sääntöjen oppiminen

Assosiaatiosäännön oppiminen on valvomatonta oppimista, jota käytetään tietojen mallien tunnistamiseen. Yhdistyksen sääntö oppimisalgoritmit toimivat etsimällä suhteita tietojoukon eri kohteiden välillä.

Joitakin yleisiä assosiaatiosäännön oppimisalgoritmeja ovat:

  • Apriori algoritmi
  • Eclat-algoritmi
  • FP-kasvualgoritmi

Ei-ohjattujen oppimismallien arviointi

Ei-ohjattujen oppimismallien arviointi on tärkeä askel sen varmistamisessa, että malli on tehokas ja hyödyllinen. Se voi kuitenkin olla haastavampaa kuin valvottujen oppimismallien arvioiminen, koska mallin ennusteiden vertailuun ei ole olemassa perustotuusdataa.

On olemassa useita erilaisia ​​mittareita, joita voidaan käyttää ei-ohjattujen oppimismallien arvioimiseen, mutta joitain yleisimpiä niistä ovat:

  • Siluettipisteet: Siluettipistemäärä mittaa, kuinka hyvin kukin datapiste on klusteroitu omilla klusterijäsenillään ja erotettu muista klustereista. Se vaihtelee -1:stä 1:een, ja korkeammat pisteet osoittavat parempaa klusterointia.
  • Calinski-Harabasz tulos: Calinski-Harabasz-pistemäärä mittaa klusterien välisen varianssin ja klustereiden sisäisen varianssin välistä suhdetta. Se vaihtelee nollasta äärettömään, ja korkeammat pisteet osoittavat parempaa klusterointia.
  • Muokattu Rand-indeksi: Oikaistu Rand-indeksi mittaa kahden klusterin samankaltaisuutta. Se vaihtelee -1:stä 1:een, ja korkeammat pisteet osoittavat samankaltaisempia ryhmittymiä.
  • Davies-Bouldinin indeksi: Davies-Bouldin-indeksi mittaa keskimääräistä samankaltaisuutta klusterien välillä. Se vaihtelee nollasta äärettömään, ja alhaisemmat pisteet osoittavat parempaa klusterointia.
  • F1-pisteet: F1-pisteet ovat tarkkuuden ja muistamisen painotettu keskiarvo, jotka ovat kaksi mittaria, joita käytetään yleisesti ohjatussa oppimisessa luokittelumallien arvioinnissa. F1-pisteitä voidaan kuitenkin käyttää myös ei-ohjattujen oppimismallien, kuten klusterointimallien, arvioimiseen.

Sovellus ohjaamattomasta oppimisesta

Ohjaamatonta oppimista voidaan käyttää monenlaisten ongelmien ratkaisemiseen, mukaan lukien:

  • Poikkeamien havaitseminen: Valvomaton oppiminen voi tunnistaa tiedosta epätavallisia malleja tai poikkeamia normaalista käyttäytymisestä, mikä mahdollistaa petosten, tunkeutumisen tai järjestelmähäiriöiden havaitsemisen.
  • Tieteellinen löytö: Ohjaamaton oppiminen voi paljastaa piilotettuja suhteita ja malleja tieteellisestä tiedosta, mikä johtaa uusiin hypoteeseihin ja oivalluksiin eri tieteenaloilla.
  • Suositusjärjestelmät: Valvomaton oppiminen voi tunnistaa malleja ja yhtäläisyyksiä käyttäjien käyttäytymisessä ja mieltymyksissä ja suositella tuotteita, elokuvia tai musiikkia, jotka vastaavat heidän kiinnostuksen kohteitaan.
  • Asiakkaiden segmentointi: Ohjaamattoman oppimisen avulla voidaan tunnistaa asiakasryhmiä, joilla on samanlaiset ominaisuudet, jolloin yritykset voivat kohdistaa markkinointikampanjoita ja parantaa asiakaspalvelua tehokkaammin.
  • Kuva-analyysi: Ohjaamaton oppiminen voi ryhmitellä kuvat niiden sisällön perusteella, mikä helpottaa tehtäviä, kuten kuvien luokittelua, esineiden havaitsemista ja kuvien hakua.

Edut ohjaamattomasta oppimisesta

  • Se ei vaadi koulutustietojen merkitsemistä.
  • Mittasuhteiden vähentäminen voidaan suorittaa helposti käyttämällä ohjaamatonta oppimista.
  • Pystyy löytämään tiedosta aiemmin tuntemattomia kuvioita.
  • Valvomaton oppiminen voi auttaa sinua saamaan oivalluksia merkitsemättömästä tiedosta, jota et ehkä muuten olisi voinut saada.
  • Ohjaamaton oppiminen on hyvä tapa löytää tiedosta malleja ja suhteita ilman, että hänelle kerrotaan, mitä etsiä. Tämä voi auttaa sinua oppimaan uusia asioita tiedoistasi.

Haitat ohjaamattomasta oppimisesta

  • Tarkkuutta tai tehokkuutta on vaikea mitata, koska koulutuksen aikana ei saatu valmiita vastauksia.
  • Tulokset ovat usein vähemmän tarkkoja.
  • Käyttäjän täytyy käyttää aikaa tulkitsemaan ja merkitsemään luokkia, jotka seuraavat tätä luokittelua.
  • Valvomaton oppiminen voi olla herkkä datan laadulle, mukaan lukien puuttuvat arvot, poikkeavuudet ja kohinaiset tiedot.
  • Ilman merkittyä dataa voi olla vaikeaa arvioida ohjaamattomien oppimismallien suorituskykyä, mikä tekee niiden tehokkuuden arvioinnista haastavaa.

Valvottu vs. valvomaton koneoppiminen

Parametrit Valvottua koneoppimista Valvomaton koneoppiminen
Syöttötiedot Algoritmit opetetaan käyttämällä merkittyjä tietoja. Algoritmeja käytetään sellaisia ​​tietoja vastaan, joita ei ole merkitty
Laskennallinen monimutkaisuus Yksinkertaisempi menetelmä Laskennallisesti monimutkainen
Tarkkuus Erittäin tarkka Vähemmän tarkkaa
Luokkien lukumäärä Luokkien lukumäärä on tiedossa Luokkien lukumäärää ei tiedetä
Tietojen analysointi Käyttää offline-analyysiä Käyttää reaaliaikaista tietojen analysointia
Käytetyt algoritmit

Lineaarinen ja logistinen regressio, satunnainen metsä, moniluokkainen luokitus, päätöspuu, tukivektorikone, hermoverkko jne.

osavaltiot Yhdysvalloissa

K-Means-klusterointi, hierarkkinen klusterointi, KNN, Apriori-algoritmi jne.

Lähtö Haluttu tulos annetaan. Haluttua tulosta ei anneta.
Harjoittelutiedot Käytä harjoitustietoja mallin päättelemiseen. Harjoittelutietoja ei käytetä.
Monimutkainen malli Ei ole mahdollista oppia suurempia ja monimutkaisempia malleja kuin ohjatulla oppimisella. On mahdollista oppia suurempia ja monimutkaisempia malleja ohjaamattomalla oppimisella.
Malli Voimme testata malliamme. Emme voi testata malliamme.
Kutsutaan nimellä Ohjattua oppimista kutsutaan myös luokitukseksi. Ohjaamatonta oppimista kutsutaan myös klusteriksi.
Esimerkki Esimerkki: Optinen merkintunnistus. Esimerkki: Etsi kuvasta kasvot.

Valvonta

java-merkkijonon muunnos int:ksi

ohjattu oppiminen tarvitsee ohjausta mallin kouluttamiseksi.

Ohjaamaton oppiminen ei vaadi ohjausta mallin kouluttamiseen.

Johtopäätös

Ohjattu ja ohjaamaton oppiminen ovat kaksi tehokasta työkalua, joita voidaan käyttää monenlaisten ongelmien ratkaisemiseen. Ohjattu oppiminen sopii hyvin tehtäviin, joissa haluttu tulos on tiedossa, kun taas ohjaamaton oppiminen sopii tehtäviin, joissa haluttua tuottoa ei tunneta.

Usein kysytyt kysymykset (FAQ)

1. Mitä eroa on valvotulla ja valvomattomalla konekielellä?

Ohjattu ja ohjaamaton oppiminen ovat kaksi peruslähestymistapaa koneoppimiseen, jotka eroavat koulutustiedoistaan ​​ja oppimistavoitteistaan.

  • Ohjattu oppiminen sisältää koneoppimismallin opetuksen nimetylle tietojoukolle, jossa jokaisella datapisteellä on vastaava etiketti tai lähtöarvo. Algoritmi oppii yhdistämään syöttötiedot haluttuun lähtöön, jolloin se voi tehdä ennusteita uudesta, näkemättömästä datasta.
  • Ohjaamaton oppiminen , toisaalta käsittelee merkitsemättömiä tietojoukkoja, joissa tietopisteillä ei ole liitettyjä tunnisteita tai lähtöarvoja.

2. Mitä on ohjattu oppiminen?

Valvottu oppiminen on koneoppimisen tyyppi, jossa algoritmi opetetaan tunnistetulla tietojoukolla, jossa jokaisella datapisteellä on vastaava nimiö tai tulosarvo. Algoritmi oppii yhdistämään syöttötiedot haluttuun lähtöön, jolloin se voi tehdä ennusteita uudesta, näkemättömästä datasta.

3. Mitkä ovat yleiset valvotut oppimisalgoritmit?

Yleisiä valvottuja oppimisalgoritmeja ovat:

  • Luokittelu: Käytetään luokkien määrittämiseen tietopisteille. Esimerkkejä ovat tukivektorikoneet (SVM:t), logistinen regressio ja päätöspuut.
  • Regressio: Käytetään jatkuvien numeeristen arvojen ennustamiseen. Esimerkkejä ovat lineaarinen regressio, polynomiregressio ja harjaregressio.

4. Mitkä ovat yleiset valvomattomat oppimisalgoritmit?

Yleisiä valvomattomia oppimisalgoritmeja ovat:

  • Klusterointi: Datapisteiden ryhmittely klustereihin niiden samankaltaisuuden perusteella. Esimerkkejä ovat k-keskiarvoklusterointi ja hierarkkinen klusterointi.
  • Mittasuhteiden vähentäminen: Tietojoukon ominaisuuksien määrän vähentäminen säilyttäen samalla tärkeimmät tiedot. Esimerkkejä ovat pääkomponenttianalyysi (PCA) ja autoenkooderit.

5. Mitä on ohjaamaton oppiminen?

Valvomaton oppiminen on koneoppimisen tyyppi, jossa algoritmi opetetaan merkitsemättömälle tietojoukolle, jossa tietopisteillä ei ole vastaavia tunnisteita tai lähtöarvoja. Algoritmi oppii tunnistamaan datassa olevia malleja ja rakenteita ilman erityistä ohjausta.

6. Milloin käyttää ohjattua oppimista vs. ohjaamatonta oppimista?

Käytä ohjattua oppimista, kun sinulla on tunnistettu tietojoukko ja haluat tehdä ennusteita uusille tiedoille. Käytä ohjaamatonta oppimista, kun sinulla on nimeämätön tietojoukko ja haluat tunnistaa datassa olevia malleja tai rakenteita.