logo

Valvomaton koneoppiminen

Edellisessä aiheessa opimme ohjattua koneoppimista, jossa malleja opetetaan tunnistetulla datalla opetusdatan valvonnassa. Mutta voi olla monia tapauksia, joissa meillä ei ole merkittyjä tietoja ja meidän on löydettävä piilotetut mallit annetusta tietojoukosta. Joten tällaisten tapausten ratkaisemiseksi koneoppimisessa tarvitsemme valvomattomia oppimistekniikoita.

Mitä on ohjaamaton oppiminen?

Kuten nimestä voi päätellä, valvomaton oppiminen on koneoppimistekniikkaa, jossa malleja ei valvota harjoitustietojoukon avulla. Sen sijaan mallit itse löytävät piilotetut kuviot ja oivallukset annetuista tiedoista. Sitä voidaan verrata oppimiseen, joka tapahtuu ihmisen aivoissa samalla kun oppii uusia asioita. Se voidaan määritellä seuraavasti:

grep komento linuxissa
Valvomaton oppiminen on koneoppimisen tyyppi, jossa malleja opetetaan käyttämällä nimeämätöntä tietojoukkoa, ja niiden annetaan toimia datan perusteella ilman valvontaa.

Ohjaamatonta oppimista ei voida suoraan soveltaa regressio- tai luokitteluongelmaan, koska toisin kuin ohjatussa oppimisessa, meillä on syöttötiedot, mutta ei vastaavaa lähtödataa. Ohjaamattoman oppimisen tavoitteena on etsi tietojoukon taustalla oleva rakenne, ryhmittele tiedot samankaltaisuuksien mukaan ja esitä tietojoukko pakatussa muodossa .

Esimerkki: Oletetaan, että valvomattomalle oppimisalgoritmille annetaan syöttötietojoukko, joka sisältää kuvia erityyppisistä kissoista ja koirista. Algoritmia ei koskaan opeteta annetun tietojoukon perusteella, mikä tarkoittaa, että sillä ei ole aavistustakaan tietojoukon ominaisuuksista. Valvomattoman oppimisalgoritmin tehtävänä on tunnistaa kuvan piirteet itsestään. Valvomaton oppimisalgoritmi suorittaa tämän tehtävän klusteroimalla kuvatietojoukon ryhmiin kuvien välisten yhtäläisyuksien mukaan.

Valvottu koneoppiminen

Miksi käyttää ohjaamatonta oppimista?

Alla on joitain tärkeimpiä syitä, jotka kuvaavat ohjaamattoman oppimisen merkitystä:

  • Ohjaamaton oppiminen auttaa löytämään hyödyllisiä oivalluksia tiedoista.
  • Ohjaamaton oppiminen on paljon samanlaista kuin ihminen oppii ajattelemaan omien kokemustensa perusteella, mikä tekee siitä lähempänä todellista tekoälyä.
  • Ohjaamaton oppiminen toimii merkitsemättömällä ja luokittelemattomalla datalla, mikä tekee ohjaamattomasta oppimisesta entistä tärkeämpää.
  • Reaalimaailmassa meillä ei aina ole syöttödataa vastaavalla lähdöllä, joten tällaisten tapausten ratkaisemiseksi tarvitsemme ohjaamatonta oppimista.

Ohjaamattoman oppimisen työskentely

Ohjaamattoman oppimisen toimiminen voidaan ymmärtää alla olevasta kaaviosta:

Valvottu koneoppiminen

Tässä olemme ottaneet merkitsemättömän tulodatan, mikä tarkoittaa, että sitä ei ole luokiteltu eikä vastaavia lähtöjä myöskään anneta. Nyt tämä merkitsemätön syöttödata syötetään koneoppimismalliin sen kouluttamiseksi. Ensinnäkin se tulkitsee raakadataa löytääkseen piilotetut kuviot tiedoista ja käyttää sitten sopivia algoritmeja, kuten k-keskiarvoklusterointia, päätöspuuta jne.

Kun se soveltaa sopivaa algoritmia, algoritmi jakaa dataobjektit ryhmiin objektien välisten yhtäläisyyksien ja erojen mukaan.

Valvomattomien oppimisalgoritmien tyypit:

Valvomaton oppimisalgoritmi voidaan edelleen luokitella kahdentyyppisiin ongelmiin:

Valvottu koneoppiminen
    Klusterointi: Klusterointi on tapa ryhmitellä objektit ryhmiin siten, että objektit, joilla on eniten samankaltaisuuksia, pysyvät ryhmään ja niillä on vähemmän tai ei ollenkaan yhtäläisyyksiä toisen ryhmän objektien kanssa. Klusterianalyysi etsii tietoobjektien väliset yhteneväisyydet ja luokittelee ne näiden yhteisten piirteiden esiintymisen ja puuttumisen mukaan.yhdistys: Assosiaatiosääntö on valvomaton oppimismenetelmä, jota käytetään suuren tietokannan muuttujien välisten suhteiden etsimiseen. Se määrittää joukon kohteita, jotka esiintyvät yhdessä tietojoukossa. Assosiaatiosääntö tekee markkinointistrategiasta tehokkaamman. Kuten ihmiset, jotka ostavat X-tuotteen (oletetaan leipää), ostavat myös Y-tuotteen (voi/hillo). Tyypillinen esimerkki assosiaatiosäännöstä on markkinakorianalyysi.

Huomautus: Opimme nämä algoritmit myöhemmissä luvuissa.

Valvomattomat oppimisalgoritmit:

Alla on luettelo suosituista valvomattomista oppimisalgoritmeista:

paras hentai
    K- tarkoittaa klusterointia KNN (k-lähimmät naapurit) Hierarkkinen klusterointi Anomalian havaitseminen Neuraaliverkot Periaatekomponenttianalyysi Itsenäinen komponenttianalyysi Apriori algoritmi Yksittäisen arvon hajoaminen

Ohjaamattoman oppimisen edut

  • Ohjaamatonta oppimista käytetään monimutkaisempiin tehtäviin verrattuna ohjattuun oppimiseen, koska ohjaamattomassa oppimisessa meillä ei ole merkittyjä syöttötietoja.
  • Ohjaamaton oppiminen on parempi, koska on helppo saada merkitsemätöntä dataa verrattuna merkittyyn dataan.

Valvomattoman oppimisen haitat

  • Ohjaamaton oppiminen on itsessään vaikeampaa kuin ohjattu oppiminen, koska sillä ei ole vastaavaa tulosta.
  • Valvomattoman oppimisalgoritmin tulos saattaa olla vähemmän tarkka, koska syöttödataa ei ole merkitty, eivätkä algoritmit tiedä tarkkaa lähtöä etukäteen.