logo

Koneoppimisalgoritmit

Koneoppimisalgoritmit ovat laskennallisia malleja, joiden avulla tietokoneet voivat ymmärtää kuvioita ja ennustaa tai tehdä päätöksiä tietojen perusteella ilman erityistä ohjelmointia. Nämä algoritmit muodostavat modernin tekoälyn perustan, ja niitä käytetään monenlaisissa sovelluksissa, kuten kuvan- ja puheentunnistuksessa, luonnollisen kielen käsittelyssä, suositusjärjestelmissä, petosten havaitsemisessa, autonomisissa autoissa jne.

gimp kuinka valinta poistetaan

Tämä Koneoppimisalgoritmit artikkeli kattaa kaikki koneoppimisen olennaiset algoritmit, kuten Tukivektorikone, päätöksenteko, logistinen regressio, naiivi bayees-luokitin, satunnainen metsä, k-keskiarvoklusterointi, vahvistusoppiminen, vektori, hierarkkinen klusterointi, xgboost, adaboost, logistiikka jne.



Koneoppimisalgoritmien tyypit

Koneoppimisalgoritmeja on kolmenlaisia.

  1. Ohjattu oppiminen
    • Regressio
    • Luokittelu
  2. Ohjaamaton oppiminen
  3. Vahvistusoppiminen

Koneoppimisalgoritmien tyypit

1. Valvottu oppimisalgoritmi

Ohjattu oppiminen on eräänlainen koneoppimisalgoritmi, jossa käytimme merkittyä tietojoukkoa mallin tai algoritmien kouluttamiseen. Algoritmin tavoitteena on oppia kartoitus syöttötiedoista tulosnimikkeisiin, jolloin se voi tehdä ennusteita tai luokituksia uusille, näkymättömille tiedoille.

Valvotut koneoppimisalgoritmit

  1. Lineaarinen malli:
    • Regressio
      • Tavallinen pienimmän neliösumman regressio
      • Yksinkertainen lineaarinen regressio
      • Useita lineaarisia regressioita
      • Polynomiregressio
      • Orthogonal Matching Pursuit (OMP)
      • Bayesin regressio
      • Kvantiili regressio
      • Isotoninen regressio
      • Vaiheittainen regressio
      • Pienimmän kulman regressio (LARS)
    • Luokittelu:
    • Laillistaminen :
      • Lasso (L1-regulointi)
      • Ridge (L2-regulointi)
        • Ridge-regressio
        • Ridge luokitin
      • Elastinen verkko
      • LARS Lasso
  2. K-Lähimmät naapurit (KNN):
    • Brute Force -algoritmit
    • Pallopuu- ja KD-puualgoritmit
    • K-Lähimpien naapurien (KNN) luokitin
    • K-Lähimpien naapurien (KNN) regressori
  3. Tuki vektorikoneille:
    • Tuki Vector Machines Regressor
    • Eri ydintoimintoja SVM:ssä
  4. Stokastinen gradienttilasku
    • Stokastinen gradienttilaskuluokitus
    • Stokastinen gradientin laskeutumisregressori
    • Erilaiset häviötoiminnot SGD:ssä
  5. Päätöspuu:
    • Päätöspuun algoritmit
      • Iteratiiviset Dichotomiser 3 (ID3) -algoritmit
      • C5. Algoritmit
      • Luokittelu- ja regressiopuun algoritmit
    • Päätöspuun luokitin
    • Päätöspuun regressori
  6. Yhtye-oppiminen:
    • Säkitys (Bootstrap Aggregating)
    • Tehostaa
      • AdaBoost
      • XGBoost
      • CatBoost
      • Gradient Boosting Machines (GBM)
      • LightGBM
    • Pinoaminen
  7. Generatiivinen malli
    • Naiivi Bayes
      • Gaussin naiivi Bayes
      • Multinomi Naive Bayes
      • Bernoulli Naive Bayes
    • Gaussin prosessit
      • Gaussin prosessin regressio (GPR)
      • Gaussin prosessiluokitus (GPC)
    • Gaussin erotteluanalyysi
      • Lineaarinen erotteluanalyysi (LDA)
      • Quadratic Discriminant Analysis (QDA)
    • Bayesian uskomusverkostot
    • Piilotetut Markov-mallit (HMM)
  8. Aikasarjaennuste:
    • Aikasarjan visualisointi ja analyysi:
      • Aikasarjan osat: trendi, kausiluonteisuus ja melu
      • Aikasarjan hajottelutekniikat
      • Kausivaihtelut ja erot
      • Autokorrelaatio ja osittaiset autokorrelaatiofunktiot
      • Lisätty Dickey-Fuller-testi
      • Aikasarjojen kausihajottelu (STL-hajotelma)
      • Box-Jenkins-metodologia ARIMA-malleille
    • Aikasarjan ennustusalgoritmit:
      • Liukuva keskiarvo (MA) ja painotettu liukuva keskiarvo
      • Eksponentiaaliset tasoitusmenetelmät (yksinkertainen, kaksinkertainen ja kolminkertainen)
      • Autoregressiiviset (AR) mallit
      • Liukuvan keskiarvon (MA) mallit
      • Autoregressiiviset integroidut liukuvat keskiarvomallit (ARIMA).
      • Aikasarjojen kausihajottelu lössin mukaan (STL)
      • Seasonal Autoregressive Integrated Moving Average (SARIMA) -mallit
      • ARIMAX ja SARIMAX mallit
  9. Valvottu ulottuvuuden vähentämistekniikka:
    • Lineaarinen erotteluanalyysi (LDA)

Joitakin valvotuista koneoppimisalgoritmeista voidaan käyttää sekä luokitteluun että regressioon pienellä muokkauksella

  • Moniluokkaiset ja monitulostusalgoritmit:
    • Moniluokkainen luokitus
      • OneVsRest-luokitus
    • Multilabel-luokitus
    • Multioutput Regression

Luokittelu- ja regressioalgoritmien mittarit:

  • Regressiomittarit:
    • Keskimääräinen neliövirhe (MSE)
    • Keskimääräinen neliövirhe (RMSE)
    • Keskimääräinen absoluuttinen virhe (MAE)
    • R-neliö
    • Säädetty R-neliö
  • Luokittelumittarit:
  • Todennäköisyyskalibrointi
    • Kalibrointikäyrät
    • Luokittelijan kalibrointi

Ristivahvistustekniikka:

  • K-kertainen ristiinvalidointi
  • Stratified k-fold ristiinvalidointi
  • Jätä yksi pois ristiinvahvistus
  • Shuffle Split Cross Validation
  • Aikasarjan ristiinvalidointi

Optimointitekniikka:

  • Gradientti laskeutuminen
    • Stokastinen gradienttilasku
    • Mini-erä Gradient Descent
    • Momentumiin perustuva gradienttilasku
  • Newton-pohjaiset optimointitekniikat
    • Newtonin algoritmi
    • Kvasi-Newton-menetelmät (BFGS, L-BFGS)
    • Konjugaattigradientti
  • Paikallisen haun optimointitekniikat
    • Vuorikiipeily
    • Tabu-haku

2. Valvomaton oppimisalgoritmi

Ohjaamaton oppiminen on eräänlainen koneoppimisalgoritmi, jossa algoritmeja käytetään etsimään kuvioita, rakennetta tai suhdetta tietojoukossa käyttämällä luokittelematonta tietojoukkoa. Se tutkii tietojen luontaista rakennetta ilman ennalta määritettyjä luokkia tai tunnisteita.

Valvomattomat koneoppimisalgoritmit

  • Klusterointi
    • Centroid-pohjaiset menetelmät
    • Jakeluperusteiset menetelmät
    • Yhteyspohjaiset menetelmät
      • Hierarkkinen klusterointi
        • Agglomeratiivinen klusterointi
        • Divisoiva klusterointi
      • Affiniteetin leviäminen
    • Tiheyteen perustuvat menetelmät
      • DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
      • OPTIIKA (järjestyspisteet klusterointirakenteen tunnistamiseksi)
  • Association Rule Mining
    • Apriori algoritmi
    • FP-Growth (Frequent Pattern-Growth)
    • ECLAT (ekvivalenssiluokkien klusterointi ja alhaalta ylöspäin suuntautuva hilaläpikulku)
  • Anomalian tunnistus:
    • Z-pisteet
    • Local Outlier Factor (LOF)
    • Eristysmetsä
  • Mittasuhteiden vähentämistekniikka:
    • Pääkomponenttianalyysi (PCA)
    • t-hajautettu stokastinen naapurin upottaminen (t-SNE)
    • Ei-negatiivinen matriisifaktorointi (NMF)
    • Itsenäinen komponenttianalyysi (ICA)
    • Tekijäanalyysi
    • Piilevä Dirichlet-allokaatio (LDA)
    • Isomap
    • Paikallisesti lineaarinen upottaminen (LLE)
    • Piilevä semanttinen analyysi (LSA)

3. Vahvistusoppiminen

Vahvistusoppiminen on eräänlainen koneoppimisalgoritmi, jossa agentti oppii tekemään peräkkäisiä päätöksiä vuorovaikutuksessa ympäristönsä kanssa. Agentti saa palautteen toimintaansa perustuvina kannustimina tai rangaistuksina. Agentin tarkoituksena on löytää optimaalinen taktiikka, joka maksimoi kumulatiiviset palkkiot ajan mittaan yrityksen ja erehdyksen avulla. Vahvistusoppimista käytetään usein skenaarioissa, joissa agentin on opittava navigoimaan ympäristössä, pelaamaan pelejä, hallitsemaan robotteja tai tekemään tuomioita epävarmoissa tilanteissa.

Vahvistusoppiminen

  • Mallipohjaiset menetelmät:
    • Markovin päätösprosessit (MDP)
    • Bellmanin yhtälö
    • Arvoiterointialgoritmi
    • Monte Carlon puuhaku
  • Mallivapaat menetelmät:
    • Arvopohjaiset menetelmät:
      • Q-oppiminen
      • KASTIKE
      • Monte Carlon menetelmät
    • Käytäntöön perustuvat menetelmät:
      • REINFORCE Algoritmi
      • Näyttelijä-kriitikko-algoritmi
    • Näyttelijäkritiikin menetelmät
      • Asynchronous Advantage Actor-Critic (A3C)

Luettelo suosituista koneoppimisalgoritmeista

Tässä on luettelo 10 suosituimmasta koneoppimisalgoritmista.

1. Lineaarinen regressio

Lineaarinen regressio on yksinkertainen algoritmi, jota käytetään kartoittaa syöteominaisuuksien ja jatkuvan kohdemuuttujan välinen lineaarinen suhde. Se toimii sovittamalla tietoihin rivi ja ennustamalla sitten uusia arvoja.

2. Logistinen regressio

Logistinen regressio on lineaarisen regression laajennus, jota käytetään luokitustehtävissä arvioimaan todennäköisyyttä, että esiintymä kuuluu tiettyyn luokkaan.

3. SVM (Support Vector Machine)

SVM:t ovat valvottuja oppimisalgoritmeja, jotka voivat suorittaa luokittelu- ja regressiotehtäviä. Se löytää hypertason, joka parhaiten erottaa luokat piirreavaruudessa.

4. KNN (K-lähin naapuri)

KNN on ei-parametrinen tekniikka, jota voidaan käyttää sekä luokitukseen että regressioon. Se toimii tunnistamalla k samankaltaisinta datapistettä uuteen datapisteeseen ja ennustamalla sitten uuden datapisteen tunnisteen käyttämällä näiden datapisteiden nimiä.

5. Päätöspuu

Päätöspuut ovat eräänlainen valvottu oppimistekniikka, jota voidaan käyttää sekä luokittelussa että regressiossa. Se toimii segmentoimalla tiedot yhä pienempiin ryhmiin, kunnes jokainen ryhmä voidaan luokitella tai ennustaa suurella tarkkuudella.

6. Random Forest

Satunnaiset metsät ovat eräänlainen kokonaisuusoppimismenetelmä, joka käyttää päätöspuita ennusteiden tekemiseen yhdistämällä yksittäisten puiden ennusteita. Se parantaa yksittäisten päätöspuiden tarkkuutta ja joustavuutta. Sitä voidaan käyttää sekä luokitus- että regressiotehtäviin.

7. Naiivi Bayes

Naive Bayes on Bayesin lauseeseen perustuva todennäköisyysluokitus, jota käytetään luokittelutehtäviin. Se toimii olettamalla, että datapisteen ominaisuudet ovat toisistaan ​​riippumattomia.

8. PCA (Principal Component Analysis)

PCA on ulottuvuuden vähentämistekniikka, jota käytetään tietojen muuntamiseen alemman ulottuvuuden tilaan säilyttäen mahdollisimman paljon varianssia. Se toimii etsimällä tiedoista ohjeet, jotka sisältävät eniten vaihtelua, ja projisoimalla tiedot sitten näihin suuntiin.

9. Apriori-algoritmit

Apriori-algoritmi on perinteinen tiedonlouhintatekniikka yhdistyssääntöjen louhintaan tapahtumatietokannoista tai tietojoukoista. Se on suunniteltu paljastamaan yhteyksiä ja malleja asioiden välillä, joita tapahtuu säännöllisesti tapahtumissa. Apriori havaitsee usein esiintyvät nimikejoukot, jotka ovat kohteiden ryhmiä, jotka näkyvät yhdessä tapahtumissa tietyllä vähimmäistukitasolla.

reactjs kartta

10. K-Means Clustering

K-Means-klusterointi on valvomaton oppimismenetelmä, jota voidaan käyttää datapisteiden ryhmittelyyn. Se toimii etsimällä tiedoista k klusteria niin, että kunkin klusterin datapisteet ovat mahdollisimman samankaltaisia ​​​​toistensa kanssa samalla kun ne pysyvät mahdollisimman erillään muiden klustereiden tietopisteistä.

Tutustu koneoppimista ohjaaviin peruskäsitteisiin oppimalla 10 parasta algoritmia , kuten lineaarinen regressio, päätöspuut ja neuroverkot.

Koneoppimisalgoritmi – UKK

1. Mikä on koneoppimisen algoritmi?

Koneoppimisalgoritmit ovat tilastollisiin käsitteisiin perustuvia tekniikoita, joiden avulla tietokoneet voivat oppia tiedoista, löytää kuvioita, tehdä ennusteita tai suorittaa tehtäviä ilman erityistä ohjelmointia. Nämä algoritmit luokitellaan laajasti kolmeen tyyppiin, eli ohjattuun oppimiseen, ohjaamattomaan oppimiseen ja vahvistusoppimiseen.

2. Mitä koneoppimistyyppejä ovat?

Koneoppimista on pääasiassa kolmenlaisia:

  • Valvottu algoritmi
  • Valvomaton algoritmi
  • Vahvistusalgoritmi

3. Mikä ML-algoritmi on paras ennustamiseen?

Ihanteellinen koneoppimismenetelmä ennustamiseen määräytyy a kriteerien määrä , mukaan lukien ongelman luonne, tietotyyppi ja yksilölliset vaatimukset. Tukivektorikoneet, satunnaiset metsät ja gradientin tehostaminen ovat suosittuja ennakointityökuormituksessa. Algoritmin valinnan tulisi sen sijaan perustua kyseessä olevan ongelman ja tietojoukon testaamiseen ja arviointiin.

4. Mitkä ovat 10 suosittua koneen oppimisalgoritmia?‌

Alla on luettelo 10 yleisimmin käytetystä koneoppimisalgoritmista (ML):

  1. Lineaarinen regressio
  2. Logistinen regressio
  3. SVM (Support Vector Machine)
  4. KNN (K-lähin naapuri)
  5. Päätöspuu
  6. Satunnainen metsä
  7. Naiivi Bayes
  8. PCA (Principal Component Analysis)
  9. Apriori algoritmit
  10. K-Means Clustering