logo

Kuinka käyttää lm()-funktiota R:ssä lineaaristen mallien sovittamiseksi?

Tässä artikkelissa opimme käyttämään lm()-funktiota sovittamaan lineaarisia malleja R-ohjelmointikielessä.

Lineaarista mallia käytetään tuntemattoman muuttujan arvon ennustamiseen riippumattomien muuttujien perusteella. Sitä käytetään enimmäkseen muuttujien ja ennustamisen välisen suhteen selvittämiseen. Funktiota lm() käytetään sovittamaan lineaariset mallit tietokehyksiin R-kielessä. Sitä voidaan käyttää suorittamaan regressio, yksikerroksinen varianssianalyysi ja kovarianssianalyysi ennustamaan arvoa, joka vastaa dataa, joka ei ole tietokehyksessä. Nämä ovat erittäin hyödyllisiä kiinteistöjen hintojen ennustamisessa, sääennusteissa jne.



Lineaarisen mallin sovittamiseksi R-kieleen käyttämällä lm() Käytämme ensin data.frame()-funktiota luodaksemme esimerkkitietokehyksen, joka sisältää arvot, jotka on sovitettava lineaariseen malliin regressiofunktiota käyttämällä. Sitten käytämme funktiota lm() sovittamaan tietyn funktion tiettyyn tietokehykseen.

Syntaksi:

lm(sovituskaava, tietokehys)



Parametri:

    sovituskaava: määrittää lineaarisen mallin kaavan. datakehys: määrittää datakehyksen nimen, joka sisältää tiedot.

Sitten voimme käyttää summary()-funktiota tarkastellaksesi lineaarisen mallin yhteenvetoa. Summary()-funktio tulkitsee tärkeimmät tilastolliset arvot lineaarisen mallin analysointia varten.

unix luo hakemiston

Syntaksi:



yhteenveto( lineaarinen_malli )

Yhteenveto sisältää seuraavat keskeiset tiedot:

    Jäännösstandardivirhe: määrittää virheen keskihajonnan, jossa varianssin neliöjuuri vähentää mukana olevien muuttujien n miinus 1 + # sen sijaan, että se jakaisi n-1:llä. Useita R-neliöitä: määrittää, kuinka hyvin mallisi sopii tietoihin. Muokattu R-neliö: normalisoi useita R-neliöitä ottamalla huomioon, kuinka monta näytettä sinulla on ja kuinka monta muuttujaa käytät. F-Statistic: on globaali testi, joka tarkistaa, onko vähintään yksi kertoimistasi nollasta poikkeava.

Esimerkki: Esimerkki lm()-funktion käytöstä.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

>

>

Lähtö:

Puhelu:

lm(kaava = y ~ x^2, data = df)

Jäännös:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Kertoimet:

Estimate Std. Virhe t-arvo Pr(>|t|)

(Leikkaaminen) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

Signif. koodit: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ' 1

Jäännösstandardivirhe: 2,944 3 vapausasteessa

Useita R-neliöitä: 0,9326, mukautettua R-neliötä: 0,9102

F-tilasto: 41,54 1 ja 3 DF:llä, p-arvo: 0,007575

Diagnostiset piirteet

Diagnostiset kaaviot auttavat meitä tarkastelemaan mallin eri tilastollisten arvojen välistä suhdetta. Se auttaa meitä analysoimaan poikkeamien laajuutta ja sovitetun mallin tehokkuutta. Lineaarisen mallin diagnostisten kuvaajien tarkastelemiseksi käytämme R-kielen plot()-funktiota.

Syntaksi:

plot( lineaarinen_malli )

Esimerkki: Diagnostiset käyrät edellä sovitetulle lineaariselle mallille.

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

>

>

Lähtö:

Piirustus Lineaarinen malli

Voimme piirtää yllä sovitetun lineaarisen mallin visualisoidaksemme sen hyvin käyttämällä abline()-menetelmää. Piirrämme ensin tietopisteiden sirontakuvaajan ja sitten sen päälle lineaarisen mallin abline-kaavion käyttämällä abline()-funktiota.

Syntaksi:

piirre (df$x, df$y)

java merkkijonojen leikkaus

abline(lineaarinen_malli)

Esimerkki: Lineaarinen piirrosmalli

R




merkkijono int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

>

>

Lähtö:

Ennusta tuntemattomien datapisteiden arvot sovitetun mallin avulla

Arvojen ennustamiseksi uusille syötteille käyttämällä yllä sovitettua lineaarista mallia, käytämme ennusta()-funktiota. ennusta()-funktio ottaa mallin ja tietokehyksen tuntemattomilla datapisteillä ja ennustaa kunkin datapisteen arvon sovitetun mallin mukaan.

Syntaksi:

ennustaa (malli, data)

Parametri:

    malli: määrittää lineaarisen mallin. data: määrittää tietokehyksen tuntemattomilla datapisteillä.

Esimerkki: Uusien syötteiden ennustaminen

R




# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

>

>

Lähtö:

1 2 3 83 89 95>