Tässä artikkelissa opimme käyttämään lm()-funktiota sovittamaan lineaarisia malleja R-ohjelmointikielessä.
Lineaarista mallia käytetään tuntemattoman muuttujan arvon ennustamiseen riippumattomien muuttujien perusteella. Sitä käytetään enimmäkseen muuttujien ja ennustamisen välisen suhteen selvittämiseen. Funktiota lm() käytetään sovittamaan lineaariset mallit tietokehyksiin R-kielessä. Sitä voidaan käyttää suorittamaan regressio, yksikerroksinen varianssianalyysi ja kovarianssianalyysi ennustamaan arvoa, joka vastaa dataa, joka ei ole tietokehyksessä. Nämä ovat erittäin hyödyllisiä kiinteistöjen hintojen ennustamisessa, sääennusteissa jne.
Lineaarisen mallin sovittamiseksi R-kieleen käyttämällä lm() Käytämme ensin data.frame()-funktiota luodaksemme esimerkkitietokehyksen, joka sisältää arvot, jotka on sovitettava lineaariseen malliin regressiofunktiota käyttämällä. Sitten käytämme funktiota lm() sovittamaan tietyn funktion tiettyyn tietokehykseen.
Syntaksi:
lm(sovituskaava, tietokehys)
Parametri:
sovituskaava: määrittää lineaarisen mallin kaavan. datakehys: määrittää datakehyksen nimen, joka sisältää tiedot.
Sitten voimme käyttää summary()-funktiota tarkastellaksesi lineaarisen mallin yhteenvetoa. Summary()-funktio tulkitsee tärkeimmät tilastolliset arvot lineaarisen mallin analysointia varten.
unix luo hakemiston
Syntaksi:
yhteenveto( lineaarinen_malli )
Yhteenveto sisältää seuraavat keskeiset tiedot:
- Jäännösstandardivirhe: määrittää virheen keskihajonnan, jossa varianssin neliöjuuri vähentää mukana olevien muuttujien n miinus 1 + # sen sijaan, että se jakaisi n-1:llä. Useita R-neliöitä: määrittää, kuinka hyvin mallisi sopii tietoihin. Muokattu R-neliö: normalisoi useita R-neliöitä ottamalla huomioon, kuinka monta näytettä sinulla on ja kuinka monta muuttujaa käytät. F-Statistic: on globaali testi, joka tarkistaa, onko vähintään yksi kertoimistasi nollasta poikkeava.
Esimerkki: Esimerkki lm()-funktion käytöstä.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Lähtö:
Puhelu:
lm(kaava = y ~ x^2, data = df)
Jäännös:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Kertoimet:
Estimate Std. Virhe t-arvo Pr(>|t|)
(Leikkaaminen) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Signif. koodit: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ' 1
Jäännösstandardivirhe: 2,944 3 vapausasteessa
Useita R-neliöitä: 0,9326, mukautettua R-neliötä: 0,9102
F-tilasto: 41,54 1 ja 3 DF:llä, p-arvo: 0,007575
Diagnostiset piirteet
Diagnostiset kaaviot auttavat meitä tarkastelemaan mallin eri tilastollisten arvojen välistä suhdetta. Se auttaa meitä analysoimaan poikkeamien laajuutta ja sovitetun mallin tehokkuutta. Lineaarisen mallin diagnostisten kuvaajien tarkastelemiseksi käytämme R-kielen plot()-funktiota.
Syntaksi:
plot( lineaarinen_malli )
Esimerkki: Diagnostiset käyrät edellä sovitetulle lineaariselle mallille.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Lähtö:

Piirustus Lineaarinen malli
Voimme piirtää yllä sovitetun lineaarisen mallin visualisoidaksemme sen hyvin käyttämällä abline()-menetelmää. Piirrämme ensin tietopisteiden sirontakuvaajan ja sitten sen päälle lineaarisen mallin abline-kaavion käyttämällä abline()-funktiota.
Syntaksi:
piirre (df$x, df$y)
java merkkijonojen leikkausabline(lineaarinen_malli)
Esimerkki: Lineaarinen piirrosmalli
R
merkkijono int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Lähtö:

Ennusta tuntemattomien datapisteiden arvot sovitetun mallin avulla
Arvojen ennustamiseksi uusille syötteille käyttämällä yllä sovitettua lineaarista mallia, käytämme ennusta()-funktiota. ennusta()-funktio ottaa mallin ja tietokehyksen tuntemattomilla datapisteillä ja ennustaa kunkin datapisteen arvon sovitetun mallin mukaan.
Syntaksi:
ennustaa (malli, data)
Parametri:
malli: määrittää lineaarisen mallin. data: määrittää tietokehyksen tuntemattomilla datapisteillä.
Esimerkki: Uusien syötteiden ennustaminen
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Lähtö:
1 2 3 83 89 95>