logo

Kuinka löytää R:n keskihajonta?

Tässä artikkelissa keskustelemme siitä, kuinka löytää standardipoikkeama R Ohjelmointikieli . Keskihajonta R on arvojen hajaantumisen mitta. Se voidaan määritellä myös varianssin neliöjuureksi.

a b c numeroita

Näytteen keskihajonnan kaava:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

missä,

  • s = näytteen keskihajonta
  • N = kokonaisuuksien lukumäärä
  • overline{x}= Entiteettien keskiarvo

Periaatteessa on kaksi eri tapaa laskea standardipoikkeama R-ohjelmointikielellä, molempia käsitellään alla.



Menetelmä 1: Naiivi lähestymistapa

Tässä keskihajonnan laskentamenetelmässä käytämme yllä olevaa standardikaavaa näytteen keskihajonnasta R-kielellä.

Esimerkki 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Lähtö:



[1]   25.53886>

Esimerkki 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Lähtö:

[1] 2.676004>

Tapa 2: sd()

Funktiota sd() käytetään keskihajonnan palauttamiseen.

Syntaksi: sd(x, na.rm = EPÄTOSI)

Parametrit:

    x: numeerinen vektori, matriisi tai data frame.na.rm: puuttuvat arvot poistetaan?

Palata: Näytteen keskihajonna x.

Esimerkki 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Lähtö:

[1] 25.53886>

Esimerkki 2:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Lähtö:

[1] 23.52175>

Esimerkki 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Lähtö:

[1] 2.676004>

Laske tietokehyksen keskihajonta:

Voimme laskea datakehyksen keskihajonnan molemmilla menetelmillä. voimme ottaa iiristietojoukon ja jokaiselle sarakkeelle laskemme keskihajonnan.

Esimerkki 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Lähtö:

Python-ohjelma binäärihakuun
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

Voimme myös laskea keskihajonnan koko datakehykselle Apply-funktion avulla.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Lähtö:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Iris-tietojoukon sarakkeet 1–4, jotka ovat muuttujan mittauksia sisältäviä numeerisia sarakkeita, valitaan käyttämällä yllä olevan koodin lauseketta iris[, 1:4].

sd-funktiota sovelletaan jokaiseen sarakkeeseen (merkitty numerolla 2) valitussa iiristietojoukon osajoukossa käyttämällä soveltamistoimintoa. Tuloksena saadut keskihajonnan arvot tallennetaan kunkin sarakkeen std_poikkeamavektoriin.