logo

Varianssi

Varianssi on mittausarvo, jota käytetään selvittämään, kuinka tiedot leviävät koskien tietojoukon keskiarvoa tai keskiarvoa. Sen avulla selvitetään, kuinka jakautumistiedot jakautuvat keskiarvon tai keskiarvon suhteen. Varianssin määrittämiseen käytetty symboli on σ2. Se on keskihajonnan neliö.

Tilastoissa käytetään kahta eri varianssityyppiä,



  • Näytevarianssi
  • Väestön varianssi

Perusjoukon varianssia käytetään määrittämään, kuinka tietyn populaation kukin datapiste vaihtelee tai jakautuu, kun taas otosvarianssia käytetään keskiarvon neliöityjen poikkeamien keskiarvon selvittämiseen.

Tässä artikkelissa opimme Varianssi (otos, populaatio), niiden kaavat, ominaisuudet ja muut yksityiskohtaisesti.

Sisällysluettelo



Mikä on varianssi?

Mittaamme datan eri arvoja ja näitä arvoja käytetään moniin eri tarkoituksiin. Tiedot voidaan antaa kahden tyyppisenä ryhmiteltynä datana tai ryhmittämättömänä (diskreettisenä) datana. Jos tiedot annetaan luokkavälien muodossa, sitä kutsutaan ryhmitetyksi dataksi, kun taas jos tiedot annetaan yksittäisen tietopisteen muodossa, sitä kutsutaan diskreetiksi tai ryhmittämättömäksi tietopisteeksi. Varianssi on datan hajaantumisen mitta datan keskiarvon suhteen. Se kertoo meille, kuinka data on hajallaan annetussa data-arvossa. Voimme helposti laskea otosvarianssin ja populaatiovarianssin sekä ryhmitellylle että ryhmittämättömälle tiedolle.

Varianssin määritelmä

Varianssi on tilastollinen mitta, joka kvantifioi tietopisteiden joukon leviämistä tai hajaantumista. Se osoittaa, kuinka paljon tietojoukon yksittäiset datapisteet eroavat tietojoukon keskiarvosta (keskiarvosta).

Varianssin tyypit

Voimme määritellä annettujen tietojen varianssin kahdella tyypillä,



  • Väestön varianssi
  • Näytevarianssi

Opitaanpa nyt niistä yksityiskohtaisesti.

Väestön varianssi

Populaatiovarianssia käytetään tietyn populaation levinneisyyden selvittämiseen. Väestö määritellään ihmisryhmäksi ja kaikki siihen kuuluvat ihmiset ovat osa väestöä. Se kertoo meille, kuinka ryhmän väestö vaihtelee suhteessa keskimääräiseen väestöön.

Kaikki ryhmän jäsenet tunnetaan väestönä. Kun haluamme selvittää, kuinka jokainen datapiste tietyssä populaatiossa vaihtelee tai jakautuu, käytämme populaatiovarianssia. Sitä käytetään antamaan kunkin datapisteen neliöetäisyys perusjoukon keskiarvosta.

Näytevarianssi

Jos populaatiodata on erittäin suuri, on aineiston populaatiovarianssin laskeminen vaikeaa. Siinä tapauksessa otamme otoksen tiedoista annetusta tietojoukosta ja löydämme kyseisen tietojoukon varianssin, jota kutsutaan näytevarianssiksi. Otoskeskiarvoa laskettaessa varmistamme, että laskemme otoskeskiarvon, eli otosaineiston keskiarvon, ei populaation keskiarvon. Otosvarianssi voidaan määritellä otosdatapisteen ja otoskeskiarvon välisen eron neliön keskiarvona.

Varianssisymboli

Varianssin symbolia edustaa tyypillisesti kreikkalainen kirjain sigma neliö (σ²), kun viitataan populaatiovarianssiin. Otosvarianssia varten se on usein merkitty s²:llä.

Esimerkki varianssista

Voimme ymmärtää varianssin käsitteen alla käsitellyn esimerkin avulla.

Etsi tietojen populaatiovarianssi {4,6,8,10}

Ratkaisu:

Keskiarvo = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Varianssi = (9+1+1+9)/4 = 20/4 = 5

Siten datan varianssi on 5

Varianssikaava

Tietojoukon varianssia merkitään symbolilla σ2. Väestötiedoilla sen kaava on yhtä suuri kuin datasyötteiden keskiarvon neliöerojen summa jaettuna merkintöjen määrällä. Esimerkkitiedoissa jaamme osoittajan arvon syötteiden lukumäärän ja yksikön erolla.

Näytevarianssikaava

Jos tietojoukko on näyte, varianssikaava saadaan kaavalla,

s 2 = ∑ (x i – x̄) 2 /(n - 1)

missä,

  • x on näytetietojoukon keskiarvo
  • n on havaintojen kokonaismäärä

Väestön varianssikaava

Jos meillä on väestötietojoukko, kaava kirjoitetaan seuraavasti:

s 2 = ∑ (x i – x̄) 2 /n

missä,

  • x on väestötietojoukon keskiarvo
  • n on havaintojen kokonaismäärä

Voimme myös laskea ryhmiteltyjen ja ryhmittämättömien tietojoukkojen varianssin. Erilaiset varianssin kaavat ovat,

tiedostopääte java

Ryhmitettyjen tietojen varianssikaava

Ryhmitettyjen tietojen varianssikaavaa käsitellään alla,

Esimerkkivarianssikaava ryhmitellylle tiedolle (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)

Populaatiovarianssikaava ryhmitellyille tiedoille (s 2 ) = ∑ f(m i – x̄) 2 /n

missä,

  • f on kunkin intervallin taajuus
  • m i on i:n keskipistethintervalli
  • x on ryhmiteltyjen tietojen keskiarvo

Ryhmitettyjen tietojen keskiarvo lasketaan seuraavasti:

Keskiarvo = ∑ (f i x i ) / ∑ f i

Varianssikaava ryhmittelemättömille tiedoille

Ryhmittelemättömien tietojen varianssikaavaa käsitellään alla,

  • Esimerkkivarianssikaava ryhmittämättömille tiedoille (s 2 ) = ∑ (x i – x̄) 2 /(n-1)
  • Populaatiovarianssikaava ryhmittelemättömille tiedoille (s 2 ) = ∑ (x i – x̄) 2 /n

missä x on ryhmiteltyjen tietojen keskiarvo

Varianssin laskentakaava

Varianssin laskemiseen käytetty kaava on kuvattu alla olevassa kuvassa,

Varianssikaava

Kuinka laskea varianssi?

Yleisesti varianssi tarkoittaa populaation standardivarianssia. Vaiheet tietyn arvojoukon varianssin laskemiseksi ovat:

Vaihe 1: Laske havainnon keskiarvo kaavalla (Keskiarvo = Havaintojen summa/Havaintojen määrä)

Vaihe 2: Laske data-arvojen neliöerot keskiarvosta. (Tiedon arvo – keskiarvo)2

Vaihe 3: Laske annettujen arvojen neliöerojen keskiarvo, joita kutsutaan tietojoukon varianssiksi.

(Varianssi = neliöityjen erojen summa / havaintojen määrä)

Varianssi ja keskihajonta

Varianssi ja Standardipoikkeama molemmat ovat keskeisen suuntauksen mittareita, joita käytetään kertomaan, kuinka paljon tietojoukon arvot poikkeavat tietojoukon keskiarvosta tai keskiarvosta.

Varianssin ja keskihajonnan välillä on selvä suhde minkä tahansa tietojoukon osalta.

Varianssi = (standardipoikkeama) 2

Varianssi määritellään keskihajonnan neliöksi, eli ottamalla keskihajonnan neliö mille tahansa tietoryhmälle saadaan kyseisen tietojoukon varianssi. varianssi määritellään symbolilla s 2 kun taas s käytetään määrittämään tietojoukon keskihajonta. Tietojoukon varianssi ilmaistaan ​​neliöyksiköinä, kun taas tietojoukon keskihajonta ilmaistaan ​​yksikössä, joka on samanlainen kuin tietojoukon keskiarvo.

Lisätietoja: Varianssi ja keskihajonta

Binomijakauman varianssi

Binomiaalinen jakauma on diskreetti todennäköisyysjakauma, joka kertoo meille positiivisten tulosten lukumäärän binomiaalisessa kokeessa, joka on suoritettu n kertaa. Binomikokeen tulos on 0 tai 1, eli joko positiivinen tai negatiivinen.

Binomikokeessa n kokeet ja missä kunkin kokeen todennäköisyys on annettu s , niin binomijakauman varianssi annetaan käyttämällä

s 2 = np (1 – p)

missä 'esim' määritellään binomijakauman arvojen keskiarvona.

Poisson-jakauman varianssi

Myrkkyjen leviäminen määritellään diskreetiksi todennäköisyysjakaumaksi, jota käytetään määrittämään todennäköisyys sille, että 'n' tapahtumat tapahtuvat 'x'-ajanjakson sisällä. Poisson-jakauman keskiarvo määritellään symbolilla l.

Poisson-jakaumassa annetun tietojoukon keskiarvo ja varianssi ovat yhtä suuret. Poisson-jakauman varianssi on annettu kaavalla,

s 2 = λ

Tasaisen jakautumisen varianssi

Tasaisessa jakaumassa todennäköisyysjakaumatieto on jatkuvaa. Näiden kokeiden tulos on tietyn ylärajan ja tietyn alarajan välisellä alueella, ja siksi näitä jakaumia kutsutaan myös suorakulmaisiksi jakaumuiksi. Jos yläraja tai enimmäisraja on b ja alaraja tai minimiraja on a, jolloin tasaisen jakauman varianssi lasketaan kaavalla,

s 2 = (1/12) (b – a) 2

Tasaisen jakauman keskiarvo annetaan kaavalla,

Keskiarvo = (b + a) / 2

missä,

  • b on tasaisen jakauman yläraja
  • a on tasaisen jakauman alaraja

Varianssi ja kovarianssi

Tietojoukon varianssi määrittää tietojoukon kaikkien arvojen volatiliteetin suhteessa tietojoukon keskiarvoon. Kovarianssi kertoo, kuinka satunnaismuuttujat liittyvät toisiinsa ja kuinka yhden muuttujan muutos vaikuttaa muiden muuttujien muutokseen.

Kovarianssi voi olla positiivinen tai negatiivinen, positiivinen kovarianssi tarkoittaa, että molemmat muuttujat liikkuvat samaan suuntaan suhteessa keskiarvoon, kun taas negatiivinen kovarianssi tarkoittaa, että molemmat muuttujat liikkuvat vastakkaisiin suuntiin suhteessa keskiarvoon.

Kahdelle satunnaismuuttujalle x ja y, joissa x on riippuvainen muuttuja ja y on riippumaton muuttuja, kovarianssi lasketaan alla olevassa oheisessa kuvassa mainitulla kaavalla.

Kovarianssikaava

Varianssi-ominaisuudet

Varianssia käytetään laajasti matematiikassa, tilastotiedoissa ja muilla tieteenaloilla moniin eri tarkoituksiin. Varianssilla on erilaisia ​​ominaisuuksia, joita käytetään laajalti erilaisten ongelmien ratkaisemiseen. Jotkut varianssin perusominaisuuksista ovat

  • Tietojoukon varianssi on ei-negatiivinen suure ja varianssin nolla-arvo tarkoittaa, että tietojoukon kaikki arvot ovat yhtä suuret.
  • Suurempi varianssin arvo kertoo, että kaikki tietojoukon tietoarvot ovat laajalti hajallaan, eli ne ovat kaukana aineiston keskiarvosta.
  • Pienempi varianssin arvo kertoo, että kaikki tietojoukon arvot ovat lähellä toisiaan, eli ne ovat hyvin lähellä tietojoukon keskiarvoa.

mille tahansa vakiolle 'c'

  • Muutt(x + c) = Muutt(x)

missä x on satunnaismuuttuja

  • Var(cx) = c2

missä x on satunnaismuuttuja

Myös jos a ja b ovat vakioarvo ja x on satunnaismuuttuja,

  • Var(ax + b) = a2

Riippumattomille muuttujille x1, x2, x3…,xntiedämme sen,

  • Missä (x1+ x2+……+ xn) = Muutt(x1) + Missä(x2) +……..+Missä(xn)

Ihmiset lukevat myös:

  • Tarkoittaa
  • tila
  • Ero varianssin ja keskihajonnan välillä

Esimerkkejä varianssikaavasta

Esimerkki 1: Laske näytetietojen varianssi: 7, 11, 15, 19, 24.

Ratkaisu:

Meillä on tiedot, 7, 11, 15, 19, 24

Etsi tietojen keskiarvo.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15.2

Käyttämällä varianssikaavaa saamme,

s2= ∑ (xi– x̄)2/(n - 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 - 1)
= 176,8/4
= 44,2

Esimerkki 2: Laske havaintojen määrä, jos tietojen varianssi on 12 ja tietojen neliöerojen summa keskiarvosta on 156.

Ratkaisu:

Meillä on,

(xi– x̄)2= 156

s2= 12

Käyttämällä varianssikaavaa saamme,

s2= ∑ (xi– x̄)2/n

12 = 156/n

n = 156/12

n = 13

Esimerkki 3: Laske varianssi annetuille tiedoille

xi

fi

10 1
4 3
6 5
8 1

Ratkaisu:

Keskiarvo (x̄) = ∑(fixi)/∑(fi)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fi) = 1+3+5+1 = 10

xi

fi

fixi

(xi– x̄)

(xi– x̄)2

fi(xi– x̄)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Nyt,

s 2 = (∑ i n f i (x i – x̄) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Varianssi(σ2) = 3,6

Esimerkki 4: Etsi seuraavan tietotaulukon varianssi

Luokka

Taajuus

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Ratkaisu:

Luokka

Xi

fi

f × Xi

Xi - μ

(Xi – μ)2

matriisin kertolasku c:ssä

f×(Xi – μ)2

0-10

5

3

viisitoista

-viisitoista

225

675

10-20

viisitoista

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

viisitoista

225

450

40-50

Neljä viisi

1

Neljä viisi

25

625

625

Kaikki yhteensä

dynaaminen taulukko javassa

16

320

2000

Keskiarvo (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

s 2 = (∑ i n f i (x i – m) 2 /n)

= [(2000)/(16)]
= (125)

Annetun tietojoukon varianssi on 125.

Yhteenveto – Varianssi

Varianssi on tilastollinen mitta, joka osoittaa kuinka paljon tietojoukon arvot eroavat keskiarvosta. Se auttaa meitä ymmärtämään tietopisteiden leviämistä tai hajaantumista. Varianssia on kahta päätyyppiä: populaatiovarianssi, joka mittaa datapisteiden jakautumista koko populaatiossa, ja otosvarianssi, joka mittaa otoksen datapisteiden jakautumista. Varianssi on merkitty σ²:llä ja se on keskihajonnan neliö. Laskeaksesi varianssia, etsit tietojen keskiarvon, vähennät keskiarvon kustakin datapisteestä, neliöit erot ja keskität sitten nämä neliöerot. Varianssi on tärkeä, koska se auttaa meitä ymmärtämään tietojoukon vaihtelua. Suuri varianssi osoittaa, että datapisteet ovat hajallaan laajasti, kun taas pieni varianssi osoittaa, että ne ovat lähellä keskiarvoa. Varianssi on aina ei-negatiivinen, koska se edellyttää erojen neliöintiä.

Usein kysyttyä varianssista

Mikä on tilastojen varianssi?

Varianssi määritellään tietojoukon arvojen hajoamana suhteessa tietojoukon keskiarvoon. Tietojoukon varianssi kertoo, missä määrin tietyn tietojoukon arvot leviävät keskiarvosta.

Mikä on varianssin symboli?

Käytämme symboleja σ2, s2 ja Var(x) osoittamaan tietojoukon varianssia.

Mikä on varianssikaava?

Tietojoukon varianssi lasketaan kaavalla,

s 2 = E[( X - m ) 2 ]

Mitä Variance kertoo?

Varianssia käytetään tiedon leviämisen laajuuden selvittämiseen eli se kertoo kuinka tietojoukon arvot jakautuvat keskiarvoon nähden. Suuremmalla varianssiarvolla arvot jakautuvat laajasti keskiarvoon nähden, kun taas pienemmän varianssin arvot ovat tiiviisti hajallaan keskiarvon suhteen.

Mikä on varianssin ja keskihajonnan välinen suhde?

Annetulle tietojoukolle tietojoukon varianssi on kyseisen tietojoukon keskihajonnan neliö. Tämä suhde ilmaistaan

Varianssi = (standardipoikkeama) 2

Kuinka lasket varianssin?

Varianssin laskemiseksi sinun on ensin selvitettävä tietojoukon keskiarvo (keskiarvo). Vähennä sitten keskiarvo kustakin datapisteestä ja neliöi tulos. Lopuksi laske näiden neliöityjen erojen keskiarvo.

Miksi varianssi on tärkeä?

Varianssi on ratkaisevan tärkeää tietojoukon sisältämän datan jakautumisen ymmärtämiseksi. Se auttaa määrittämään, kuinka hajaantuneita datapisteet ovat keskiarvosta, mikä osoittaa tietojen vaihtelun tai johdonmukaisuuden.

Mitä eroa on varianssilla ja standardipoikkeamalla?

Vaikka sekä varianssi että standardipoikkeama mittaavat tietojen hajoamista, keskihajonta on varianssin neliöjuuri. Keskihajonta ilmaistaan ​​samoissa yksiköissä kuin data, joten se on tulkittavissa hajauttamisen osoittamiseksi.

Voiko varianssi olla negatiivinen?

Ei, varianssi ei voi olla negatiivinen. Koska se lasketaan keskiarvon neliöityjen erojen keskiarvona, tuloksena oleva arvo on aina ei-negatiivinen.