logo

Keskiarvo, varianssi ja keskihajonta

Keskiarvo, varianssi ja keskihajonta ovat tärkeitä tilastollisia mittareita. Varianssi ilmaisee datapisteen poikkeaman keskiarvosta, kun taas standardipoikkeama mittaa tietojen jakautumista. Keskeinen ero on siinä, että keskihajonta on samoissa yksiköissä kuin keskiarvo, kun taas varianssi on neliöyksiköissä. Sukella syvemmälle näihin käsitteisiin määritelmien, kaavojen ja havainnollistavan esimerkin avulla.

Tarkoittaa

Tarkoittaa on tietyn tietojoukon keskiarvo. Tarkastellaanpa esimerkkiä alla



2, 4, 4, 4, 5, 5, 7, 9

Näiden kahdeksan datapisteen keskiarvo (keskiarvo) on 5:

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Kaava : mu=frac{sum_{i=1}^{N} x_{i}}{N}

Missä ? on keskiarvo ja x1, x2, x3…., xiovat elementtejä. Huomaa myös, että keskiarvoa merkitään joskus egin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{array}

Varianssi

Varianssi on kaikkien lukujen ja keskiarvojen välisten erojen neliöiden summa.
Poikkeama yllä olevasta esimerkistä. Laske ensin kunkin datapisteen poikkeamat keskiarvosta ja neliötä kunkin tulos:

Kaava: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

varianssi = 	extup{Variaatiokerroin } =frac{ 	extup{Standardipoikkeama}}{Keskiarvo}*100= 4.



Missä ? on Keskiarvo, N on alkioiden kokonaismäärä tai jakautumistiheys.


Standardipoikkeama

Standardipoikkeama on varianssin neliöjuuri. Se on mitta siitä, missä määrin tiedot eroavat keskiarvosta.

Keskihajonta (edellä mainitut tiedot) = = 2

Miksi matemaatikot valitsivat neliön ja sitten neliöjuuren poikkeaman löytämiseksi, miksi eivät yksinkertaisesti ottaneet arvojen eroa?
Yksi syy on se, että erojen summasta tulee 0 keskiarvon määritelmän mukaan. Absoluuttisten erojen summa voisi olla vaihtoehto, mutta absoluuttisilla eroilla oli vaikea todistaa monia mukavia lauseita. [Lähde: MIT-videoluento klo 1:19]



  1. Keskihajonnan arvo on 0, jos kaikki syötteet ovat samat.
  2. Jos lisäämme (tai vähennämme) luvun, esimerkiksi 7, kaikkiin syötejoukon arvoihin, keskiarvo kasvaa (tai pienenee) 7:llä, mutta keskihajonta ei muutu.
  3. Jos kerromme kaikki syötejoukon arvot luvulla 7, sekä keskiarvo että keskihajonta kerrotaan 7:llä. Mutta jos kerromme kaikki syötetyt arvot negatiivisella luvulla, esimerkiksi -7, keskiarvo kerrotaan -7:llä, mutta keskihajonta kerrotaan seitsemällä.
  4. Keskihajonta ja varianssi ovat mitta, joka kertoo kuinka hajaantuneita luvut ovat. Vaikka varianssi antaa karkean käsityksen leviämisestä, keskihajonta on konkreettisempi, jolloin saat tarkat etäisyydet keskiarvosta.
  5. Keskiarvo, mediaani ja tila ovat datan (joko ryhmitellyn tai ryhmittämättömän) keskeisen suuntauksen mitta.

Tarkistaa:

  • Varianssi ja keskihajonta
  • Standardipoikkeaman tosielämän sovellukset
  • Ero varianssin ja keskihajonnan välillä

Alla olevia kysymyksiä on esitetty edellisen vuoden GATE-kokeissa Viitteet:
https://en.wikipedia.org/wiki/Standard_poikkeama
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

Keskiarvo, varianssi ja keskihajonta – UKK

Mitä eroa on standardipoikkeaman ja varianssin välillä?

Sekä keskihajonta että varianssi mittaavat tietojoukon datapisteiden leviämistä suhteessa keskiarvoon. Keskeinen ero on se, että varianssi mittaa keskiarvon neliöpoikkeamien keskiarvoa, kun taas standardipoikkeama on varianssin neliöjuuri, mikä tarjoaa hajauttamismitan samoissa yksiköissä kuin tiedot.



Kuinka lasket keskiarvon, varianssin ja keskihajonnan?

  • Tarkoitus: Laske kaikki luvut yhteen ja jaa lukujen määrällä.
  • Varianssi: Laske keskiarvo, vähennä keskiarvo kustakin luvusta, neliöi tulos, summaa nämä neliölliset tulokset ja jaa lukujen määrällä miinus yksi.
  • Keskihajonta: Ota varianssin neliöjuuri.

Miksi keskiarvo, varianssi ja keskihajonta ovat tärkeitä?

Nämä tilastolliset mittarit ovat ratkaisevan tärkeitä tietojen jakautumisen ymmärtämisessä. Keskiarvo antaa keskeisen arvon, kun taas varianssi ja keskihajonta antavat käsityksen datan vaihtelusta tai leviämisestä, mikä osoittaa tietojoukon johdonmukaisuuden tai volatiliteetin.

Voivatko varianssi ja keskihajonta olla negatiivisia?

Ei, varianssi ja keskihajonta eivät voi olla negatiivisia. Varianssi lasketaan keskiarvon neliöityjen erojen keskiarvona, jolloin tuloksena on ei-negatiivinen arvo. Koska keskihajonta on varianssin neliöjuuri, se ei myöskään voi olla negatiivinen.

Miten poikkeavat arvot vaikuttavat keskiarvoon, varianssiin ja keskihajontaan?

Poikkeavat arvot voivat vaikuttaa merkittävästi keskiarvoon vetämällä sitä kohti outlier-arvoa, mikä ei heijasta tarkasti tietojoukon keskeistä suuntausta. Varianssi ja keskihajonnat vaikuttavat myös, koska ne kasvavat, mikä viittaa suurempaan tietojen leviämiseen johtuen poikkeavista arvoista.