logo

Z-pisteet tilastoissa

Z-pisteet tilastoissa on mitta siitä, kuinka monta standardipoikkeamaa datapiste on jakauman keskiarvosta. Etsitään z-pisteet tilastoista. Z-pistemäärä 0 osoittaa, että datapisteen pistemäärä on sama kuin keskimääräinen pistemäärä. Positiivinen z-piste osoittaa, että datapiste on keskiarvon yläpuolella, kun taas negatiivinen z-piste osoittaa, että datapiste on keskiarvon alapuolella.

Z-pisteen laskentakaava on: z = (x – μ)/ p



binäärihaku python

Missä:

  • x: on testiarvo
  • m: on keskiarvo
  • osoitteessa: on vakioarvo

Tässä artikkelissa aiomme keskustella seuraavista käsitteistä:

Sisällysluettelo



Mikä on Z-Score?

Z-piste, joka tunnetaan myös standardipisteenä, kertoo meille datapisteen poikkeaman keskiarvosta ilmaisemalla sen keskihajonnana keskiarvon ylä- tai alapuolella. Se antaa meille käsityksen siitä, kuinka kaukana datapiste on keskiarvosta. Tästä syystä Z-pisteet mitataan keskihajonnan perusteella. Esimerkiksi Z-pisteet 2 osoittaa, että arvo on 2 keskihajonnan päässä keskiarvosta. Z-pisteen käyttämiseksi meidän on tiedettävä väestön keskiarvo (μ) ja myös populaation keskihajonna (σ).

Z-pisteen kaava

Z-pisteet voidaan laskea käyttämällä seuraavaa kaavaa.

z = (X – μ) / p

missä,



  • z = Z-pisteet
  • X = Elementin arvo
  • μ = väestön keskiarvo
  • σ = väestön keskihajonta

Kuinka laskea Z-pisteet?

Saamme populaation keskiarvon (μ), perusjoukon keskihajonnan (σ) ja havaittu arvo (x) ongelmalausekkeessa korvaamalla saman Z-pisteyhtälössä antaa meille Z-pisteen arvon. Riippuen siitä, onko annettu Z-pistemäärä positiivinen vai negatiivinen, voimme käyttää positiivinen Z-taulukko tai negatiivinen Z-taulukko saatavilla verkossa tai liitteen tilastooppikirjan takana.

Esimerkki 1:

Suoritat GATE-kokeen ja saat pisteet 500. GATE:n keskimääräinen pistemäärä on 390 ja keskihajonta on 45. Kuinka hyvin sait kokeen pisteet keskimääräiseen testin suorittajaan verrattuna?

Ratkaisu:

Seuraavat tiedot ovat helposti saatavilla yllä olevassa kysymyslausekkeessa

Raakapistemäärä/havaittu arvo = X = 500

Keskimääräinen pistemäärä = μ = 390

Keskihajonta = σ = 45

Käyttämällä z-pisteen kaavaa,

z = (X – μ) / p

z = (500 – 390) / 45

z = 110/45 = 2,44

Tämä tarkoittaa, että z-pisteesi on 2.44 .

Koska Z-piste on positiivinen 2,44, käytämme positiivista Z-taulukkoa.

Katsotaanpa nyt Z Taulukko (CC-BY) saadaksesi selville, kuinka hyvin sait pisteitä muihin kokeisiin verrattuna.

Seuraa alla olevia ohjeita löytääksesi todennäköisyys taulukosta.

Tässä, z-pisteet = 2,44, joka i osoittaa, että datapiste on 2,44 standardipoikkeamaa keskiarvon yläpuolella.

  1. Kartoita ensin kaksi ensimmäistä numeroa 2.4 Y-akselilla.
  2. Sitten X-akselia pitkin kartta 0.04
  3. Yhdistä molemmat akselit. Näiden kahden leikkauspiste antaa sinulle kumulatiivisen todennäköisyyden, joka liittyy etsimääsi Z-pistearvoon

[Tämä todennäköisyys edustaa normaalin normaalikäyrän alla olevaa aluetta Z-pisteen vasemmalla puolella]

Normaali jakelutaulukko

Normaali jakelutaulukko

Tämän seurauksena saat lopullisen arvon, joka on 0,99266 .

Nyt meidän on verrattava alkuperäistä 500-pistettä GATE-tutkimuksessa verrattuna erän keskimääräiseen pistemäärään. Tätä varten meidän on muutettava Z-pisteeseen liittyvä kumulatiivinen todennäköisyys prosenttiarvoksi.

0,99266 × 100 = 99,266 %

Lopuksi voit sanoa, että olet menestynyt hyvin kuin melkein 99 % muista kokeen ottajista.

Esimerkki 2 : Millä todennäköisyydellä opiskelija saa pisteet 350–400 (keskimääräinen pistemäärä μ on 390 ja keskihajonta σ 45)?

Ratkaisu:

Minimipistemäärä = X1= 350

Maksimipistemäärä = X2= 400

Käyttämällä z-pisteen kaavaa,

Kanssa1= (X1 – m) / p

Kanssa1= (350 – 390) / 45

Kanssa1= -40 / 45 = -0,88

Kanssa2= (X2– m) / s

z2 = (400 – 390) / 45

Kanssa2= 10/45 = 0,22

Koska z1 on negatiivinen, meidän on tarkasteltava negatiivista Z-pöytä ja huomaa, että kumulatiivinen todennäköisyys p1, ensimmäinen todennäköisyys, on 0,18943 .

Kanssa2on positiivinen, joten käytämme positiivista Z-taulukkoa, joka antaa kumulatiivisen todennäköisyyden p2/ 0,58706 .

Lopullinen todennäköisyys lasketaan vähentämällä p1 p:stä2:

lausunnon tulostaminen javassa

p = p2– s1

p = 0,58706 – 0,18943 = 0,39763

Todennäköisyys, että opiskelija saa pisteet 350 ja 400 välillä on 39,763 % (0,39763 * 100).

Z-pisteen ominaisuudet

  • Z-pisteen suuruus heijastaa sitä, kuinka kaukana datapiste on keskihajonnan keskiarvosta.
  • Elementti, jonka z-piste on pienempi kuin 0, tarkoittaa, että elementti on pienempi kuin keskiarvo.
  • Z-pisteet mahdollistavat datapisteiden vertailun eri jakaumista.
  • Elementti, jonka z-pistemäärä on suurempi kuin 0, tarkoittaa, että elementti on suurempi kuin keskiarvo.
  • Elementti, jonka z-piste on yhtä suuri kuin 0, edustaa, että elementti on yhtä suuri kuin keskiarvo.
  • Elementti, jonka z-piste on yhtä suuri kuin 1, edustaa, että elementti on 1 keskihajonnan suurempi kuin keskiarvo; z-piste, joka on yhtä suuri kuin 2, 2 keskihajontaa suurempi kuin keskiarvo ja niin edelleen.
  • Elementti, jonka z-piste on yhtä suuri kuin -1, edustaa sitä, että elementti on 1 keskihajonnan pienempi kuin keskiarvo; z-piste, joka on yhtä suuri kuin -2, 2 keskihajontaa pienempi kuin keskiarvo ja niin edelleen.
  • Jos elementtien määrä tietyssä joukossa on suuri, noin 68 %:lla alkioista on z-pisteet välillä -1 ja 1; noin 95 %:lla on z-pisteet välillä -2 ja 2; noin 99 %:lla on z-pisteet välillä -3 ja 3. Tämä tunnetaan empiirisenä sääntönä, ja se ilmaisee datan prosentuaalisen prosenttiosuuden, joka on tietyissä keskipoikkeamissa normaalijakauman keskiarvosta, kuten alla olevassa kuvassa näkyy.

Empiirinen sääntö normaalijakaumassa

Laske poikkeamat Z-pisteen arvon avulla

Voimme laskea poikkeavia tiedoista käyttämällä datapisteiden z-pistearvoa. Vaiheet poikkeavan datapisteen huomioon ottamiseksi ovat seuraavat:

  • Aluksi keräämme tietojoukon, jossa haluamme nähdä poikkeamat
  • Laskemme tietojoukon keskiarvon ja keskihajonnan. Näitä arvoja käytetään kunkin datapisteen z-pistearvon laskemiseen.
  • Laskemme z-pisteen arvon jokaiselle datapisteelle. Z-pisteen arvon laskentakaava on sama kuin
    Z = frac{{X – mu}}{{sigma}}
    missä X on datapiste, μ on datan keskiarvo ja σ on tietojoukon keskihajonna.
  • Määritämme z-pisteen raja-arvon, jonka jälkeen datapistettä voidaan pitää poikkeavana arvona. Tämä raja-arvo on hyperparametri, jonka päätämme projektimme mukaan.
  • Datapiste, jonka z-pistemäärä on suurempi kuin 3, tarkoittaa, että datapiste ei kuulu tietojoukon 99,73 % pisteeseen.
  • Kaikkia datapisteitä, joiden z-piste on suurempi kuin päättämämme raja-arvo, pidetään poikkeavana arvona.

Tarkistaa: Z-pisteet outlier Detectionille

Z-Score:n käyttöönotto Pythonissa

Pythonilla voimme laskea tietojoukon tietopisteiden z-pistearvon. Lisäksi käytämme numpy-kirjastoa laskeaksemme tietojoukon keskiarvon ja keskihajonnan.

Python 3 import numpy as np def calculate_z_score(data): # Mean of the dataset mean = np.mean(data) # Standard Deviation of tha dataset std_dev = np.std(data) # Z-score of tha data points z_scores = (data - mean) / std_dev return z_scores # Example dataset dataset = [3,9, 23, 43,53, 4, 5,30, 35, 50, 70, 150, 6, 7, 8, 9, 10] z_scores = calculate_z_score(dataset) print('Z-Score :',z_scores) # Data points which lies outside 3 standard deviatioms are outliers # i.e outside range of99.73% values outliers = [data_point for data_point, z_score in zip(dataset, z_scores) if z_score>3] print(f' Outliers tiedossa on {outliers}')>

Lähtö:

Z-pisteet: [-0,7574907 -0,59097335 -0,20243286 0,35262498 0,6301539 -0,72973781
-0,70198492 -0,00816262 0,13060185 0,54689523 1,10195307 3,32218443
-0,67423202 -0,64647913 -0,61872624 -0,59097335 -0,56322046]
Tietojoukon poikkeamat ovat [150]

java matematiikan luokka

Z-pisteen soveltaminen

  • Z-pisteitä käytetään usein ominaisuuden skaalaukseen eri ominaisuuksien saattamiseksi yhteiselle mittakaavalle. Ominaisuuksien normalisointi varmistaa, että niillä on nollakeskiarvo ja yksikkövarianssi, mikä voi olla hyödyllistä tietyille koneoppimisalgoritmeille, erityisesti niille, jotka perustuvat etäisyysmittauksiin.
  • Z-pisteitä voidaan käyttää aineiston poikkeamien tunnistamiseen. Datapisteitä, joiden Z-pisteet ylittävät tietyn kynnyksen (yleensä 3 standardipoikkeamaa keskiarvosta), voidaan pitää poikkeavina.
  • Z-pisteitä voidaan käyttää poikkeamien havaitsemisalgoritmeissa sellaisten tapausten tunnistamiseen, jotka poikkeavat merkittävästi odotetusta käyttäytymisestä.
  • Z-pisteitä voidaan soveltaa muuttamaan vääristyneet jakaumat normaalijakaumaksi.
  • Regressiomallien kanssa työskenneltäessä residuaalien Z-pisteet voidaan analysoida homoskedastisuuden (residuaalien vakiovarianssi) tarkistamiseksi.
  • Z-pisteitä voidaan käyttää ominaisuuden skaalauksessa tarkastelemalla niiden keskihajontoja keskiarvosta.

Z-pisteet vs. keskihajonta

Z - Pisteet

Standardipoikkeama

Muunna raakadata standardoituun mittakaavaan.

Mittaa vaihtelun tai dispersion määrää arvojoukossa.

Helpottaa eri tietojoukkojen arvojen vertailua, koska ne poistavat alkuperäiset mittayksiköt.

Keskihajonta säilyttää alkuperäiset mittayksiköt, mikä tekee siitä vähemmän sopivan suoriin vertailuihin eri yksiköiden tietojoukkojen välillä.

Ilmoita kuinka kaukana datapiste on keskihajonnan keskiarvosta, mikä mittaa datapisteen suhteellista sijaintia jakaumassa

Ilmaistaan ​​samoissa yksiköissä kuin alkuperäiset tiedot, mikä antaa absoluuttisen mittarin siitä, kuinka jakautuvat arvot ovat keskiarvon ympärillä

Tarkistaa: Z-pisteet taulukko

Miksi Z-pisteitä kutsutaan vakiopisteiksi?

Z-pisteet tunnetaan myös standardipisteinä, koska ne standardoivat satunnaismuuttujan arvon. Tämä tarkoittaa, että standardisoitujen pisteiden luettelon keskiarvo on 0 ja keskihajonta 1,0. Z-pisteet mahdollistavat myös erilaisten muuttujien pisteiden vertailun. Tämä johtuu siitä, että he käyttävät suhteellista asemaa eri muuttujien tai jakaumien tulosten rinnastamiseen.

Z-pisteitä käytetään usein vertaamaan muuttujaa tavalliseen normaalijakaumaan (jossa μ = 0 ja σ = 1).

Z-pisteet tilastoissa – UKK

Mikä on positiivisten ja negatiivisten Z-pisteiden merkitys?

Positiiviset Z-pisteet osoittavat keskiarvon yläpuolella olevia arvoja, kun taas negatiiviset Z-pisteet osoittavat keskiarvon alapuolella olevia arvoja. Merkki heijastaa keskiarvosta poikkeaman suuntaa.

Mitä Z-pisteet 0 tarkoittaa?

Z-pistemäärä 0 osoittaa, että datapisteen arvo on täsmälleen tietojoukon keskiarvon kohdalla. Se viittaa siihen, että datapiste ei ole keskiarvon ylä- tai alapuolella.

Mikä on Z-pisteisiin liittyvä 68-95-99.7-sääntö?

Sääntö 68-95-99.7, joka tunnetaan myös nimellä empiirinen sääntö, sanoo, että:

  • Noin 68 % tiedoista on yhden standardipoikkeaman sisällä keskiarvosta.
  • Noin 95 % on 2 standardipoikkeaman sisällä.
  • Noin 99,7 % on 3 standardipoikkeaman sisällä.

Voidaanko Z-pisteitä käyttää ei-normaalijakaumiin?

Z-pisteet perustuvat olettamukseen, että tiedot noudattavat normaalijakaumaa. Käytännössä Z-pisteet ovat kuitenkin hyödyllisiä datalle, joka noudattaa normaalijakaumaa. Vaikka Z-pisteet voidaan laskea mille tahansa jakaumalle, niiden tulkinnasta tulee vähemmän luotettava ja yksinkertainen, kun käsitellään ei-normaalisti jakautunutta dataa.

Kuinka Z-pisteitä voidaan soveltaa tosielämän tilanteissa?

Z-Scoresilla on erilaisia ​​sovelluksia, kuten portfolioanalyysin rahoitus, standardoitujen testausten koulutus, kliinisten arvioiden terveys ja paljon muuta. Ne tarjoavat standardoidun toimenpiteen tietojen vertailuun ja tulkintaan.