The chi-neliö testi riippumattomuus arvioi, onko näiden kahden muuttujan luokkien välillä yhteyttä. Satunnaismuuttujia on pohjimmiltaan kahdenlaisia, ja ne tuottavat kahden tyyppistä dataa: numeerista ja kategorista. Sisään R Ohjelmointikieli Chi-neliötilastoa käytetään tutkimaan, eroavatko kategoristen muuttujien jakaumat toisistaan. Khin-neliötesti on hyödyllinen myös vertailtaessa kahden (tai useamman) riippumattoman ryhmän kategoristen vastausten osuuksia tai lukumääriä.
R-ohjelmointikielessä khin neliötestin suorittamiseen käytetty funktio on chisq.test()>
.
Syntaksi:
chisq.test(data)
räjähdyspuitaParametrit:
tiedot : data on taulukko, joka sisältää taulukon muuttujien lukuarvot.
Otamme kyselyn tiedot sisään MASS>
kirjasto, joka edustaa opiskelijoille tehdyn kyselyn tietoja.
R
# load the MASS package> library> (MASS)> print> (> str> (survey))> |
>
>
Lähtö:
'data.frame': 237 obs. of 12 variables: $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ... $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ... $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ... $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ... $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ... $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ... $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ... $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ... $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ... $ Height: num 173 178 NA 160 165 ... $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ... $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>
Yllä oleva tulos osoittaa, että tietojoukossa on monia tekijämuuttujia, joita voidaan pitää kategorisina muuttujina. Mallissamme otamme huomioon muuttujat Exer ja Savu .Smoke-sarake tallentaa oppilaiden tupakointitottumukset, kun taas Exer-sarake kirjaa heidän harjoitustasonsa. Tavoitteenamme on testata hypoteesia, onko opiskelijoiden tupakointitottumus riippumaton heidän liikuntatasostaan merkitsevyystasolla 0,05.
R
# Create a data frame from the main data set.> stu_data => data.frame> (survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data => table> (survey$Smoke,survey$Exer)> > print> (stu_data)> |
taulukkomerkkijono kohdassa c
>
>
Lähtö:
Freq None Some Heavy 7 1 3 Never 87 18 84 Occas 12 3 4 Regul 9 1 7>
Ja lopuksi sovellamme chisq.test()>
funktio varautumistaulukkoon stu_data.
R
java visualisaattori
# applying chisq.test() function> print> (> chisq.test> (stu_data))> |
>
>
Lähtö:
Pearson's Chi-squared test data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>
Koska p-arvo 0,4828 on suurempi kuin 0,05, päättelemme, että tupakointitottumus on riippumaton opiskelijan harjoittelustasosta ja siten näiden kahden muuttujan välillä on heikko tai ei ollenkaan korrelaatiota. Täydellinen R-koodi on annettu alla.
Yhteenvetona voidaan siis sanoa, että Chi-neliötestin suorittaminen R:llä on erittäin helppoa. Tämä tehtävä voidaan suorittaa käyttämällä chisq.test()>
toiminto R:ssä.
Visualisoi Chi-Square Testin tiedot
R
mysql luo käyttäjä
# Load required library> library> (MASS)> # Print structure of the survey dataset> print> (> str> (survey))> # Create a data frame for smoking and exercise columns> stu_data <-> data.frame> (survey$Smoke, survey$Exer)> stu_data <-> table> (survey$Smoke, survey$Exer)> # Print the table> print> (stu_data)> # Perform the Chi-Square Test> chi_result <-> chisq.test> (stu_data)> print> (chi_result)> # Visualize the data with a bar plot> barplot> (stu_data, beside => TRUE> , col => c> (> 'lightblue'> ,> 'lightgreen'> ),> > main => 'Smoking Habits vs Exercise Levels'> ,> > xlab => 'Exercise Level'> , ylab => 'Number of Students'> )> # Add legend separately> legend> (> 'center'> , legend => rownames> (stu_data), fill => c> (> 'lightblue'> ,> 'lightgreen'> ))> |
>
>
Lähtö:

Chi-neliötesti R:ssä
Tässä koodissa käytämmeMASS>
kirjasto suorittaa Chi-Square-testin 'kysely'-aineistosta, jossa keskitytään tupakointitottumusten ja liikunnan tasojen väliseen suhteeseen.
Se luo ehdollisuustaulukon, suorittaa tilastollisen testin ja visualisoi tiedot pylväsdiagrammin avulla. Selite on lisätty erikseen vasempaan yläkulmaan, mikä erottaa erilaiset tupakointitavat eri värein.
Koodi pyrkii tutkimaan ja viestimään aineiston sisältämiä tupakointikäyttäytymisen ja liikuntakäytäntöjen välisiä yhteyksiä.