RYHMITTELE TOIMINNON MUKAAN R:SSÄ DPLYR-SOVELLUKSELLA - TECHCODEVIEW.COM

Group_by()-funktio kuuluu R-ohjelmointikielen dplyr-pakettiin, joka ryhmittelee datakehykset. Group_by()-funktio yksinään ei anna tulosta. Sen jälkeen tulisi summarise()-funktio ja asianmukainen suoritettava toiminto. Se toimii samalla tavalla kuin GROUP BY SQL:ssä ja pivot-taulukko Excelissä.

Syntaksi:

group_by(sarake,…)

Syntaksi:

group_by(col,..) %>% summarise(action)

Käytössä oleva tietojoukko:

Sample_Superstore

Group_by() päällä a yksi sarake

Tämä on yksinkertaisin tapa ryhmitellä sarake, anna vain ryhmitettävän sarakkeen nimi group_by()-funktiossa ja tälle ryhmitetylle sarakkeelle suoritettava toiminto summarise()-funktiossa.

Esimerkki: Yhden sarakkeen ryhmittely ryhmä_by()-perusteella

kartan iterointi javassa

R

library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>>(Region) %>%> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)>

Lähtö:

Group_by() useissa sarakkeissa

Group_by()-funktio voidaan suorittaa myös kahdelle tai useammalle sarakkeelle, sarakkeiden nimien on oltava oikeassa järjestyksessä. Ryhmittely tapahtuu group_by-funktion ensimmäisen sarakkeen nimen mukaan ja sitten ryhmittely toisen sarakkeen mukaan.

Esimerkki: Useiden sarakkeiden ryhmittely

R

apurva padgaonkar

library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>>(Region, Category) %>%> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

Lähtö:

Voimme myös laskea keskiarvon, luvun, minimin tai maksimin korvaamalla summan yhteenveto- tai yhdistelmäfunktiossa. Löydämme esimerkiksi keskimääräiset myynnit ja voitot samalle ryhmälle yllä olevan esimerkin perusteella.

Esimerkki:

R

library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>>(Region, Category) %>%> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

Lähtö:

TechCodeview

Ryhmittele funktion mukaan R:ssä Dplyr:n avulla

Group_by() päällä a yksi sarake

R

Group_by() useissa sarakkeissa

R

R