logo

Ryhmittele funktion mukaan R:ssä Dplyr:n avulla

Group_by()-funktio kuuluu R-ohjelmointikielen dplyr-pakettiin, joka ryhmittelee datakehykset. Group_by()-funktio yksinään ei anna tulosta. Sen jälkeen tulisi summarise()-funktio ja asianmukainen suoritettava toiminto. Se toimii samalla tavalla kuin GROUP BY SQL:ssä ja pivot-taulukko Excelissä.

Syntaksi:



group_by(sarake,…)

Syntaksi:

group_by(col,..) %>% summarise(action)



Käytössä oleva tietojoukko:

Sample_Superstore

Group_by() päällä a yksi sarake

Tämä on yksinkertaisin tapa ryhmitellä sarake, anna vain ryhmitettävän sarakkeen nimi group_by()-funktiossa ja tälle ryhmitetylle sarakkeelle suoritettava toiminto summarise()-funktiossa.



Esimerkki: Yhden sarakkeen ryhmittely ryhmä_by()-perusteella

kartan iterointi javassa

R




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>>(Region) %>%> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)>

>

>

Lähtö:

Group_by() useissa sarakkeissa

Group_by()-funktio voidaan suorittaa myös kahdelle tai useammalle sarakkeelle, sarakkeiden nimien on oltava oikeassa järjestyksessä. Ryhmittely tapahtuu group_by-funktion ensimmäisen sarakkeen nimen mukaan ja sitten ryhmittely toisen sarakkeen mukaan.

Esimerkki: Useiden sarakkeiden ryhmittely

R




apurva padgaonkar
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>>(Region, Category) %>%> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

Lähtö:

Voimme myös laskea keskiarvon, luvun, minimin tai maksimin korvaamalla summan yhteenveto- tai yhdistelmäfunktiossa. Löydämme esimerkiksi keskimääräiset myynnit ja voitot samalle ryhmälle yllä olevan esimerkin perusteella.

Esimerkki:

R




library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>>(Region, Category) %>%> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)>

>

>

Lähtö: