Group_by()-funktio kuuluu R-ohjelmointikielen dplyr-pakettiin, joka ryhmittelee datakehykset. Group_by()-funktio yksinään ei anna tulosta. Sen jälkeen tulisi summarise()-funktio ja asianmukainen suoritettava toiminto. Se toimii samalla tavalla kuin GROUP BY SQL:ssä ja pivot-taulukko Excelissä.
Syntaksi:
group_by(sarake,…)
Syntaksi:
group_by(col,..) %>% summarise(action)
Käytössä oleva tietojoukko:
Sample_Superstore
Group_by() päällä a yksi sarake
Tämä on yksinkertaisin tapa ryhmitellä sarake, anna vain ryhmitettävän sarakkeen nimi group_by()-funktiossa ja tälle ryhmitetylle sarakkeelle suoritettava toiminto summarise()-funktiossa.
Esimerkki: Yhden sarakkeen ryhmittely ryhmä_by()-perusteella
kartan iterointi javassa
R
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_region = df %>%>> >summarise>(total_sales =>sum>(Sales),> >total_profits =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_region)> |
>
>
Lähtö:
Group_by() useissa sarakkeissa
Group_by()-funktio voidaan suorittaa myös kahdelle tai useammalle sarakkeelle, sarakkeiden nimien on oltava oikeassa järjestyksessä. Ryhmittely tapahtuu group_by-funktion ensimmäisen sarakkeen nimen mukaan ja sitten ryhmittely toisen sarakkeen mukaan.
Esimerkki: Useiden sarakkeiden ryhmittely
R
apurva padgaonkar
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>> >summarise>(total_Sales =>sum>(Sales),> >total_Profit =>sum>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)> |
>
>
Lähtö:
Voimme myös laskea keskiarvon, luvun, minimin tai maksimin korvaamalla summan yhteenveto- tai yhdistelmäfunktiossa. Löydämme esimerkiksi keskimääräiset myynnit ja voitot samalle ryhmälle yllä olevan esimerkin perusteella.
Esimerkki:
R
library>(dplyr)> df =>read.csv>(>'Sample_Superstore.csv'>)> df_grp_reg_cat = df %>%>> >summarise>(mean_Sales =>mean>(Sales),> >mean_Profit =>mean>(Profit),> >.groups =>'drop'>)> View>(df_grp_reg_cat)> |
>
>
Lähtö: