Voimme suorittaa lajittelun Pandas Dataframessa. Tässä artikkelissa käsitellään Pandas DataFrame -kehyksen lajittelua eri menetelmillä Python .
Tietokehysten lajittelu Pandasissa
Luodaan a Pandas Dataframe Demonstraatiota varten Täällä olemme luoneet tietokehyksen, jossa suoritamme erilaisia lajittelutoimintoja.
Python 3
leijonan ja tiikerin vertailu
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df> |
>
>
Lähtö

Lajittele Pandas DataFrame
Pandas-tietokehyksen lajittelu
Tietokehyksen lajittelemiseksi pandassa funktio sort_values() käytetään. Pandat sort_values() voi lajitella tietokehyksen nousevaan tai laskevaan järjestykseen.
Pandas DataFrame Lajittelu nousevaan järjestykseen
Koodinpätkä lajittelee DataFrame df:n nousevaan järjestykseen Maa-sarakkeen perusteella. Se ei kuitenkaan tallenna tai näytä lajiteltua datakehystä.
Python 3
# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])> |
>
>
Lähtö:

Lajittele Pandas DataFrame
Pandas DataFrame -kehyksen lajittelu laskevassa järjestyksessä
DataFrame df lajitellaan laskevaan järjestykseen Population-sarakkeen perusteella. Suurimman väestömäärän maa näkyy DataFrame-kehyksen yläosassa.
Python 3
# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)> |
>
hashset vs hashmap
>
Lähtö:

Lajittele Pandas DataFrame
Lajittele Pandas DataFrame näytteenoton perusteella
Tässä lajittelemme DataFramea (df>) Perustuu Väestö-sarakkeeseen, järjestämällä rivit, joilla on puuttuvat arvot Väestö-kohdassa näkymään ensin. Thesort_values()>menetelmän kanssana_position='first'>argumentti saavuttaa tämän priorisoimalla rivit, joista puuttuu arvoja lajitellun DataFrame-kehyksen alussa.
Python 3
# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)> |
>
>
Lähtö:

Lajittele Pandas DataFrame
Tietokehysten lajittelu useiden sarakkeiden mukaan
Tässä esimerkissä lajittelemme DataFrame (df>) ensisijaisesti Maa-sarakkeen mukaan nousevassa järjestyksessä ja kussakin maaryhmässä Manner-sarakkeessa. Tuloksena oleva DataFrame lajitellaan määritetyn sarakejärjestyksen perusteella, jolloin luodaan lajiteltu tietojoukko.
Python 3
# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])> |
>
mikroliittinen ydin
>
Lähtö:

Lajittele Pandas DataFrame
Tietokehysten lajittelu sarakkeiden mukaan, mutta eri järjestyksessä
Tässä esimerkissä lajittelemme DataFrame (df>) ensin Maa-sarakkeella laskevassa järjestyksessä ja kussakin maaryhmässä Manner-sarakkeella nousevassa järjestyksessä. Tuloksena oleva DataFrame järjestetään määritettyjen sarakkeiden lajittelukriteerien perusteella.
Python 3
# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])> |
>
>
Lähtö:

Lajittele Pandas DataFrame