logo

Tapoja suodattaa Pandas DataFrame sarakearvojen mukaan

Pandas DataFrame -kehyksen suodattaminen sarakearvojen avulla on tavallinen toimenpide, kun tietoja käytetään Pythonissa. Voit käyttää erilaisia ​​menetelmiä ja tekniikoita saavuttaaksesi tämän. Tässä on useita tapoja suodattaa Pandas DataFrame sarakearvojen avulla.

Tässä viestissä näemme erilaisia ​​tapoja suodattaa Pandas Dataframe sarakearvojen mukaan. Luodaan ensin tietokehys:



Python 3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Lähtö:

Datakehys

Pandas Dataframen rivien valitseminen tietyn sarakkeen arvon perusteella käyttämällä operaattoria '>', '=', '=', '<=', '!='.

Esimerkki 1: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'prosentti' on suurempi kuin 75 käyttämällä [ ] .

Python 3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Lähtö:

lähtötietokehys

Esimerkki 2: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa prosenttiosuus on suurempi kuin 70 paikka [ ] .

Python 3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Lähtö:

lähtö datakehys-1

Valitsemalla ne Pandas Dataframe -kehyksen rivit, joiden sarakkeen arvo on luettelossa, käyttämällä sinä() tietokehyksen menetelmä.

Esimerkki 1: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'Stream' on asetusluettelossa, käyttämällä [ ] .

Python 3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Lähtö:

lähtö datakehys-2

Esimerkki 2: Valitsemalla annetusta tietokehyksestä kaikki rivit, joissa 'Stream' on asetusluettelossa, käyttämällä paikka [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Lähtö:

lähtö datakehys-3

Pandas Dataframen rivien valinta useiden sarakeehtojen perusteella käyttämällä &-operaattoria.

Esimerkki1: Valitse annetusta tietokehyksestä kaikki rivit, joissa 'Ikä' on yhtä suuri kuin 22 ja 'Stream' on vaihtoehtoluettelossa käyttämällä [ ] .

Python 3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Lähtö:

lähtö datakehys-4

Esimerkki 2: Valitse annetusta tietokehyksestä kaikki rivit, joissa 'Ikä' on yhtä suuri kuin 22 ja 'Stream' on vaihtoehtoluettelossa käyttämällä paikka [ ] .

Python 3




java muuntaa charin int

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Lähtö:

lähtö datakehys-5