logo

Yhden tai useamman sarakkeen pudottaminen Pandas Dataframeen

Keskustellaan siitä, kuinka yksi tai useampi sarake pudotetaan Pandas Dataframeen. Sarakkeen poistaminen kohteesta a Pandas DataFrame tai Pudota yksi tai useampi sarake Pandas Dataframeen voidaan saavuttaa useilla tavoilla.

Pudota yksi tai useita sarakkeita Pandas Dataframeen

On olemassa useita menetelmiä yhden tai useamman sarakkeen pudottamiseksi Pandas Dataframeen, keskustelemme joistakin yleisesti käytetyistä menetelmistä yhden tai useamman sarakkeen pudottamiseksi Pandas Dataframessa. Nämä ovat seuraavat:

  • Käytä df.drop()-menetelmää
  • Käyttämällä Iloc[] Menetelmä
  • Käyttämällä df.ix() menetelmä
  • Käyttämällä df.loc[] Menetelmä
  • Iteratiivisen menetelmän käyttäminen
  • Käyttämällä Dataframe.pop() Menetelmä

Luo DataFrame

Ensin luomme yksinkertaisen tietokehyksen, jossa on luettelojen sanakirja, sanotaanko sarakkeiden nimet ovat A, B, C, D, E . Tässä artikkelissa käsitellään 6 eri menetelmää joidenkin sarakkeiden poistamiseksi Pandas DataFramesta.



tee javan aikana
Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df>

Lähtö:

 A B C D E   0   A1 B1 C1 D1 E1   1   A2 B2 C2 D2 E2   2   A3 B3 C3 D3 E3   3   A4 B4 C4 D4 E4   4   A5 B5 C5 D5 E5>

Tietokehyksen pudotussarake Pandasissa käyttäen df.drop()-menetelmää

Esimerkki 1: Tässä esimerkissä poistamme tietyt yksittäiset sarakkeet alla olevan koodin mukaisesti Pandat luodaksesi DataFrame-kehyksen sanakirjasta ja poistaa sitten sarakkeen A käyttämällädrop>menetelmän kanssaaxis=1>. On kuitenkin tärkeää huomata, että alkuperäinen DataFrame ('df') pysyy muuttumattomana, elleiinplace=True>parametria käytetään tai tulos palautetaan arvoon 'df'.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove column name 'A' df.drop(['A'], axis=1)>

Lähtö:

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Esimerkki 2: Tässä esimerkissä poista tietyt useat sarakkeet, koska alla oleva koodi käyttää Pandasta DataFramen luomiseen sanakirjasta ja poistaa sitten sarakkeet C ja D käyttämällädrop>menetelmän kanssaaxis=1>. Huomaa kuitenkin, että alkuperäinen DataFrame ('df') pysyy muuttumattomana, ellei tulosta määritetä takaisin taiinplace=True>käytetään. Vaihtoehtoisesti sama toimenpide voidaan suorittaa käyttämällädf.drop(columns=['C', 'D'])>.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove two columns name is 'C' and 'D' df.drop(['C', 'D'], axis=1) # df.drop(columns =['C', 'D'])>

Lähtö:

   A B E  0 A1 B1 E1 1 A2 B2 E2 2 A3 B3 E3 3 A4 B4 E4 4 A5 B5 E5>

Esimerkki 3: Tässä esimerkissä Poista sarakkeet sarakeindeksin perusteella, sillä alla oleva koodi luo Pandas DataFrame -kehyksen sanakirjasta ja poistaa kolme saraketta ('A', 'E', 'C') niiden indeksipaikkojen perusteella käyttämällä 'pudota'-menetelmää ja ' akseli = 1`. Muokattu DataFrame näytetään, ja muutokset tehdään paikoilleen (`inplace=True`).

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove three columns as index base df.drop(df.columns[[0, 4, 2]], axis=1, inplace=True) df>

Lähtö:

   B D  0 B1 D1 1 B2 D2 2 B3 D3 3 B4 D4 4 B5 D5>

Tietokehyksen pudotussarakkeet Pandasissa käyttämällä df.iloc[] -menetelmää

Tässä esimerkissä Poista sarakkeet tiettyjen aloitus- ja loppusarakkeiden väliltä, ​​sillä alla oleva koodi käyttää Pandasta DataFramen luomiseen sanakirjasta ja poistaa sitten kaikki sarakkeet sarakeindeksien 1–3 väliltä käyttämällädrop>menetelmän kanssaaxis=1>. Muutokset tehdään paikoilleen (inplace=True>), ja muokattu DataFrame tulee näkyviin.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column index 1 to 3 df.drop(df.iloc[:, 1:3], inplace=True, axis=1) df>

Lähtö:

 A D E 0 A1 D1 E1 1 A2 D2 E2 2 A3 D3 E3 3 A4 D4 E4 4 A5 D5 E5>

Pandas Pudota sarakkeet Dataframesta df.ix()-menetelmällä

Tässä esimerkissä Poista sarakkeet tiettyjen sarakkeiden nimien väliltä, ​​koska alla oleva koodi Pandaa käyttämällä luo DataFrame-kehyksen sanakirjasta ja poistaa kaikki sarakkeet sarakkeiden nimien 'B' - 'D' välillä käyttämällädrop>menetelmän kanssaaxis=1>. Alkuperäinen DataFrame ('df') pysyy kuitenkin muuttumattomana, ellei tulosta määritetä takaisin taiinplace=True>käytetään.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.ix[:, 'B':'D'].columns, axis=1)>

Lähtö:

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Pandas Pudota sarakkeet Dataframesta df.loc[]-menetelmällä

Tässä esimerkissä pudota sarakkeet tiettyjen sarakkeiden nimien väliin alla koodin käyttöä Pandat luoda DataFrame sanakirjasta ja poistaa sitten kaikki sarakkeet sarakkeiden nimien 'B' ja 'D' välillä käyttämällädrop>menetelmän kanssaaxis=1>. Muokattua DataFrame-kehystä ei määrätä takaisin millekään muuttujalle, ja alkuperäinen DataFrame pysyy muuttumattomana.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) # Remove all columns between column name 'B' to 'D' df.drop(df.loc[:, 'B':'D'].columns, axis=1)>

Lähtö:

 A E 0 A1 E1 1 A2 E2 2 A3 E3 3 A4 E4 4 A5 E5>

Huomautus: Erilaiset loc() ja iloc() ovat iloc() sulkevat pois viimeisen sarakealueen elementin.

Pandas pudottaa sarakkeita Dataframista iteratiivisella menetelmällä

Tässä esimerkissä poista sarakkeita tiettyjen sarakkeiden nimien välillä, koska alla oleva koodi luo Pandas DataFrame -kehyksen a sanakirja ja iteroituu sarakkeidensa läpi. Jokaisen sarakkeen kohdalla, jos sarakkeen nimessä on kirjain 'A', kyseinen sarake poistetaan DataFrame-kehyksestä. Tuloksena oleva muokattu DataFrame näytetään.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) for col in df.columns: if 'A' in col: del df[col] df>

Lähtö:

 B C D E 0 B1 C1 D1 E1 1 B2 C2 D2 E2 2 B3 C3 D3 E3 3 B4 C4 D4 E4 4 B5 C5 D5 E5>

Dataframe-pudotussarake Pandasissa käyttämällä Dataframe.pop() -menetelmää

Tässä esimerkissä Tietyn sarakkeen poistaminen DataFramesta, koska koodi osoittaa, kuinka tietty sarake ('B') poistetaan sanakirjasta luodusta Pandas DataFrame -kehyksestä. Se käyttää pop> menetelmä ja tuloksena saatu muokattu DataFrame tulee näkyviin.

Python
# Import pandas package import pandas as pd # create a dictionary with five fields each data = { 'A': ['A1', 'A2', 'A3', 'A4', 'A5'], 'B': ['B1', 'B2', 'B3', 'B4', 'B5'], 'C': ['C1', 'C2', 'C3', 'C4', 'C5'], 'D': ['D1', 'D2', 'D3', 'D4', 'D5'], 'E': ['E1', 'E2', 'E3', 'E4', 'E5']} # Convert the dictionary into DataFrame df = pd.DataFrame(data) df.pop('B') df>

Lähtö:

A C D E 0 A1 C1 D1 E1 1 A2 C2 D2 E2 2 A3 C3 D3 E3 3 A4 C4 D4 E4 4 A5 C5 D5 E5>