logo

Python | Pandas DataFrame.set_index()

Tässä artikkelissa käsittelemme Pandas DataFrame.set_index() Pythonissa. Python erottuu erinomaisena kielenä tietojen analysointiin, mikä johtuu suurelta osin erinomaisesta tietokeskeisten pakettien ekosysteemistä. Näistä paketeista mm. Pandat Sillä on merkittävä rooli tiedon tuonnin ja analysoinnin yksinkertaistamisessa.

Pandas DataFrame.set_index() Syntaksi

Syntaksi: DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)



Parametrit:

  • avaimet: Sarakkeen nimi tai luettelo sarakkeiden nimistä.
  • pudota: Boolen arvo, joka, jos se on tosi, pudottaa indeksissä käytetyn sarakkeen.
  • liitä: Jos True, lisää määritetty sarake olemassa olevaan hakemistosarakkeeseen.
  • paikallaan: Jos True, muutokset tehdään itse DataFrameen.
  • verify_integrity: Jos tosi, tarkistaa uudessa hakemistosarakkeessa kaksoiskappaleita.

Mikä on Pandas DataFrame.set_index()?

Pandas Dataframe. set_index() -menetelmää käytetään listan, sarjan tai muun datakehyksen määrittämiseen tietyn datakehyksen indeksiksi. Se on erityisen hyödyllinen, kun yhdistetään useita tietokehyksiä, mikä mahdollistaa indeksin helpon muokkaamisen. Vaikka indeksisarake voidaan määrittää tietokehyksen luomisen aikana, set_index() tarjoaa joustavan tavan muuttaa indeksiä myöhemmin. Pohjimmiltaan sen avulla voit asettaa lista-, sarja- tai datakehyksen tietokehyksen indeksiksi. Mutta joskus datakehys tehdään kahdesta tai useammasta datakehyksestä, joten myöhempää indeksiä voidaan muuttaa tällä menetelmällä.

Lataa käytetty CSV-tiedosto napsauttamalla Tässä.



Pandas DataFrame.set_index() Esimerkkejä

Alla on oikeat kuvat Pandas DataFrame.set_index()-esimerkeistä.

  • Pandat Aseta indeksi sarakkeeseen
  • Useita indeksisarakkeita
  • Singlen asettaminen Kelluva pylväs indeksinä
  • Asetus kolme saraketta kuten MultiIndex
  • Pandas Aseta tietyn sarakkeen indeksi

Pandat Aseta indeksi sarakkeeseen

Tässä esimerkissä olemme muuttamassa indeksisaraketta, Etunimi-sarakkeesta on tehty tietokehyksen indeksisarake.

Python 3






# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()>

>

>

b+ puu

Lähtö : Ennen käyttöä -

Leikkauksen jälkeen -

Kuten tuloskuvista näkyy, aiemmin indeksisarake oli numerosarja, mutta myöhemmin se on korvattu etunimellä.

Pandat Aseta indeksi useaan indeksisarakkeeseen

Tässä esimerkissä kaksi saraketta tehdään indeksisarakkeeksi. Pudota-parametrilla pudotetaan sarake ja append-parametrilla liitetään välitetyt sarakkeet jo olemassa olevaan indeksisarakkeeseen.

Python 3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()>

lajittele taulukko java

>

>

Lähtö:

Kuten tuloskuvassa näkyy, tiedoissa on 3 indeksisaraketta.

Pandas Dataframe Index Singlin asettaminen Float-pylväs indeksinä

Tässä esimerkissä alla oleva koodinpätkä käyttää Pandas-kirjastoa luomaan tietokehyksen nimeltä 'df' oppilaiden tietojen sisäkkäisestä luettelosta. Se asettaa Agg_Marks-sarakkeen indeksiksi ja näyttää tuloksena olevan DataFramen sarakkeineen 'Nimi', 'Ikä', 'Kaupunki' ja 'Maa'.

Python 3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df>

>

>

Lähtö:

 Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>

Yllä olevassa esimerkissä asetamme sarakkeen ' Agg_Marks ' tietokehyksen indeksinä.

Pandas Dataframe -indeksiasetus kolme saraketta kuten Moniindeksi

Tässä esimerkissä alla oleva koodi käyttää Pandasta DataFrame 'df' -kehyksen luomiseen oppilaiden tiedoista sarakkeilla 'Nimi', 'Ikä', 'Kaupunki', 'Maa', 'Agg_Marks' ja 'ID'. Se käyttää set_index()-funktiota monitasoisen indeksin luomiseen käyttämällä 'Nimi', 'Kaupunki' ja 'ID', ja näyttää sitten tuloksena olevan DataFramen.

Python 3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df>

java kuinka muuntaa merkkijono int
>

>

Lähtö:

 Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>

Yllä olevassa esimerkissä asetamme sarakkeet ' Nimi ',' Kaupunki ', ja ' ID ' tietokehyksen moniindeksinä.

Pandas Aseta tietyn sarakkeen indeksi

Tässä esimerkissä alla oleva koodi näyttää, kuinka Pandasta käytetään DataFrame-kehyksen luomiseen, määritetään tietty sarake (tässä tapauksessa 'Nimi') indeksiksi käyttämälläset_index()>-menetelmällä ja näyttää sitten sekä alkuperäiset että muokatut DataFrame-kehykset. Theinplace=True>Parametri varmistaa, että muutokset otetaan käyttöön suoraan DataFrame-kehyksessä ilman, että niitä tarvitsee määrittää uudelleen.

Python 3




import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>' DataFrame after set_index:'>)> print>(df)>

>

>

Lähtö:

Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>