logo

Uuden sarakkeen lisääminen Pandasin olemassa olevaan DataFrame-kehykseen

Uusien sarakkeiden lisääminen olemassa olevaan DataFrame-kehykseen on perustehtävä data-analyysissä Pandat . Sen avulla voit rikastaa tietojasi lisätiedoilla ja helpottaa lisäanalyysiä ja käsittelyä. Tässä artikkelissa tarkastellaan erilaisia ​​tapoja lisätä uusia sarakkeita, mukaan lukien yksinkertainen määritysinsert()>menetelmä,assign()>menetelmä. Keskustellaan uusien sarakkeiden lisäämisestä Pandasin olemassa olevaan DataFrame-kehykseen.

Mikä on Pandas DataFrame?

A Pandas DataFrame on kaksiulotteinen, kokomuuttuva, mahdollisesti heterogeeninen taulukkomuotoinen tietorakenne, jossa on nimetyt akselit (rivit ja sarakkeet). Se on perustietorakenne Python-datatieteen ekosysteemissä ja tarjoaa tehokkaan tavan työskennellä taulukkotietojen kanssa.



Tässä on joitain Pandas DataFramen tärkeimpiä ominaisuuksia:

  • Tietojen esitys: Tallentaa tiedot taulukkomuodossa riveillä ja sarakkeilla.
  • Heterogeeniset tietotyypit: Voi sisältää erilaisia ​​tietotyyppejä eri sarakkeissa (esim. kokonaislukuja, liukuja, merkkijonoja, booleaneja).
  • Merkinnät: Jokaisella rivillä ja sarakkeella on tunniste (indeksin ja sarakkeen nimet).
  • Vaihteleva: Mahdollistaa tietojen käsittelyn ja muokkaamisen.
  • Tehokkaat toiminnot: Tarjoaa erilaisia ​​toimintoja ja menetelmiä tietojen analysointiin, käsittelyyn ja tutkimiseen.
  • Laajennettavissa: Voidaan mukauttaa ja laajentaa lisätoiminnoilla kirjastojen ja käyttäjän määrittämien toimintojen avulla.

On useita tapoja lisätä uusi sarake olemassa olevaan tietokehykseen Pandasissa Python :

  • Esimerkkitietokehyksen luominen
  • Käyttämällä Dataframe.insert() menetelmä
  • Käyttämällä Dataframe.assign() menetelmä
  • Sanakirjan käyttäminen
  • Listan käyttö
  • Käyttämällä .paikka()
  • Useamman kuin yhden sarakkeen lisääminen olemassa olevaan tietokehykseen

Esimerkkitietokehyksen luominen

Tässä luomme mallitietokehyksen:



Python 3






import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)>

>

>

Lähtö:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc>

Huomaa, että luettelosi pituuden tulee vastata hakemistosarakkeen pituutta, muuten se näyttää virheilmoituksen.

Lisää uusi sarake olemassa olevaan datakehykseen käyttämällä DataFrame.insert()

Se antaa vapauden lisätä sarakkeen mihin tahansa haluamaamme kohtaan, ei vain loppuun. Se tarjoaa myös erilaisia ​​vaihtoehtoja sarakearvojen lisäämiseen.

Python 3

java listaus




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)>

>

>

Lähtö:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc>

Sarakkeiden lisääminen Pandas DataFrameen käyttämällä Dataframe.assign()

Tämä menetelmä luo uuden tietokehyksen, jossa vanhaan tietokehykseen lisätään uusi sarake.

Python 3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)>

>

>

Lähtö:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pandat Lisää sarake DataFrameen sanakirjan avulla

Voimme käyttää a Python-sanakirja lisätäksesi uuden sarakkeen pandas DataFrameen. Käytä olemassa olevaa saraketta avainarvoina, ja niitä vastaavat arvot ovat uuden sarakkeen arvot.

Python 3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)>

>

>

Lähtö:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Uuden sarakkeen lisääminen Pandas DataFrameen luettelon avulla

Tässä esimerkissä Pandat lisäävät luettelosta uusia sarakkeita Osoite olemassa olevaan Pandas DataFrameen sanakirjan ja luettelon avulla.

Python 3




# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)>

>

>

Lähtö:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Lisää uusi sarake olemassa olevaan Pandas DataFrameen käyttämällä Dataframe.loc()

Tässä esimerkissä se luo Pandas DataFramen nimeltädf>sarakkeilla Nimi, Pituus ja Pätevyys ja lisää uuden sarakkeen Osoite käyttämälläloc>attribuutti.

Python 3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)>

>

>

Lähtö:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna>

Useamman kuin yhden sarakkeen lisääminen olemassa olevaan tietokehykseen

Tässä esimerkissä se laajentaa olemassa olevan Pandas DataFramendf>kahdella uudella sarakkeella, Age ja State, käyttäen vastaavia tietoluetteloita.

Python 3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)>

>

>

Lähtö:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar>

Johtopäätös

Uusien sarakkeiden lisääminen DataFrame-kehyksiin on olennaista tietojen tutkimisessa ja käsittelyssä Pandasissa. Sopivan menetelmän valinta riippuu tietystä kontekstista ja halutusta tuloksesta. Hallitsemalla näitä tekniikoita voit tehokkaasti manipuloida, analysoida ja saada arvokkaita tietojasi.