logo

Eri tapoja luoda Pandas Dataframe

Pandas DataFrame on kaksiulotteinen merkitty tietorakenne, kuten taulukko, jossa on rivejä ja sarakkeita. DataFramen koko ja arvot ovat muuttuvia, eli niitä voidaan muokata.

DataFramea käytetään enimmäkseen tietojen analysointiin ja tietojen käsittelyyn. Sen avulla voit tallentaa tietoja taulukkomuodossa, kuten SQL-tietokanta, MS Excel tai Google Sheets, mikä helpottaa aritmeettisten toimintojen suorittamista tiedoille.



Se on yleisimmin käytetty Panda-objekti. The DataFrame()-funktio käytetään DataFramen luomiseen Pandasissa. Voit myös luoda Pandas DataFramen useilla tavoilla.

Pandas Dataframe() -syntaksi

pandas.DataFrame(data, indeksi, sarakkeet)

powershell-järjestelmänvalvoja

Parametrit:

  • tiedot : Se on tietojoukko, josta DataFrame luodaan. Se voi olla luettelo, sanakirja, skalaariarvo, sarja ja taulukot jne.
  • indeksi : Se on valinnainen, oletuksena DataFramen indeksi alkaa 0:sta ja päättyy viimeiseen data-arvoon (n-1). Se määrittelee rivin nimen yksiselitteisesti.
  • sarakkeita : Tätä parametria käytetään antamaan sarakkeiden nimet DataFrame-kehyksessä. Jos sarakkeen nimeä ei ole määritetty oletusarvoisesti, se saa arvon 0 - n-1.

Palautukset:

  • DataFrame-objekti

Nyt kun olemme keskustelleet DataFrame()-funktiosta, tarkastellaan erilaisia ​​tapoja luoda DataFrame:



Eri tapoja luoda tietokehys Pythonissa

On olemassa useita tapoja luoda a Pandas Dataframe sisään Python . Voit luoda DataFramen seuraavilla tavoilla:

  • Luo Pandas DataFrame DataFrame()-funktiolla
  • Luo Pandas DataFrame luetteloluettelosta
  • Luo Pandas DataFrame ndarray/list-sanakirjasta
  • Luo Pandas DataFrame sanakirjaluettelosta
  • Luo Pandas DataFrame Series-sanakirjasta
  • DataFramen luominen zip()-funktiolla
  • DataFrame-kehyksen luominen todistamalla indeksitunniste nimenomaisesti

Luo tyhjä DataFrame käyttämällä DataFrame()-menetelmää

Pythonin DataFrame voidaan luoda DataFrame()-funktiolla Pandan kirjasto . Luo DataFrame kutsumalla funktiota DataFrame-konstruktorilla.

Esimerkki : Luodaan tyhjä DataFrame Pythonin DataFrame()-funktiolla



Python 3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

Lähtö:

Empty DataFrame Columns: [] Index: []>

Luo DataFrame luetteloluetteloista

Pandas DataFramen luominen a lista luetteloista, voit käyttää pd.DataFrame()-funktiota. Tämä toiminto ottaa syötteeksi luettelon luetteloista ja luo DataFramen, jossa on sama määrä rivejä ja sarakkeita kuin syöttöluettelossa.

Esimerkki : DataFrame-kehyksen luominen luetteloluetteloista käyttämällä DataFrame()-menetelmää

Python 3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

>

arraylist menetelmät
>

Lähtö:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

Luo DataFrame sanakirjasta ndArray/Lists

Luodaksesi DataFrame-kehyksen a sanakirja / ndarrays /lists, kaikkien taulukoiden on oltava samanpituisia. Jos indeksi välitetään, pituusindeksin tulee olla yhtä suuri kuin taulukoiden pituus.

Jos indeksiä ei välitetä, indeksi on oletusarvoisesti alue(n), jossa n on taulukon pituus.

Esimerkki : DataFramen luominen ndarray/lists-sanakirjasta

Python 3




# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

>

Lähtö:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

Huomautus: Kun luot DataFramea sanakirjan avulla, sanakirjan avaimet ovat oletuksena sarakkeiden nimiä. Voimme myös antaa sarakkeiden nimet eksplisiittisesti käyttämällä sarakeparametria.

Luo DataFrame sanakirjaluettelosta

Pandas DataFrame voidaan luoda ohittamalla luettelot sanakirjoista syöttötietona. Oletusarvoisesti sanakirjan avaimia pidetään sarakkeina.

Python 3




# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

>

Lähtö:

a b c 0 1 2 3 1 10 20 30>

Toinen esimerkki on Pandas DataFrame -kehyksen luominen välittämällä luetteloita sanakirjoista ja riviindeksit .

Python 3




kuinka avata tiedosto javassa

# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

Lähtö:

b c a first 2 3 NaN second 20 30 10.0>

Luo DataFrame Series-sanakirjasta

DataFramen luominen sanakirjasta sarja , sanakirja voidaan välittää DataFrame-kehyksen muodostamiseksi. Tuloksena oleva indeksi on kaikkien hyväksyttyjen indeksoitujen sarjojen liitto.

Esimerkki: DataFramen luominen sarjasanakirjasta.

Python 3


mitä pythonissa on



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

Lähtö:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

Luo DataFrame zip()-funktiolla

Kaksi luetteloa voidaan yhdistää käyttämällä zip()-funktio . Luo nyt Pandas DataFrame kutsumalla pd.DataFrame()-funktiota.

Esimerkki: DataFramen luominen zip()-funktiolla.

Python 3




# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

Lähtö:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

Luo DataFrame todistamalla indeksitunniste nimenomaisesti

Voit luoda DataFrame-kehyksen antamalla indeksitunnisteen nimenomaisesti käyttämällä pd.DataFrame()-konstruktorin indeksiparametria. Indeksiparametri ottaa syötteeksi luettelon indeksitunnisteista, ja DataFrame käyttää näitä tunnisteita DataFramen riveille.

Esimerkki: DataFrame-kehyksen luominen todistamalla indeksitunniste nimenomaisesti

Python 3


kuplalajittelu algoritmissa



# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

Lähtö:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

Johtopäätös

Python Pandas DataFrame on samanlainen kuin taulukko, jossa on rivejä ja sarakkeita. Se on kaksiulotteinen tietorakenne ja on erittäin hyödyllinen tietojen analysointiin ja käsittelyyn.

Tässä opetusohjelmassa olemme keskustelleet useista tavoista luoda Pandas DataFrame. Tämän opetusohjelman avulla pystyt käsittelemään kaikki monimutkaiset DataFramen luomisen vaatimukset.