logo

Python Pandas -sarja

Pandas-sarja voidaan määritellä yksiulotteiseksi taulukoksi, joka pystyy tallentamaan erilaisia ​​tietotyyppejä. Voimme helposti muuntaa luettelon, monikon ja sanakirjan sarjoiksi käyttämällä ' sarja ' menetelmällä. Sarjojen rivitunnisteita kutsutaan indekseiksi. Sarja ei voi sisältää useita sarakkeita. Siinä on seuraava parametri:

    tiedot:Se voi olla mikä tahansa luettelo-, sanakirja- tai skalaariarvo.indeksi:Indeksin arvon tulee olla yksilöllinen ja hajautuskelpoinen. Sen on oltava yhtä pitkä kuin data. Jos emme läpäise yhtään indeksiä, oletusarvo np.arrange(n) käytetään.dtype:Se viittaa sarjan tietotyyppiin.kopio:Sitä käytetään tietojen kopioimiseen.

Sarjan luominen:

Voimme luoda sarjan kahdella tavalla:

  1. Luo tyhjä sarja
  2. Luo sarja syötteiden avulla.

Luo tyhjä sarja:

Voimme helposti luoda tyhjän sarjan Pandasissa, mikä tarkoittaa, että sillä ei ole arvoa.

Syntaksi, jota käytetään tyhjän sarjan luomiseen:

 = pandas.Series() 

Alla oleva esimerkki luo Empty Series -tyyppisen objektin, jolla ei ole arvoja ja jolla on oletustietotyyppi, eli kellua64 .

kuinka iso tämä näyttö on

Esimerkki

 import pandas as pd x = pd.Series() print (x) 

Lähtö

 Series([], dtype: float64) 

Sarjan luominen syötteiden avulla:

Voimme luoda sarjoja käyttämällä erilaisia ​​syötteitä:

  • Array
  • Dict
  • Skalaariarvo

Sarjan luominen Arraysta:

rivi autocad-komento

Ennen kuin luot sarjan, meidän on ensin tuotava nuhjuinen moduuli ja käytä sitten array()-funktiota ohjelmassa. Jos data on ndarray, niin välitetyn indeksin on oltava samanpituinen.

Jos emme välitä indeksiä, niin oletusarvoisesti indeksi alue(n) välitetään, missä n määrittää taulukon pituuden, eli [0,1,2,.... alue(len(matriisi))-1 ].

Esimerkki

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Lähtö

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Luo sarja dictistä

Voimme myös luoda sarjan diktatuurista. Jos sanakirjaobjekti välitetään syötteenä eikä indeksiä ole määritetty, sanakirjan avaimet otetaan lajiteltuun järjestykseen indeksin muodostamiseksi .

Jos indeksi hyväksytään, arvot vastaavat tiettyä nimiötä hakemistosta poimitaan sanakirja .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Lähtö

 x 0.0 y 1.0 z 2.0 dtype: float64 

Luo sarja skalaarilla:

Jos otamme skalaariarvot, indeksi on annettava. Skalaariarvo toistetaan indeksin pituuden mukaiseksi.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Lähtö

 0 4 1 4 2 4 3 4 dtype: int64 

Tietojen käyttö sarjoista, joissa on Position:

Kun olet luonut Series type -objektin, voit käyttää sen indeksejä, tietoja ja jopa yksittäisiä elementtejä.

kuinka osoittimen viittaus poistetaan kohdassa c

Sarjan dataa voidaan käyttää samalla tavalla kuin ndarrayssa.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Lähtö

 1 

Sarjan objektin attribuutit

Series-attribuutilla määritellään kaikki Series-objektiin liittyvät tiedot, kuten koko, tietotyyppi. jne. Alla on joitain attribuutteja, joita voit käyttää saadaksesi tietoja Series-objektista:

Attribuutit Kuvaus
Series.index Määrittää sarjan indeksin.
Sarja.muoto Se palauttaa datan muodon.
Series.dtype Se palauttaa tietojen tietotyypin.
Sarja.koko Se palauttaa datan koon.
Sarja.tyhjä Se palauttaa True, jos Series-objekti on tyhjä, muussa tapauksessa palauttaa epätosi.
Sarja.hasnans Se palauttaa True, jos NaN-arvoja on, muussa tapauksessa palauttaa epätosi.
Series.nbytes Se palauttaa tiedoissa olevien tavujen määrän.
Sarja olen Se palauttaa datassa olevien ulottuvuuksien määrän.
Series.itemsize Se palauttaa kohteen tietotyypin koon.

Haetaan sarjaobjektin indeksitaulukkoa ja tietotaulukkoa

Voimme noutaa olemassa olevan Series-objektin indeksitaulukon ja datataulukon käyttämällä attribuutteja indeksi ja arvot.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Lähtö

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Tyyppien (dtype) ja tyypin koon (itemsize) haku

Voit käyttää attribuuttia dtype Series-objektin kanssa dtypenä sarjaobjektin yksittäisen elementin tietotyypin hakemiseen, voit käyttää kohteita attribuutti näyttää kullekin tietokohdalle varattujen tavujen määrän.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Lähtö

leijuva css
 int64 8 float64 8 

Haetaan muotoa

Series-objektin muoto määrittää elementtien kokonaismäärän, mukaan lukien puuttuvat tai tyhjät arvot (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Lähtö

 (4,) (3,) 

Noudetaan mitta, koko ja tavumäärä:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Lähtö

 1 1 4 3 32 24 

NaN:ien tyhjyyden ja läsnäolon tarkistaminen

Voit tarkistaa, onko Series-objekti tyhjä, käyttämällä tyhjä attribuutti . Vastaavasti voit tarkistaa, sisältääkö sarjaobjekti joitain NaN-arvoja vai ei, käyttämällä hassan attribuutti.

java-iteraattori kartalle

Esimerkki

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Lähtö

 False False True True False False 4 3 3 3 

Sarjan toiminnot

Sarjassa käytetään joitain toimintoja, jotka ovat seuraavat:

Toiminnot Kuvaus
Pandas Series.map() Kartoita arvot kahdesta sarjasta, joilla on yhteinen sarake.
Pandas Series.std() Laske annetun numerojoukon, DataFrame-, sarakkeen ja rivien keskihajonta.
Pandas Series.to_frame() Muunna sarjaobjekti datakehykseksi.
Pandas Series.value_counts() Palauttaa sarjan, joka sisältää yksilöllisiä arvoja.