Pandas-sarja voidaan määritellä yksiulotteiseksi taulukoksi, joka pystyy tallentamaan erilaisia tietotyyppejä. Voimme helposti muuntaa luettelon, monikon ja sanakirjan sarjoiksi käyttämällä ' sarja ' menetelmällä. Sarjojen rivitunnisteita kutsutaan indekseiksi. Sarja ei voi sisältää useita sarakkeita. Siinä on seuraava parametri:
Sarjan luominen:
Voimme luoda sarjan kahdella tavalla:
- Luo tyhjä sarja
- Luo sarja syötteiden avulla.
Luo tyhjä sarja:
Voimme helposti luoda tyhjän sarjan Pandasissa, mikä tarkoittaa, että sillä ei ole arvoa.
Syntaksi, jota käytetään tyhjän sarjan luomiseen:
= pandas.Series()
Alla oleva esimerkki luo Empty Series -tyyppisen objektin, jolla ei ole arvoja ja jolla on oletustietotyyppi, eli kellua64 .
kuinka iso tämä näyttö on
Esimerkki
import pandas as pd x = pd.Series() print (x)
Lähtö
Series([], dtype: float64)
Sarjan luominen syötteiden avulla:
Voimme luoda sarjoja käyttämällä erilaisia syötteitä:
- Array
- Dict
- Skalaariarvo
Sarjan luominen Arraysta:
rivi autocad-komento
Ennen kuin luot sarjan, meidän on ensin tuotava nuhjuinen moduuli ja käytä sitten array()-funktiota ohjelmassa. Jos data on ndarray, niin välitetyn indeksin on oltava samanpituinen.
Jos emme välitä indeksiä, niin oletusarvoisesti indeksi alue(n) välitetään, missä n määrittää taulukon pituuden, eli [0,1,2,.... alue(len(matriisi))-1 ].
Esimerkki
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Lähtö
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Luo sarja dictistä
Voimme myös luoda sarjan diktatuurista. Jos sanakirjaobjekti välitetään syötteenä eikä indeksiä ole määritetty, sanakirjan avaimet otetaan lajiteltuun järjestykseen indeksin muodostamiseksi .
Jos indeksi hyväksytään, arvot vastaavat tiettyä nimiötä hakemistosta poimitaan sanakirja .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Lähtö
x 0.0 y 1.0 z 2.0 dtype: float64
Luo sarja skalaarilla:
Jos otamme skalaariarvot, indeksi on annettava. Skalaariarvo toistetaan indeksin pituuden mukaiseksi.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Lähtö
0 4 1 4 2 4 3 4 dtype: int64
Tietojen käyttö sarjoista, joissa on Position:
Kun olet luonut Series type -objektin, voit käyttää sen indeksejä, tietoja ja jopa yksittäisiä elementtejä.
kuinka osoittimen viittaus poistetaan kohdassa c
Sarjan dataa voidaan käyttää samalla tavalla kuin ndarrayssa.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Lähtö
1
Sarjan objektin attribuutit
Series-attribuutilla määritellään kaikki Series-objektiin liittyvät tiedot, kuten koko, tietotyyppi. jne. Alla on joitain attribuutteja, joita voit käyttää saadaksesi tietoja Series-objektista:
Attribuutit | Kuvaus |
---|---|
Series.index | Määrittää sarjan indeksin. |
Sarja.muoto | Se palauttaa datan muodon. |
Series.dtype | Se palauttaa tietojen tietotyypin. |
Sarja.koko | Se palauttaa datan koon. |
Sarja.tyhjä | Se palauttaa True, jos Series-objekti on tyhjä, muussa tapauksessa palauttaa epätosi. |
Sarja.hasnans | Se palauttaa True, jos NaN-arvoja on, muussa tapauksessa palauttaa epätosi. |
Series.nbytes | Se palauttaa tiedoissa olevien tavujen määrän. |
Sarja olen | Se palauttaa datassa olevien ulottuvuuksien määrän. |
Series.itemsize | Se palauttaa kohteen tietotyypin koon. |
Haetaan sarjaobjektin indeksitaulukkoa ja tietotaulukkoa
Voimme noutaa olemassa olevan Series-objektin indeksitaulukon ja datataulukon käyttämällä attribuutteja indeksi ja arvot.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Lähtö
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Tyyppien (dtype) ja tyypin koon (itemsize) haku
Voit käyttää attribuuttia dtype Series-objektin kanssa dtypenä sarjaobjektin yksittäisen elementin tietotyypin hakemiseen, voit käyttää kohteita attribuutti näyttää kullekin tietokohdalle varattujen tavujen määrän.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Lähtö
leijuva css
int64 8 float64 8
Haetaan muotoa
Series-objektin muoto määrittää elementtien kokonaismäärän, mukaan lukien puuttuvat tai tyhjät arvot (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Lähtö
(4,) (3,)
Noudetaan mitta, koko ja tavumäärä:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Lähtö
1 1 4 3 32 24
NaN:ien tyhjyyden ja läsnäolon tarkistaminen
Voit tarkistaa, onko Series-objekti tyhjä, käyttämällä tyhjä attribuutti . Vastaavasti voit tarkistaa, sisältääkö sarjaobjekti joitain NaN-arvoja vai ei, käyttämällä hassan attribuutti.
java-iteraattori kartalle
Esimerkki
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Lähtö
False False True True False False 4 3 3 3
Sarjan toiminnot
Sarjassa käytetään joitain toimintoja, jotka ovat seuraavat:
Toiminnot | Kuvaus |
---|---|
Pandas Series.map() | Kartoita arvot kahdesta sarjasta, joilla on yhteinen sarake. |
Pandas Series.std() | Laske annetun numerojoukon, DataFrame-, sarakkeen ja rivien keskihajonta. |
Pandas Series.to_frame() | Muunna sarjaobjekti datakehykseksi. |
Pandas Series.value_counts() | Palauttaa sarjan, joka sisältää yksilöllisiä arvoja. |