logo

Pandas DataFrame.describe()

Description()-menetelmää käytetään joidenkin tilastotietojen laskemiseen, kuten prosenttipiste, keskiarvo ja std sarjan tai DataFramen numeroarvoista. Se analysoi sekä numeerisia että objektisarjoja ja myös DataFrame-sarakejoukkoja sekatyyppisiä tietotyyppejä.

Syntaksi

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parametrit

    prosenttipiste:Se on valinnainen parametri, joka on luettelon kaltainen tietotyyppi luvuista, joiden pitäisi olla välillä 0 ja 1. Sen oletusarvo on [.25, .5, .75], joka palauttaa 25., 50. ja 75. prosenttipisteen.sisältää:Se on myös valinnainen parametri, joka sisältää luettelon tietotyypeistä samalla kun kuvataan DataFrame. Sen oletusarvo on Ei mitään.sulkea pois:Se on myös valinnainen parametri, joka sulkee pois tietotyyppiluettelon kuvattaessa DataFramea. Sen oletusarvo on Ei mitään.

Palauttaa

Se palauttaa sarjan ja DataFramen tilastollisen yhteenvedon.

bellfordin algoritmi

Esimerkki1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Lähtö

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Esimerkki2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Lähtö

binääripuu inorder traversal
 count 4 unique 3 top q freq 2 dtype: object 

Esimerkki3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Lähtö

 categorical count 3 unique 3 top u freq 1 

Esimerkki4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Lähtö

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0