PANDAS DATAFRAME.LOC[] -MENETELMÄ

Pandas DataFrame on kaksiulotteinen kokomuuttuva, mahdollisesti heterogeeninen taulukkomuotoinen tietorakenne, jossa on nimetyt akselit (rivit ja sarakkeet). Aritmeettiset operaatiot kohdistetaan sekä rivi- että saraketunnisteisiin. Sitä voidaan pitää sanelumaisena säiliönä sarja-objekteille. Tämä on tiedoston ensisijainen tietorakenne Pandat .

Pandas DataFrame loc[] Syntaksi

Pandat DataFrame.loc attribuutti käyttää rivien ja sarakkeiden ryhmää otsikoiden tai loogisen taulukon perusteella Pandas DataFrame .

Syntaksi: DataFrame.loc

Parametri: Ei mitään

Palautukset: Skalaari, sarja, datakehys

Pandas DataFrame loc -ominaisuus

Alla on esimerkkejä, joiden avulla voimme käyttää Pandas DataFrame loc []:

Esimerkki 1: Valitse yksi rivi ja sarake otsikon mukaan käyttämällä loc[]

Käytä DataFrame.loc-attribuuttia päästäksesi tiettyyn soluun annetussa kohdassa Pandas Dataframe käyttämällä hakemisto- ja saraketunnisteita. Valitsemme sitten yhden rivin ja sarakkeen tunnistekohtaisesti käyttämällä loc[].

Python 3

# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'Weight'>: [>45>,>88>,>56>,>15>,>71>],> >'Name'>: [>'Sam'>,>'Andrea'>,>'Alex'>,>'Robin'>,>'Kia'>],> >'Age'>: [>14>,>25>,>55>,>8>,>21>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected selection using loc for a specific cell> result>=> df.loc[>'Row_2'>,>'Name'>]> # Print the result> print>(>

'
Selected Value at Row_2, Column 'Name':'>

)> print>(result)>

merkkijono ja osamerkkijono

Lähtö

Original DataFrame:  Weight Name Age Row_1 45 Sam 14 Row_2 88 Andrea 25 Row_3 56 Alex 55 Row_4 15 Robin 8 Row_5 71 Kia 21 Selected Value at Row_2, Column 'Name': Andrea>

Esimerkki 2: Valitse Useita rivejä ja sarakkeita

Käytä DataFrame.loc-attribuuttia palauttaaksesi kaksi saraketta tietyssä tietokehyksessä ja valitsemalla sitten useita rivejä ja sarakkeita alla olevan esimerkin mukaisesti.

Python 3

arraylist lajiteltu

# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>:[>12>,>4>,>5>,>None>,>1>],> >'B'>:[>7>,>2>,>54>,>3>,>None>],> >'C'>:[>20>,>16>,>11>,>3>,>8>],> >'D'>:[>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected column names ('A' and 'D') in the result> result>=> df.loc[:, [>'A'>,>'D'>]]> # Print the result> print>(>

'
Selected Columns 'A' and 'D':'>

)> print>(result)>

Lähtö

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Columns 'A' and 'D':  A D Row_1 12.0 14.0 Row_2 4.0 3.0 Row_3 5.0 NaN Row_4 NaN 2.0 Row_5 1.0 6.0>

Esimerkki 3: Valitse kahden rivin tai sarakkeen väliltä

Tässä esimerkissä luomme panda-tietokehyksen nimeltä 'df', asetamme mukautetut riviindeksit ja käytämme sittenloc>aksessori valitaksesi rivit rivit 'Rivi_2' ja 'Rivi_4' ja sarakkeet 'B' - 'D'. Valitut rivit ja sarakkeet tulostetaan, mikä osoittaa tarrapohjaisen indeksoinnin käytönloc>.

Python 3

yhteyden muodostaminen java-tietokantaan

# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Rows Between 'Row_2' and 'Row_4'> selected_rows>=> df.loc[>'Row_2'>:>'Row_4'>]> print>(>

'
Selected Rows:'>

)> print>(selected_rows)> # Select Columns 'B' through 'D'> selected_columns>=> df.loc[:,>'B'>:>'D'>]> print>(>

'
Selected Columns:'>

)> print>(selected_columns)>

Lähtö

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Rows:  A B C D Row_2 4 2 16 3.0 Row_3 5 54 11 NaN Row_4 NaN 3 3 2.0 Selected Columns:  B C D Row_1 7 20 14.0 Row_2 2 16 3.0 Row_3 54 11 NaN Row_4 3 3 2.0 Row_5 NaN 8 6.0>

Esimerkki 4: Valitse vaihtoehtoiset rivit tai sarakkeet

Tässä esimerkissä luomme panda-tietokehyksen nimeltä 'df', asetamme mukautetut riviindeksit ja käytämme sitteniloc>aksessori valitaksesi vaihtoehtoiset rivit (joka toinen rivi) ja vaihtoehtoiset sarakkeet (joka toinen sarake). Tuloksena saadut valinnat tulostetaan, ja ne osoittavat kokonaislukupohjaisen indeksoinnin käytöniloc>.

Python 3

# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Alternate Rows> alternate_rows>=> df.iloc[::>2>]> print>(>

'
Alternate Rows:'>

)> print>(alternate_rows)> # Select Alternate Columns> alternate_columns>=> df.iloc[:, ::>2>]> print>(>

'
Alternate Columns:'>

)> print>(alternate_columns)>

merkkijonon jakaminen c++:ssa

Lähtö

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Alternate Rows:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Row_5 1.0 NaN 8 6.0 Alternate Columns:  A C Row_1 12.0 20 Row_2 4.0 16 Row_3 5.0 11 Row_4 NaN 3 Row_5 1.0 8>

Esimerkki 5: Ehtojen käyttö Pandas loc

Tässä esimerkissä luomme panda-tietokehyksen nimeltä 'df', asetamme mukautettuja rivi-indeksejä ja hyödynnämmeloc>aksessori valitaksesi rivejä ehtojen perusteella. Se osoittaa sellaisten rivien valitsemisen, joissa sarakkeen A arvot ovat suurempia kuin 5, ja rivien valitsemista, joissa sarake B ei ole tyhjä. Tuloksena saadut valinnat tulostetaan ja esitellään ehdollisen suodatuksen käyttöäloc>.

Python 3

# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using Conditions with loc> # Example: Select rows where column 'A' is greater than 5> selected_rows>=> df.loc[df[>'A'>]>>>]> print>(>

'
Rows where column 'A' is greater than 5:'>

)> print>(selected_rows)> # Example: Select rows where column 'B' is not null> non_null_rows>=> df.loc[df[>'B'>].notnull()]> print>(>

'
Rows where column 'B' is not null:'>

)> print>(non_null_rows)>

Lähtö

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Rows where column 'A' is greater than 5:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Rows where column 'B' is not null:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0>

TechCodeview

Pandas DataFrame loc[] Syntaksi

Pandas DataFrame loc -ominaisuus

Esimerkki 1: Valitse yksi rivi ja sarake otsikon mukaan käyttämällä loc[]

Python 3

Esimerkki 2: Valitse Useita rivejä ja sarakkeita

Python 3

Esimerkki 3: Valitse kahden rivin tai sarakkeen väliltä

Python 3

Esimerkki 4: Valitse vaihtoehtoiset rivit tai sarakkeet

Python 3

Esimerkki 5: Ehtojen käyttö Pandas loc

Python 3