Búsqueda de sitios web

Suelte una lista de filas de un Pandas DataFrame


La biblioteca pandas en Python es muy popular para representar datos en forma de estructuras de datos tabulares. El conjunto de datos está organizado en una matriz bidimensional que consta de filas y columnas. La biblioteca Pandas ofrece numerosas funciones que pueden ayudar al programador a analizar el conjunto de datos proporcionando valiosos conocimientos matemáticos.

La estructura de datos tabulares se conoce como marco de datos y se puede generar con la ayuda de la función Pandas DataFrame(). En este artículo realizaremos una operación simple para eliminar/eliminar varias filas de un marco de datos de pandas.

En primer lugar, tenemos que preparar un conjunto de datos y luego generar un marco de datos con la ayuda de la función “DataFrame()” de pandas. Comencemos con esto:

Preparando el conjunto de datos

Los datos del conjunto de datos pasado se organizarán en forma de filas y columnas.

  • Aquí, importamos la biblioteca de pandas como "pd". Creamos el conjunto de datos con la ayuda de un diccionario de listas.

  • Cada clave representa un estudiante al que se le asocia una lista de valores que representan las calificaciones obtenidas en diferentes materias.

  • Después de esto, generamos un marco de datos con la ayuda de la función DataFrame(). No especificamos el nombre de la columna, pero el nombre del estudiante adquiere automáticamente la posición de la columna para este marco de datos. El paso más importante es el etiquetado de los índices del marco de datos. Especificamos los nombres de las filas pasando una lista de valores que consta de diferentes temas.

Ejemplo

import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)

Producción

             Aman  Raj  Saloni
Physics        98   78     82
Chemistry      92   62     52
Maths          88   90     95
English        90   71     98
Biology        91   45     80

Eliminar filas a través de valores de índice

Para eliminar una fila usaremos el método "drop()" de pandas. Esta es una forma eficaz y sencilla de eliminar filas de un marco de datos. La siguiente es la sintaxis de este método:

dataframe.drop(labels=None, *, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')

No requerimos todos los parámetros para iniciar la operación "eliminar" (la mayoría de los valores predeterminados serán suficientes). Hay dos técnicas para eliminar filas: -

Especificaremos el valor del índice para cada fila que deba eliminarse.

Ejemplo

A continuación se muestra la implementación de este método. Aquí,

  • Después de crear el marco de datos, utilizamos el método drop() para eliminar las filas 3rd y 4th del marco de datos.

  • Seleccionamos el marco de datos original almacenado en la variable “dataframe” y bloqueamos los valores de índice para las filas correspondientes que queríamos eliminar con la ayuda “dataframe.index[[]]

  • Se crea un nuevo marco de datos que consta de las filas restantes.

import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
Drop_dataframe = dataframe.drop(dataframe.index[[2, 3]])
print("After dropping 3rd and 4th row")
print(Drop_dataframe)

Producción

           Aman  Raj  Saloni
Physics      98   78      82
Chemistry    92   62      52
Maths        88   90      95
English      90   71      98
Biology      91   45      80
After dropping 3rd and 4th row
           Aman  Raj  Saloni
Physics      98   78      82
Chemistry    92   62      52
Biology      91   45      80

Eliminar filas a través de etiquetas o nombres de filas

En esta técnica, utilizamos el nombre exacto de las filas (etiquetas) que queremos eliminar del marco de datos. Usaremos nuevamente el método drop() para ejecutar esta técnica. ahora,

  • Usamos el mismo método drop() para eliminar la tercera y cuarta fila del marco de datos, pero esta vez usamos el nombre de la fila que etiquetamos mientras construíamos el marco de datos.

  • Se crea un nuevo marco de datos y el marco de datos original permanece sin cambios.

Ejemplo

import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
Drop_dataframe = dataframe.drop(["Maths", "English"])
print("After dropping 3rd and 4th row")
print(Drop_dataframe)

Producción

           Aman  Raj  Saloni
Physics      98   78      82
Chemistry    92   62      52
Maths        88   90      95
English      90   71      98
Biology      91   45      80
After dropping 3rd and 4th row
           Aman  Raj  Saloni
Physics      98   78      82
Chemistry    92   62      52
Biology      91   45      80

También podemos incluir el argumento "inplace", si no queremos crear otro marco de datos. Este argumento puede modificar el marco de datos actual realizando cambios en él. El valor predeterminado es "Falso" para este argumento. Estableceremos el valor del argumento in situ como "Verdadero".

Usando el corte de índice

También podemos eliminar una lista de filas usando la división del índice. El siguiente es el ejemplo para hacerlo,

  • Aquí, dividimos el índice y creamos un rango para eliminar filas.

  • Imprimimos el marco de datos original y luego utilizamos el método “dataframe.index[2:4]” para establecer el rango de 2 a 3 y “dataframe.drop() "Método para eliminar estas filas.

  • Por último, se creará un nuevo marco de datos que constará de las filas restantes.

Ejemplo

import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
drop_dataframe = dataframe.drop(dataframe.index[2:4])
print("After dropping 3rd and 4th row")
print(drop_dataframe)

Producción

            Aman  Raj  Saloni
Physics      98   78      82
Chemistry    92   62      52
Maths        88   90      95
English      90   71      98
Biology      91   45      80
After dropping 3rd and 4th row
             Aman  Raj  Saloni
Physics      98   78      82
Chemistry    92   62      52
Biology      91   45      80

Conclusión

En este artículo, cubrimos los conceptos básicos del marco de datos de pandas. Entendimos los diferentes métodos para eliminar varias filas de un marco de datos. Discutimos las diferentes formas de especificar las filas que queremos eliminar, es decir, a través de “valor de índice” y “nombre de fila”. Por último, analizamos un método simple de división de índices.