Suelte una lista de filas de un Pandas DataFrame
La biblioteca pandas en Python es muy popular para representar datos en forma de estructuras de datos tabulares. El conjunto de datos está organizado en una matriz bidimensional que consta de filas y columnas. La biblioteca Pandas ofrece numerosas funciones que pueden ayudar al programador a analizar el conjunto de datos proporcionando valiosos conocimientos matemáticos.
La estructura de datos tabulares se conoce como marco de datos y se puede generar con la ayuda de la función Pandas DataFrame(). En este artículo realizaremos una operación simple para eliminar/eliminar varias filas de un marco de datos de pandas.
En primer lugar, tenemos que preparar un conjunto de datos y luego generar un marco de datos con la ayuda de la función “DataFrame()” de pandas. Comencemos con esto:
Preparando el conjunto de datos
Los datos del conjunto de datos pasado se organizarán en forma de filas y columnas.
Aquí, importamos la biblioteca de pandas como "pd". Creamos el conjunto de datos con la ayuda de un diccionario de listas.
-
Cada clave representa un estudiante al que se le asocia una lista de valores que representan las calificaciones obtenidas en diferentes materias.
Después de esto, generamos un marco de datos con la ayuda de la función DataFrame(). No especificamos el nombre de la columna, pero el nombre del estudiante adquiere automáticamente la posición de la columna para este marco de datos. El paso más importante es el etiquetado de los índices del marco de datos. Especificamos los nombres de las filas pasando una lista de valores que consta de diferentes temas.
Ejemplo
import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
Producción
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Maths 88 90 95
English 90 71 98
Biology 91 45 80
Eliminar filas a través de valores de índice
Para eliminar una fila usaremos el método "drop()" de pandas. Esta es una forma eficaz y sencilla de eliminar filas de un marco de datos. La siguiente es la sintaxis de este método:
dataframe.drop(labels=None, *, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise')
No requerimos todos los parámetros para iniciar la operación "eliminar" (la mayoría de los valores predeterminados serán suficientes). Hay dos técnicas para eliminar filas: -
Especificaremos el valor del índice para cada fila que deba eliminarse.
Ejemplo
A continuación se muestra la implementación de este método. Aquí,
Después de crear el marco de datos, utilizamos el método drop() para eliminar las filas 3rd y 4th del marco de datos.
Seleccionamos el marco de datos original almacenado en la variable “dataframe” y bloqueamos los valores de índice para las filas correspondientes que queríamos eliminar con la ayuda “dataframe.index[[]]”
Se crea un nuevo marco de datos que consta de las filas restantes.
import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
Drop_dataframe = dataframe.drop(dataframe.index[[2, 3]])
print("After dropping 3rd and 4th row")
print(Drop_dataframe)
Producción
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Maths 88 90 95
English 90 71 98
Biology 91 45 80
After dropping 3rd and 4th row
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Biology 91 45 80
Eliminar filas a través de etiquetas o nombres de filas
En esta técnica, utilizamos el nombre exacto de las filas (etiquetas) que queremos eliminar del marco de datos. Usaremos nuevamente el método drop() para ejecutar esta técnica. ahora,
-
Usamos el mismo método drop() para eliminar la tercera y cuarta fila del marco de datos, pero esta vez usamos el nombre de la fila que etiquetamos mientras construíamos el marco de datos.
Se crea un nuevo marco de datos y el marco de datos original permanece sin cambios.
Ejemplo
import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
Drop_dataframe = dataframe.drop(["Maths", "English"])
print("After dropping 3rd and 4th row")
print(Drop_dataframe)
Producción
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Maths 88 90 95
English 90 71 98
Biology 91 45 80
After dropping 3rd and 4th row
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Biology 91 45 80
También podemos incluir el argumento "inplace", si no queremos crear otro marco de datos. Este argumento puede modificar el marco de datos actual realizando cambios en él. El valor predeterminado es "Falso" para este argumento. Estableceremos el valor del argumento in situ como "Verdadero".
Usando el corte de índice
También podemos eliminar una lista de filas usando la división del índice. El siguiente es el ejemplo para hacerlo,
Aquí, dividimos el índice y creamos un rango para eliminar filas.
Imprimimos el marco de datos original y luego utilizamos el método “dataframe.index[2:4]” para establecer el rango de 2 a 3 y “dataframe.drop() "Método para eliminar estas filas.
Por último, se creará un nuevo marco de datos que constará de las filas restantes.
Ejemplo
import pandas as pd
dataset = {"Aman":[98, 92, 88, 90, 91], "Raj":[78, 62, 90, 71, 45], "Saloni":[82, 52, 95, 98, 80],}
dataframe = pd.DataFrame(dataset,index=["Physics", "Chemistry", "Maths", "English", "Biology"])
print(dataframe)
drop_dataframe = dataframe.drop(dataframe.index[2:4])
print("After dropping 3rd and 4th row")
print(drop_dataframe)
Producción
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Maths 88 90 95
English 90 71 98
Biology 91 45 80
After dropping 3rd and 4th row
Aman Raj Saloni
Physics 98 78 82
Chemistry 92 62 52
Biology 91 45 80
Conclusión
En este artículo, cubrimos los conceptos básicos del marco de datos de pandas. Entendimos los diferentes métodos para eliminar varias filas de un marco de datos. Discutimos las diferentes formas de especificar las filas que queremos eliminar, es decir, a través de “valor de índice” y “nombre de fila”. Por último, analizamos un método simple de división de índices.