Cómo omitir filas al leer un archivo csv usando Pandas
Python tiene un método incorporado read_csv que se puede usar para configurar las filas de salto mientras se lee un archivo csv usando Pandas. CSV significa valores separados por comas y se conoce como una extensión de un archivo que contiene la base de datos. Esta técnica se puede utilizar en cualquier aplicación que implique leer y procesar datos de un archivo CSV. Las diversas aplicaciones utilizadas como filtrado de datos, herramienta Excel, etc.
Sintaxis
La siguiente sintaxis se utiliza en los ejemplos:
read_csv('file_name.csv', skiprows= set the condition according to user choice)
Esta es una función incorporada del módulo pandas que puede leer los datos de archivos CSV. Acepta dos parámetros:
nombre de archivo.csv: el csv es una representación simple de la extensión de un archivo.
skiprows : este parámetro permite al usuario establecer la condición en función de omitir/eliminar filas.
Ejemplo 1
En el siguiente ejemplo, iniciaremos el programa importando el módulo llamado pandas y tomando el objeto de referencia como pd. Luego inicialice la variable denominada df que almacena el valor mediante un método incorporado read_csv() que acepta dos parámetros: demo.csv (el nombre del archivo) y skiprows (establezca la fila de índice específica). Skirows establece las filas mediante la comprensión de listas. Finalmente, solo usamos la variable df para obtener los datos en forma tabular.
#skip multiple rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=[1,5,12])
df
Producción
Ejemplo 2
En el siguiente ejemplo, mostraremos cómo omitir una sola fila de los datos. Primero, importe el módulo pandas que ayuda a configurar la operación de lectura de datos. Tome el pd como referencia de objeto que utilizará para asignar con read_csv. Al utilizar esta función incorporada, acepta dos parámetros: 'demo.csv' (nombre de archivo) y skiprows (establecido en el valor 1 que elimina la primera fila de la tabla).
#skip only single rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=1)
df
Producción
Ejemplo 3
En el siguiente ejemplo, primero importaremos el módulo pandas que se puede usar para manejar su referencia de objeto llamada pd. A continuación, almacenaremos el valor como método incorporado read_csv con pd que acepta dos parámetros: 'demo.csv' (nombre de archivo) y skiprows (establezca el valor para una condición par). Al final, use la variable df para obtener el resultado.
# skip rows based on even condition
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0)
# print the months in even order
df
Producción
Ejemplo 4
En el siguiente ejemplo, comience el programa importando el módulo denominado pandas. Luego use el método incorporado read_csv que establece dos parámetros: 'demo.csv' (nombre de archivo) y skiprows (establezca el valor como lamda x:x>5 que establece solo las primeras cinco filas). A continuación, utilice la variable df para obtener los datos de 5 filas.
# skip rows based on certain rows
import pandas as pd
df = pd.read_csv('demo.csv', skiprows= lambda x:x>5)
df
Producción
Ejemplo 5
En el siguiente ejemplo, el programa comienza con el módulo pandas y establece la referencia del objeto como pd. Luego inicialice la variable llamada df que almacena el valor usando el método incorporado y acepta tres parámetros: 'demo.csv' (el nombre del archivo), skiprows (establezca el valor entero 2 y 10 en la lista para eliminar los datos de la tabla) y nrows (establezca el valor en 10, lo que significa que solo estarán disponibles 10 filas).
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10)
df
Producción
Conclusión
Discutimos el concepto de skiprows aplicándole varias condiciones. Usamos la condición skiprows para omitir filas individuales, omitir filas múltiples, omitir filas según condiciones pares, omitir filas según ciertas condiciones y omitir la fila específica del archivo CSV.