Encuentre las pérdidas y ganancias en la hoja de Excel proporcionada usando Pandas
Pandas es una popular biblioteca de análisis y manipulación de datos en Python que es ampliamente utilizada por científicos y analistas de datos. Proporciona varias funciones para trabajar con datos en hojas de Excel. Una de las tareas más comunes al analizar datos financieros es encontrar las pérdidas y ganancias en una hoja de Excel determinada.
Configuración
Para manejar archivos de Excel en Python usando Python, necesita instalar la dependencia openpyxl. Para hacer esto, abra su terminal y escriba el comando:
pip install openpyxl
Después de una instalación exitosa, puede continuar experimentando con archivos y hojas de cálculo de Excel.
Para descargar la hoja de cálculo de Excel utilizada en los ejercicios siguientes, consulte este enlace
Algoritmo
Para leer datos de un archivo de Excel en un Pandas DataFrame, utilice el método read_excel() que está integrado en Pandas. Debemos deducir el costo total de los ingresos totales para poder calcular las pérdidas y ganancias. Las siguientes etapas se pueden utilizar para resumir el algoritmo para utilizar Pandas para calcular pérdidas y ganancias:
-
Con el método read_excel(), la hoja de Excel se lee en un Pandas DataFrame.
El DataFrame debe actualizarse con una nueva columna de pérdidas y ganancias.
Reste el costo total del ingreso total para determinar las pérdidas y ganancias de cada fila.
Sume la columna de pérdidas y ganancias en el DataFrame para determinar las pérdidas y ganancias generales.
Ejemplo 1
El siguiente código lee una hoja de Excel llamada 'sales.xlsx' y crea un DataFrame. Luego agrega una nueva columna para pérdidas y ganancias y calcula las pérdidas y ganancias para cada fila.
import pandas as pd
# read excel sheet into pandas dataframe
df = pd.read_excel('sales.xlsx')
# calculate total cost
df['Total Cost'] = df['Units Purchased'] * df['Unit Cost']
# calculate total revenue
df['Total Revenue'] = df['Units Sold'] * df['Unit Price']
# calculate profit/loss
df['Profit/Loss'] = df['Total Revenue'] - df['Total Cost']
# print the resulting dataframe
print(df)
# save the resulting dataframe to a new excel sheet
df.to_excel('sales_results.xlsx', index=False)
Producción
Units Purchased Unit Cost Units Sold Unit Price Item Name Total Cost Total Revenue Profit/Loss
50 5.00 40 9.00 Apples 250.00 360.0 110.00
100 3.50 80 7.00 Oranges 350.00 560.0 210.00
25 12.00 20 15.00 Pineapples 300.00 300.0 0.00
75 1.75 60 3.50 Bananas 131.25 210.0 78.75
200 0.50 180 1.25 Carrots 100.00 225.0 125.00
450 2.00 120 4.50 Potatoes 900.00 540.0 -360.00
40 8.00 30 12.00 Avocados 320.00 360.0 40.00
80 1.50 70 3.00 Tomatoes 120.00 210.0 90.00
300 20.00 25 25.00 Mangoes 6000.00 625.0 -5375.00
60 4.00 45 8.00 Grapes 240.00 360.0 120.00
En este ejemplo, primero importamos la biblioteca Pandas y luego leemos la hoja de Excel usando la función read_excel(). Luego creamos nuevas columnas en el marco de datos para calcular el costo total, los ingresos totales y las ganancias/pérdidas de cada producto. Finalmente, imprimimos el marco de datos resultante que incluye las nuevas columnas con valores calculados y lo guardamos en una nueva hoja de Excel para su posterior procesamiento.
Ejemplo 2: cálculo de pérdidas y ganancias con filtros
import pandas as pd
# read excel sheet into pandas dataframe
df = pd.read_excel('sales_results.xlsx')
# filter the dataframe to include only the products with profit
df_profit = df[df['Total Revenue'] > df['Total Cost']]
# calculate the total profit
total_profit = df_profit['Total Revenue'].sum() - df_profit['Total Cost'].sum()
# filter the dataframe to include only the products with loss
df_loss = df[df['Total Revenue'] < df['Total Cost']]
# calculate the total loss
total_loss = df_loss['Total Cost'].sum() - df_loss['Total Revenue'].sum()
# print the total profit and loss
print(f"Total Profit: {total_profit}")
print(f"Total Loss: {total_loss}")
Producción
Total Profit: 773.75
Total Loss: 5735.0
Primero importe la biblioteca Pandas y luego lea la hoja de Excel guardada como resultado del ejemplo anterior usando la función read_excel(). Luego filtramos el marco de datos para incluir solo los productos que tienen ganancias y calculamos la ganancia total. De manera similar, filtramos el marco de datos para incluir solo los productos que tienen pérdida y calculamos la pérdida total. Finalmente, imprimimos las pérdidas y ganancias totales usando la función print().
Aplicaciones de cálculo de pérdidas y ganancias utilizando Pandas
Análisis de datos financieros: las empresas pueden utilizar Pandas para examinar su información financiera y determinar las pérdidas y ganancias de diversos bienes y servicios.
Análisis de inversiones: utilizando Pandas, los inversores pueden examinar la información financiera de una empresa para determinar si es lucrativa o no.
Previsión empresarial: las empresas podrían emplear Pandas para proyectar ingresos y pérdidas futuras examinando datos históricos.
Conclusión
Para analizar y calcular pérdidas y ganancias a partir de una hoja de Excel, Pandas es un potente paquete de Python que se puede utilizar. Pandas es una herramienta vital para cualquier analista de datos o experto financiero debido a su interfaz sencilla y sus potentes funciones. Los desarrolladores pueden utilizar Pandas para analizar sus datos financieros y adquirir información sobre el éxito de sus negocios siguiendo los ejemplos que se ofrecen en este artículo.