Búsqueda de sitios web

Encuentre las pérdidas y ganancias en la hoja de Excel proporcionada usando Pandas


Pandas es una popular biblioteca de análisis y manipulación de datos en Python que es ampliamente utilizada por científicos y analistas de datos. Proporciona varias funciones para trabajar con datos en hojas de Excel. Una de las tareas más comunes al analizar datos financieros es encontrar las pérdidas y ganancias en una hoja de Excel determinada.

Configuración

Para manejar archivos de Excel en Python usando Python, necesita instalar la dependencia openpyxl. Para hacer esto, abra su terminal y escriba el comando:

pip install openpyxl

Después de una instalación exitosa, puede continuar experimentando con archivos y hojas de cálculo de Excel.

Para descargar la hoja de cálculo de Excel utilizada en los ejercicios siguientes, consulte este enlace

Algoritmo

Para leer datos de un archivo de Excel en un Pandas DataFrame, utilice el método read_excel() que está integrado en Pandas. Debemos deducir el costo total de los ingresos totales para poder calcular las pérdidas y ganancias. Las siguientes etapas se pueden utilizar para resumir el algoritmo para utilizar Pandas para calcular pérdidas y ganancias:

  • Con el método read_excel(), la hoja de Excel se lee en un Pandas DataFrame.

  • El DataFrame debe actualizarse con una nueva columna de pérdidas y ganancias.

  • Reste el costo total del ingreso total para determinar las pérdidas y ganancias de cada fila.

  • Sume la columna de pérdidas y ganancias en el DataFrame para determinar las pérdidas y ganancias generales.

Ejemplo 1

El siguiente código lee una hoja de Excel llamada 'sales.xlsx' y crea un DataFrame. Luego agrega una nueva columna para pérdidas y ganancias y calcula las pérdidas y ganancias para cada fila.

import pandas as pd

# read excel sheet into pandas dataframe
df = pd.read_excel('sales.xlsx')

# calculate total cost
df['Total Cost'] = df['Units Purchased'] * df['Unit Cost']

# calculate total revenue
df['Total Revenue'] = df['Units Sold'] * df['Unit Price']

# calculate profit/loss
df['Profit/Loss'] = df['Total Revenue'] - df['Total Cost']

# print the resulting dataframe
print(df)

# save the resulting dataframe to a new excel sheet 
df.to_excel('sales_results.xlsx', index=False)

Producción

Units Purchased	Unit Cost	Units Sold	Unit Price	Item Name	Total Cost	Total Revenue	Profit/Loss
    50	             5.00	       40             9.00	   Apples	    250.00	    360.0	     110.00
    100	             3.50	       80	      7.00	  Oranges	    350.00	    560.0	     210.00
    25	            12.00	       20	     15.00     Pineapples	    300.00	    300.0	       0.00
    75	             1.75	       60	      3.50	  Bananas	    131.25	    210.0	      78.75
    200	             0.50	      180	      1.25	  Carrots	    100.00	    225.0	     125.00
    450	             2.00	      120	      4.50	 Potatoes	    900.00	    540.0	    -360.00
    40	             8.00	       30	     12.00	 Avocados	    320.00	    360.0	      40.00
    80	             1.50	       70	      3.00	 Tomatoes	    120.00	    210.0	      90.00
    300	            20.00	       25	     25.00	  Mangoes	   6000.00	    625.0	   -5375.00
    60	             4.00	       45	      8.00	   Grapes	    240.00	    360.0	     120.00

En este ejemplo, primero importamos la biblioteca Pandas y luego leemos la hoja de Excel usando la función read_excel(). Luego creamos nuevas columnas en el marco de datos para calcular el costo total, los ingresos totales y las ganancias/pérdidas de cada producto. Finalmente, imprimimos el marco de datos resultante que incluye las nuevas columnas con valores calculados y lo guardamos en una nueva hoja de Excel para su posterior procesamiento.

Ejemplo 2: cálculo de pérdidas y ganancias con filtros

import pandas as pd

# read excel sheet into pandas dataframe
df = pd.read_excel('sales_results.xlsx')

# filter the dataframe to include only the products with profit
df_profit = df[df['Total Revenue'] > df['Total Cost']]

# calculate the total profit
total_profit = df_profit['Total Revenue'].sum() - df_profit['Total Cost'].sum()

# filter the dataframe to include only the products with loss
df_loss = df[df['Total Revenue'] < df['Total Cost']]

# calculate the total loss
total_loss = df_loss['Total Cost'].sum() - df_loss['Total Revenue'].sum()

# print the total profit and loss
print(f"Total Profit: {total_profit}")
print(f"Total Loss: {total_loss}")

Producción

Total Profit: 773.75
Total Loss: 5735.0

Primero importe la biblioteca Pandas y luego lea la hoja de Excel guardada como resultado del ejemplo anterior usando la función read_excel(). Luego filtramos el marco de datos para incluir solo los productos que tienen ganancias y calculamos la ganancia total. De manera similar, filtramos el marco de datos para incluir solo los productos que tienen pérdida y calculamos la pérdida total. Finalmente, imprimimos las pérdidas y ganancias totales usando la función print().

Aplicaciones de cálculo de pérdidas y ganancias utilizando Pandas

  • Análisis de datos financieros: las empresas pueden utilizar Pandas para examinar su información financiera y determinar las pérdidas y ganancias de diversos bienes y servicios.

  • Análisis de inversiones: utilizando Pandas, los inversores pueden examinar la información financiera de una empresa para determinar si es lucrativa o no.

  • Previsión empresarial: las empresas podrían emplear Pandas para proyectar ingresos y pérdidas futuras examinando datos históricos.

Conclusión

Para analizar y calcular pérdidas y ganancias a partir de una hoja de Excel, Pandas es un potente paquete de Python que se puede utilizar. Pandas es una herramienta vital para cualquier analista de datos o experto financiero debido a su interfaz sencilla y sus potentes funciones. Los desarrolladores pueden utilizar Pandas para analizar sus datos financieros y adquirir información sobre el éxito de sus negocios siguiendo los ejemplos que se ofrecen en este artículo.

Artículos relacionados: