Búsqueda de sitios web

Concatenación de elementos de dos matrices NumPy de cadenas


La unión por elementos de Python de dos matrices de cadenas NumPy es un método potente con una amplia gama de usos. Este artículo de blog repasará los procedimientos de configuración e implementación de NumPy, la sintaxis para unir dos matrices de cadenas de NumPy por elementos en Python y el método subyacente. La concatenación de elementos, por ejemplo, se usa comúnmente en tareas de manipulación de datos para combinar dos conjuntos de datos.

Instalación y configuración

Simplemente use pip o conda. NumPy es una poderosa biblioteca que brinda soporte para operaciones y matrices matemáticas. Una vez instalado, puede importarlo a su secuencia de comandos Python usando el siguiente comando:

import numpy as np

Sintaxis

La concatenación por elementos de dos matrices NumPy de cadenas en Python se realiza utilizando la función numpy.core.defchararray.add().

numpy.core.defchararray.add(arr1, arr2)

Las dos matrices NumPy que desea combinar en este caso son arr1 y arr2. El método add() unirá los componentes de arr1 y arr2 elemento por elemento, por lo que el primer elemento de arr1 se combinará con el primer elemento de arr2, el segundo elemento de arr1 con el segundo elemento de arr2, y así sucesivamente.

Ejemplo

import numpy as np
arr1 = np.array(['hello', 'world'])
arr2 = np.array(['!', '?'])
result = np.core.defchararray.add(arr1, arr2)
print(result)

Producción

['hello!' 'world?']

Aquí, se crean matrices NumPy de cadenas, arr1 y arr2 . Utilice la función add() para concatenar los elementos de estas matrices por elementos. La matriz resultante, resultado, contiene las cadenas concatenadas.

Ejemplo

import numpy as np
arr1 = np.array(['apple', 'banana', 'cherry'])
arr2 = np.array([' pie', ' split', ' tart'])
result = np.core.defchararray.add(arr1, arr2)
print(result)

Producción

['apple pie' 'banana split' 'cherry tart']

Tenemos dos matrices NumPy de cadenas, arr1 y arr2. Luego usamos la función add() para concatenar los elementos de estas matrices por elementos. La matriz resultante, resultado, contiene las cadenas concatenadas.

Aplicaciones

Esta podría ser una opción si se pueden combinar dos conjuntos de datos en función de un campo que sea comparable a otro campo, como un número de producto. Utilice la concatenación de elementos para fusionar los números del ID del producto y otra columna para crear una nueva columna en cada recopilación de datos.

Manipulación de datos: la concatenación de elementos, por ejemplo, se usa comúnmente en tareas de manipulación de datos para combinar dos conjuntos de datos. Considere combinar dos conjuntos de datos basados en un campo que sea comparable a otro campo, como un ID de producto. La concatenación de elementos se puede utilizar para fusionar los valores del ID del producto y otra columna para crear una nueva columna en cada recopilación de datos.

Procesamiento del lenguaje natural (PLN)  La concatenación de elementos se usa comúnmente en tareas de PNL como el análisis de actitudes y la clasificación de textos. Los datos de texto en estas tareas se presentan frecuentemente como una matriz, donde cada fila designa un pasaje de texto o una oración y cada columna designa una palabra o un símbolo. Las incrustaciones de palabras o representaciones de vectores de palabras de cada oración o texto se pueden fusionar mediante concatenación de elementos.

Limpieza de datos  Del mismo modo, los valores faltantes se pueden reemplazar o los símbolos no deseados se pueden eliminar de los datos mediante el uso de concatenación de elementos. Por ejemplo, en una recopilación de datos que contiene números de teléfono, se puede utilizar la concatenación de elementos para fusionar el código de área y el número de teléfono. Luego, utilizando expresiones regulares, se pueden eliminar los símbolos no deseados, incluidos corchetes y guiones.

Conclusión

Una técnica excelente que se puede utilizar para muchas tareas, como administración de datos, procesamiento de lenguaje natural y limpieza de datos, es la concatenación de elementos de dos matrices de texto NumPy en Python. Se pueden combinar dos cadenas NumPy en una matriz utilizando el método numpy.core.defchararray.add(). Cuando se trabaja con grandes conjuntos de datos que requieren procedimientos rápidos y eficaces, esta herramienta resulta especialmente útil. También ofrece libertad a la hora de gestionar datos de texto que pueden tener diversas longitudes o estilos.

Artículos relacionados: