Cómo instalar Apache Cassandra en Ubuntu 20.04


Apache Cassandra es un motor de base de datos NoSQL de código abierto de alto rendimiento que proporciona tolerancia a fallos, escalabilidad lineal y coherencia en varios nodos. Dada su arquitectura distribuida, Apache Cassandra maneja grandes volúmenes de datos con replicación de estilo dinamo. Aquí es donde las réplicas se almacenan en varios nodos de un clúster, lo que proporciona alta disponibilidad y cero puntos de falla.

Apache Cassandra es ideal en aplicaciones de IoT donde se recopilan datos masivos. También es útil en análisis de redes sociales, servicios de mensajería y aplicaciones minoristas.

Entre las empresas que hacen uso de Apache Cassandra se encuentran Netflix, Facebook, Cisco, Hulu, Twitter y muchas más.

En este artículo, aprenderá a instalar y configurar Apache Cassandra en Ubuntu 20.04 y Ubuntu 18.04.

Paso 1: instalar Java en Ubuntu

La instalación de Apache Cassandra comienza con la verificación de si Java está instalado. Para ser más específico, OpenJDK es lo que se requiere para trabajar sin problemas con Apache Cassandra. Es más probable que la instalación de una versión diferente produzca errores durante la configuración.

Para verificar si Java está instalado, ejecute el comando:

$ java -version

Si Java aún no está instalado, encontrará la salida impresa como se muestra en su terminal.

Para instalar OpenJDK, ejecute el siguiente comando apt.

$ sudo apt install openjdk-8-jdk

Una vez más, confirme que Java está instalado ejecutando el comando.

$ java -version

Paso 2: Instale Apache Cassandra en Ubuntu

Con Java instalado, procederemos a instalar Apache Cassandra. Primero, instale el paquete apt-transport-https para permitir el acceso a los repositorios a través del protocolo https.

$ sudo apt install apt-transport-https

A continuación, importe la clave GPG utilizando el siguiente comando wget como se muestra.

$ wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -

Luego agregue el repositorio de Apache Cassandra al archivo de lista de fuentes del sistema como se muestra.

$ sudo sh -c 'echo "deb http://www.apache.org/dist/cassandra/debian 311x main" > /etc/apt/sources.list.d/cassandra.list'

Antes de instalar Apache Cassandra, primero debe actualizar la lista de paquetes.

$ sudo apt update

Luego instale la base de datos NoSQL usando el comando:

$ sudo apt install cassandra

Por lo general, Apache Cassandra se inicia automáticamente. Para confirmar su estado, ejecute el siguiente comando:

$ sudo systemctl status cassandra

El resultado a continuación confirma que Cassandra está funcionando como se esperaba.

Además, puede verificar las estadísticas de su nodo ejecutando el comando.

$ sudo nodetool status

Para iniciar sesión en Cassandra en la terminal, invoque el comando.

$ cqlsh

Paso 3: Configurar Apache Cassandra en Ubuntu

Los archivos de configuración de Apache Cassandra se apilan en el directorio/etc/cassandra mientras que los datos se almacenan en el directorio/var/lib/cassandra. Las opciones de inicio se pueden modificar en el archivo/etc/default/cassandra.

El nombre del clúster predeterminado de Cassandra es "Clúster de prueba". Para cambiar esto a un nombre más significativo, inicie sesión en Cassandra.

$ cqlsh

Para configurar el nombre del clúster según sus preferencias, ejecute el comando que se muestra a continuación. En este caso, estamos configurando el nombre del clúster en "Tecmint Cluster"

UPDATE system.local SET cluster_name = 'Tecmint Cluster' WHERE KEY = 'local';

Salga del mensaje escribiendo:

EXIT;

A partir de entonces, diríjase al archivo cassandra.yaml como se muestra:

$ sudo vim /etc/cassandra/cassandra.yaml

Busque la directiva cluster_name y edite el nombre del clúster como se muestra a continuación.

Guarde y salga del archivo de configuración y reinicie el servicio Cassandra. Puede iniciar sesión nuevamente para confirmar el nombre del clúster como se muestra.

Y eso concluye el tema sobre la instalación de Apache Cassandra en Ubuntu 20.04 LTS.