Apache Kudu logo

Apache Kudu

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (7 votos, promedio: 5,00 de 5)
Cargando...

Almacenamiento de datos distribuidos compatible con el ecosistema de Hadoop

Apache Kudu es una plataforma de almacenamiento de datos distribuida de código abierto que fue desarrollada por Cloudera y donada a la Apache Software Foundation en 2015. Kudu es un sistema de almacenamiento de columnas y filas que combina las ventajas de los sistemas de almacenamiento Hadoop (como HDFS) y los sistemas de almacenamiento en bases de datos relacionales. Kudu es una plataforma de almacenamiento ideal para aplicaciones que requieren acceso a datos en tiempo real, incluyendo análisis interactivos, aprendizaje automático y aplicaciones de IoT.

Kudu permite realizar consultas de alta velocidad en grandes conjuntos de datos y es compatible con diversas herramientas de procesamiento de datos, como Apache Spark, Apache Impala y Apache Hive. Kudu es una plataforma escalable que admite la inserción, actualización y eliminación de registros a través de una API de bajo nivel y una API SQL para consultas.

Características clave de Apache Kudu

  1. Almacenamiento híbrido de columnas y filas: Kudu utiliza un modelo de almacenamiento de columnas y filas que combina las ventajas de ambos modelos para ofrecer alta velocidad de lectura y escritura, así como un acceso eficiente a los datos.
  2. Escalabilidad: Kudu es altamente escalable y puede manejar grandes conjuntos de datos. Es compatible con la escalabilidad horizontal mediante la adición de nuevos nodos.
  3. Integración con Apache Hadoop: Kudu es compatible con el ecosistema de Hadoop y se integra con varias herramientas, como Apache Spark, Apache Impala y Apache Hive.
  4. Consistencia de datos: Kudu garantiza la consistencia de los datos a través de la replicación sincrónica de los datos en diferentes nodos del clúster.
  5. Alta disponibilidad: Kudu es tolerante a fallos y garantiza la alta disponibilidad de los datos a través de la replicación de los datos en diferentes nodos del clúster.

Deja una respuesta