Apache Kudu - Jose Bernalte

Almacenamiento de datos distribuidos compatible con el ecosistema de Hadoop

Apache Kudu es una plataforma de almacenamiento de datos distribuida de código abierto que fue desarrollada por Cloudera y donada a la Apache Software Foundation en 2015. Kudu es un sistema de almacenamiento de columnas y filas que combina las ventajas de los sistemas de almacenamiento Hadoop (como HDFS) y los sistemas de almacenamiento en bases de datos relacionales. Kudu es una plataforma de almacenamiento ideal para aplicaciones que requieren acceso a datos en tiempo real, incluyendo análisis interactivos, aprendizaje automático y aplicaciones de IoT.

Kudu permite realizar consultas de alta velocidad en grandes conjuntos de datos y es compatible con diversas herramientas de procesamiento de datos, como Apache Spark, Apache Impala y Apache Hive. Kudu es una plataforma escalable que admite la inserción, actualización y eliminación de registros a través de una API de bajo nivel y una API SQL para consultas.

Características clave de Apache Kudu

Almacenamiento híbrido de columnas y filas: Kudu utiliza un modelo de almacenamiento de columnas y filas que combina las ventajas de ambos modelos para ofrecer alta velocidad de lectura y escritura, así como un acceso eficiente a los datos.
Escalabilidad: Kudu es altamente escalable y puede manejar grandes conjuntos de datos. Es compatible con la escalabilidad horizontal mediante la adición de nuevos nodos.
Integración con Apache Hadoop: Kudu es compatible con el ecosistema de Hadoop y se integra con varias herramientas, como Apache Spark, Apache Impala y Apache Hive.
Consistencia de datos: Kudu garantiza la consistencia de los datos a través de la replicación sincrónica de los datos en diferentes nodos del clúster.
Alta disponibilidad: Kudu es tolerante a fallos y garantiza la alta disponibilidad de los datos a través de la replicación de los datos en diferentes nodos del clúster.

Cookie	Duración	Descripción
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Almacenamiento de datos distribuidos compatible con el ecosistema de Hadoop

Características clave de Apache Kudu

Deja una respuesta