TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Conociendo Hop ETL Open Source

Gracias al gran Matt Casters, buen amigo, creador de Kettle (Pentaho Data Integration), se encuentra embarcado en el desarrollo de una nueva herramienta ETL open Source, Hop (os contamos todas las novedades que ya incluye:

Aquí puedes descargar el paper gratuito en español con toda la información

Hop es un programa en desarrollo que surge como una bifurcación de Pentaho Data Integration (PDI), de código abierto, y gracias a las múltiples contribuciones recibidas, este pretende ser más intuitivo, eficiente y modular a su antecesor.

Se desarrolla con la intención de facilitar todos los aspectos de la orquestación de datos y metadatos, manteniendo, y en muchos casos, mejorando la estabilidad ya conseguida por PDI a lo largo de los años. Además de incluir soporte nativo para Apache Beam, incorpora nuevas funcionalidades tales como la creación y diferenciación de entornos de ejecución, la integración total con GIT para un control total de las versiones o la creación de pruebas unitarias sobre los procesos desarrollados con la herramienta.

Su objetivo es presentar nuevos conceptos e ideas, a la vez que se mejoran las funciones de PDI menos destacadas suprimiendo aquellas funcionalidades más obsoletas. Aquí tienes el roadmap

Su versión preliminar introduce mejoras en la interfaz de usuario y consigue eliminar código obsoleto para mejorar los tiempos de ejecución y conectividad de sus propios elementos. Además, su configuración es mucho más uniforme

Aquí podéis ver también una comparativa con el anterio PDI