Gracias al gran Matt Casters, buen amigo, creador de Kettle (Pentaho Data Integration), se encuentra embarcado en el desarrollo de una nueva herramienta ETL open Source, Hop (os contamos todas las novedades que ya incluye: Aquí puedes descargar el paper gratuito en español con toda la información Hop es un
Leer más...
Apache Airflow es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos fluyen en una sola
Leer más...
Apache Atlas es una herramienta open-source, con licencia Apache 2.0, para la gobernanza del dato la cual permite la integración con todo el ecosistema de datos de las empresas. Puedes descargarte un paper en español que te explica los conceptos y funcionalidades principales Atlas permite crear un almacén de
Leer más...
Os dejamos un paper bien completo de una de las herramientas más completas de integración, Talend, que además, como sabéis, tiene también una versión Open Source Hoy os podéis descargar directamente desde aquí, este completo paper, en donde abordamos algunas de las funcionalidades más diferenciadoras de esta suite: Si queréis
Leer más...
1. Novedades Pdi 9.0Las principales novedades de PDI 9.0 son las siguientes: Multi-clúster de Hadoop Los usuarios pueden acceder y procesar datos de múltiples clústeres de Hadoop, de diferentes distribuciones y versiones, todo desde una sola transformación e instancia de Pentaho.Además, dentro de Spoon, los usuarios ahora
Leer más...
Tweakstreet es una herramienta de ETL e integración de datos muy enfocada a usuarios no formados en ningún lenguaje de programación de uso general como Java o Python. Además, es Open Source, creada por un antiguo desarrollador de Pentaho Está orientada a trabajar solamente a nivel de datos, lo que
Leer más...
Os damos acceso a un interesante paper de nuestros compañeros de Stratebi , Partners de Talend (la potente solución ETL open source, con versión también Enterprise), que aborda los temas de la integración con Google Big Query, como realizar cargas incrementales y debugging Descargar paper Mas info: Caso Practico: trabajando con
Leer más...
En este ejercicio practico, vamos a enriquecer el flujo de datos con API de datos estadísticos. Descargar Documento completo 1 Introducción El propósito de este documento es demostrar como con un pequeño ejemplo se puede establecer un flujo de datos continuo entre la API
Leer más...
En este VideoTutorial podréis ver como funciona y conocer las principales características, pasos y funciones de una de las mejores herramientas de integración de datos Además, los próximos 13 y 14 de Noviembre, se celebra en Madrid un Curso sobre Talend , no os lo perdáis
Leer más...