Apache Airflow [https://airflow.apache.org/] es una herramienta de orquestación
que permite crear, programar y monitorizar flujos de trabajo mediante
programación en Python.
Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs
(del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde
los datos
Leer más...
Apache Atlas [https://atlas.apache.org/2.0.0/index.html] es una herramienta
open-source, con licencia Apache 2.0, para la gobernanza del dato la cual
permite la integración con todo el ecosistema de datos de las empresas. Puedes
descargarte un paper en español
[http://stratebi.es/todobi/May20/
Leer más...
Os dejamos un paper bien completo de una de las herramientas más completas de
integración, Talend, que además, como sabéis, tiene también una versión Open
Source
Hoy os podéis descargar directamente desde aquí
[http://stratebi.es/todobi/May20/Talend_Cloud.pdf], este completo paper, en
donde abordamos algunas de las
Leer más...
1. Novedades Pdi 9.0
Las principales novedades de PDI 9.0
[https://help.pentaho.com/Documentation/9.0/What's_new_in_Pentaho_9.0] son las
siguientes:
Multi-clúster de Hadoop
* Los usuarios pueden acceder y procesar datos de múltiples clústeres de
Hadoop, de diferentes distribuciones y versiones,
Leer más...
Tweakstreet [https://tweakstreet.io/] es una herramienta de ETL e integración de
datos muy enfocada a usuarios no formados en ningún lenguaje de programación de
uso general como Java o Python. Además, es Open Source
[https://tweakstreet.io/download/], creada por un antiguo desarrollador de
Pentaho
Está orientada a trabajar
Leer más...
Os damos acceso a un interesante paper de nuestros compañeros de Stratebi
[http://www.stratebi.com/talend], Partners de Talend(la potente solución ETL
open source, con versión también Enterprise), que aborda los temas de la
integración con Google Big Query, como realizar cargas incrementales y debugging
Descargar [http://stratebi.
Leer más...
En este ejercicio practico, vamos a enriquecer el flujo de datos con API de
datos estadísticos.
Descargar [http://www.stratebi.es/todobi/Ago18/APIs_Talend_Stratebi.pdf]
Documento completo
1 Introducción
El propósito de este documento es demostrar como con un pequeño ejemplo se puede
establecer un flujo de datos
Leer más...
En este VideoTutorial podréis ver como funciona y conocer las principales
características, pasos y funciones de una de las mejores herramientas de
integración de datos
Además, los próximos 13 y 14 de Noviembre, se celebra en Madrid un Curso sobre
Talend [https://www.stratebi.com/-/etls-con-talend], no os lo
Leer más...
Para todos los que llevamos un tiempo en esto del Business Intelligence, Big
Data, Machine Learning, Analytics... vemos que se dedica mucho tiempo a hablar
de las nuevas tecnologías, casos de uso, aplicaciones, etc... pero muy poco del
verdadero problema y condicionante para lograr una exitosa implementación de
estas tecnologías
Leer más...