TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Etiqueta: etl

Total 53 artículos

10 trucos sencillos y útiles con Talend

*Actualizado. Inscríbete al webinar para conocer todo sobre Talend gratuitamente:Talend, conoce la mejor solución para Gobierno del Dato e Integración14 de abril 10:00h-11:30hRegistro Tip 1: Jobs explicativosResumen: El propósito de este tip es recordar la importancia de realizar proyectos con componentes descriptivos. Dificultad: 1 Utilidad: 5 Desarrollo:

Tutorial para conocer Apache Nifi

Apache NiFi es un sistema de flujo de datos basado en los conceptos de programación basada en flujo (FBP, del inglés Flow-Based Programming). Descargar Tutorial en español sobre Apache NifiAdmite gráficos dirigidos de enrutamiento de datos, transformación y lógica de mediación del sistema. Apache NiFi tiene una interfaz de usuario

Como extraer y trabajar con los datos de SAP

Cada vez es más importante, para la construcción de robustos y completos Data Lakes, así como de potentes Dashboards y sistemas de información analítica, integrar las fuentes de datos más importantes de las organizaciones Por ello, en este paper gratuito, os indicamos como podemos conectarnos a las diferentes aplicaciones de

Apache Beam: Introducción

Apache Beam es un modelo unificado de código abierto para definir pipelines de procesamiento de datos por lotes o de streaming. Actualmente, Apache Beam SDK tiene soporte para tres lenguajes de programación: Java, Python y Go. Los pipelines se programan usando uno de los SDKs mencionados anteriormente y luego se

Conociendo Hop ETL Open Source

Gracias al gran Matt Casters, buen amigo, creador de Kettle (Pentaho Data Integration), se encuentra embarcado en el desarrollo de una nueva herramienta ETL open Source, Hop (os contamos todas las novedades que ya incluye: Aquí puedes descargar el paper gratuito en español con toda la información Hop es un

Que es Apache Airflow

Apache Airflow es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos fluyen en una sola