TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Etiqueta: etl

Total 52 artículos

Tutorial para conocer Apache Nifi

Apache NiFi es un sistema de flujo de datos basado en los conceptos de programación basada en flujo (FBP, del inglés Flow-Based Programming). Descargar Tutorial en español sobre Apache NifiAdmite gráficos dirigidos de enrutamiento de datos, transformación y lógica de mediación del sistema. Apache NiFi tiene una interfaz de usuario

Como extraer y trabajar con los datos de SAP

Cada vez es más importante, para la construcción de robustos y completos Data Lakes, así como de potentes Dashboards y sistemas de información analítica, integrar las fuentes de datos más importantes de las organizaciones Por ello, en este paper gratuito, os indicamos como podemos conectarnos a las diferentes aplicaciones de

Apache Beam: Introducción

Apache Beam es un modelo unificado de código abierto para definir pipelines de procesamiento de datos por lotes o de streaming. Actualmente, Apache Beam SDK tiene soporte para tres lenguajes de programación: Java, Python y Go. Los pipelines se programan usando uno de los SDKs mencionados anteriormente y luego se

Conociendo Hop ETL Open Source

Gracias al gran Matt Casters, buen amigo, creador de Kettle (Pentaho Data Integration), se encuentra embarcado en el desarrollo de una nueva herramienta ETL open Source, Hop (os contamos todas las novedades que ya incluye: Aquí puedes descargar el paper gratuito en español con toda la información Hop es un

Que es Apache Airflow

Apache Airflow es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos fluyen en una sola

Novedades Pentaho Data Integration 9.0

1.  Novedades Pdi 9.0Las principales novedades de PDI 9.0 son las siguientes: Multi-clúster de Hadoop Los usuarios pueden acceder y procesar datos de múltiples clústeres de Hadoop, de diferentes distribuciones y versiones, todo desde una sola     transformación e instancia de Pentaho.Además, dentro de Spoon, los usuarios ahora