TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Etiqueta: etl

Total 50 artículos

Apache Beam: Introducción

Apache Beam es un modelo unificado de código abierto para definir pipelines de procesamiento de datos por lotes o de streaming. Actualmente, Apache Beam SDK tiene soporte para tres lenguajes de programación: Java, Python y Go. Los pipelines se programan usando uno de los SDKs mencionados anteriormente y luego se

Conociendo Hop ETL Open Source

Gracias al gran Matt Casters, buen amigo, creador de Kettle (Pentaho Data Integration), se encuentra embarcado en el desarrollo de una nueva herramienta ETL open Source, Hop (os contamos todas las novedades que ya incluye: Aquí puedes descargar el paper gratuito en español con toda la información Hop es un

Que es Apache Airflow

Apache Airflow es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos fluyen en una sola

Novedades Pentaho Data Integration 9.0

1.  Novedades Pdi 9.0Las principales novedades de PDI 9.0 son las siguientes: Multi-clúster de Hadoop Los usuarios pueden acceder y procesar datos de múltiples clústeres de Hadoop, de diferentes distribuciones y versiones, todo desde una sola     transformación e instancia de Pentaho.Además, dentro de Spoon, los usuarios ahora

Descarga el paper con tips para Talend

Os damos acceso a un interesante paper de nuestros compañeros de Stratebi , Partners de Talend (la potente solución ETL open source, con versión también Enterprise), que aborda los temas de la integración con Google Big Query, como realizar cargas incrementales y debugging Descargar paper Mas info: Caso Practico: trabajando con