Durante este verano, se lanzó la versión Knime 5.3, una herramienta que nos encanta y de la que os vamos a contar sus principales novedades
Pero antes, si queréis conocer Knime, os dejamos nuestro tutorial en español gratuito, que puedes descargar
KNIME es una plataforma open source para analítica
Leer más...
🚀 Esta es la nueva alternativa open source para orquestación de data pipelines que mejora a Apache Airflow en muchos puntos. Os cuento!!
🔎 Windmill es una herramienta de código abierto que permite la orquestación de scripts en diversos lenguajes como TypeScript, Go, Python, Bash...
𝗗𝗲𝘀𝗰𝗮𝗿𝗴𝗮𝗿: https://windmill.dev/
Descargar paper
✅ En adición
Leer más...
Estas son las mejores herramientas y tecnologías open source que nos permiten 'mover datos de un sitio a otro'
Os doy un poco de contexto sobre lo de 'mover datos de un sitio a otro':
* ETL: (Extract, Transform, Load)
* ELT: (Extract, Load, Transform)
* CDC (Change Data
Leer más...
🚀 dbt, explicado!!
🛠 Gran herramienta Open Source para agilizar el proceso de transformación de datos promoviendo la reutilización y el uso de código altamente legible
𝗖𝗢𝗡𝗧𝗘𝗡𝗜𝗗𝗢:
✅ ¿QUÉ ES DBT?
✅ INFORMACION FUNCIONAL Y TÉCNICA
- ¿Cómo funciona dbt?-¿Cuáles son las principales características de dbt?
- dbt Core vs dbt Cloud
-
Leer más...
💎 Do you know the importance of Data Lineage within a Data Governance project?
🚀 Here are the best 25 Data Lineage tools (both commercial and open source) to achieve it
✅ A few days ago I told you about the best way to approach a Data Governance project, by using an initial
Leer más...
Acceder a la información de Microsoft Sharepoint, como una fuente de datos más, cada vez es más interesante para las compañías, de cara a poder integrar esa información en su Data Lake corporativo
Aquí se recogen algunos ejemplos de integración entre Sharepoint y Pentaho Data Integration (PDI). Sharepoint es ampliamente
Leer más...
This document gathers a series of tools used for process automation. A brief
introduction of each tool will be made, as well as the most common advantages
and disadvantages when working with this tool will be explained and finally for
each tool it will be explained how it can be
Leer más...
Buena pregunta, en la actualidad, hay muchas implementaciones realizadas con
PDI. Apache Hop, en cuyo proyecto está colaborando el propio Matt Casters,
creador de PDI, propone cosas muy interesantes.
Antes de daros unas pautas y consejos, os recomendamos unos videotutoriales,
papers y materiales que hemos venido publicando, para conocer mejor
Leer más...
Cada vez son más importantes las herramientas para orquestar los procesos de
ingesta de datos y una de las mejores herramientas es Talend, que tiene versión
Open Source y una completa solución comercial para todo tipo de organizaciones
Nuestros amigos de Stratebi (Partners Gold [https://www.stratebi.com/talend]),
nos
Leer más...