spark - TodoBI - Business Intelligence, Big Data, ML y AI

Windmill, alternativa a Apache Airflow

Emilio may. 14, 2024 0

🚀 Esta es la nueva alternativa open source para orquestación de data pipelines que mejora a Apache Airflow en muchos puntos. Os cuento!! 🔎 Windmill es una herramienta de código abierto que permite la orquestación de scripts en diversos lenguajes como TypeScript, Go, Python, Bash... 𝗗𝗲𝘀𝗰𝗮𝗿𝗴𝗮𝗿: https://windmill.dev/ Descargar paper ✅ En adición

Top Open Source Data Integration Tools

Emilio mar. 22, 2024 0

Estas son las mejores herramientas y tecnologías open source que nos permiten 'mover datos de un sitio a otro' Os doy un poco de contexto sobre lo de 'mover datos de un sitio a otro': * ETL: (Extract, Transform, Load) * ELT: (Extract, Load, Transform) * CDC (Change Data

+100 tools for Data Engineers

Emilio mar. 19, 2024 0

🚀 Si trabajas con Datos, esta recopilación de herramientas te vendrá genial!! Guardatela!! +100 herramientas!! 🔎 Algunas de las mencionadas en este documento, también las he venido comentando con más detalle aquí, en www.todobi.com 𝗧𝗜𝗣𝗢𝗦 𝗗𝗘 𝗛𝗘𝗥𝗥𝗔𝗠𝗜𝗘𝗡𝗧𝗔𝗦: ✅ Ingest Tech ✅ Ingest SaaS ✅ Data Lake ✅ Metastore ✅ Data Version ✅ Open Table Formats ✅ Distribute Compute ✅ Analytics Engine

'Practical Data Engineering Project' code en Github

Emilio mar. 18, 2024 0

🚀 Genial el 'Practical Data Engineering Project' que se acaba de actualizar en GithubUna gran forma de aprender de manera práctica y con tecnologías que me encantan de las que ya os he venido contando recientemente!! 🔽 Descargar de Github: https://lnkd.in/dmiy7igX ✅ En este proyecto de Ingeniería de

25 comprehensive diagrams to learn about data and technology

Emilio oct. 21, 2023 0

Here you have a compilation of the best diagrams to learn visually PYTHON ROADMAP: HOW A DATA ARCHITECTURE WORKS: DATA SCIENCE LANDSCAPE: HOW SPOTIFY USES MACHNE LEARNING: WORKING OF A MACHINE LEARNING MODEL: WHAT IS A VECTOR DATABASE: PROMPT ENGINEERING HOW TO: ML ENGINEER SKILLS: DATA LINEAGE: CLOUD WAREHOUSING: DATA

Apache Spark y Databricks

Emilio may. 22, 2023 0

💡 A todos os sonará #sparky #databricks, pero conoces qué hacen, sus diferencias, que es un #Lakehouse, un #DeltaLake, su Roadmap... 🚀 Pues hace unos días estuvimos en el LAKEHOUSE DAY en Madrid y os lo contamos, junto con las novedades para integrar ChatGPT, con Dolly 🙋‍♂️ En Stratebi somos especialistas en grandes

Apache Hop: Instalación y construcción de pipelines con Apache Spark y Google Dataflow

Emilio abr. 12, 2023 0

⚙ Apache Hop es la evolución de Pentaho (Pentaho Data Integration) y trae algunas mejoras notables 🚀 en cuanto a la integración con otras tecnologías Big Data (Spark, Airflow, Google Cloud Dataflow...) Cualquiera que esté familiarizado con PDI no tendrá problema alguno en comenzar con Apache Hop. Y si no lo conoces,

Curso práctico completo sobre las mejores 15 herramientas Open Source Analytics

Emilio feb. 02, 2023 0

🔔🔔 Hemos organizado un Curso práctico online sobre las mejores herramientas Open Source Analytics . Ya lo podéis ver de forma gratuita. Son casi 4 horas muy bien aprovechadas!! 🎬 Acceso al Curso: https://lnkd.in/dkxSjc4u 'Curso práctico completo sobre las mejores 15 herramientas Open Source Analytics' Os será de

Cómo montar un Data Lake Open Source

Emilio nov. 22, 2022 0

Cuando queremos definir la Arquitectura tecnológica de un Data Lake, éste debe permitir la ingesta, integración, almacenamiento y explotación de cualquier tipo de fuentes de datos Apostamos por el uso de software libre, pero para el que exista un importante soporte de la comunidad de usuarios que facilite su uso

LinceBI, la mejor solución Big Data Analytics basada en Open Source

Formación Data 2026 (más de 30 Cursos)

Checklist para elegir Arquitectura de Datos

Conceptos Fundamentales de Business Intelligence

Nuevo!! Data University

Etiqueta: spark

Windmill, alternativa a Apache Airflow

Top Open Source Data Integration Tools

+100 tools for Data Engineers

'Practical Data Engineering Project' code en Github

25 comprehensive diagrams to learn about data and technology

Apache Spark y Databricks

Apache Hop: Instalación y construcción de pipelines con Apache Spark y Google Dataflow

Curso práctico completo sobre las mejores 15 herramientas Open Source Analytics

Cómo montar un Data Lake Open Source

Libro gratuito: Trucos de PowerBI (5)

12 aplicaciones gratuitas para crear Dashboards

Groot AI LinceBI: la nueva plataforma Analytics AI Open Source

25 Consejos de un veterano para los que empiezan en Data

Curso Databricks Gratuito

Curso Snowflake Gratuito

Deepseek AI integrations

Cómo convertirse en especialista IA si vienes del mundo Data y BI

Curso Fabric Gratuito

Qué es una Arquitectura Medallón?

Diccionario de Arquitectura de Datos

50 Consejos de Visualización

17 KPIs para medir un proyecto de Data Governance

Como funciona el nuevo Fabric Data Agent

𝗔𝗿𝗾𝘂𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗮𝘀 𝗱𝗲 𝗗𝗮𝘁𝗼𝘀 (𝗔𝘇𝘂𝗿𝗲, 𝗔W𝗦, 𝗚𝗼𝗼𝗴𝗹𝗲 𝘆 𝗢𝗽𝗲𝗻 𝗦𝗼𝘂𝗿𝗰𝗲), comparativa muy útil!!

50 sesgos cognitivos a considerar en Negocios

Cuales son y para que sirven las bases de datos de Grafos?

Diccionario de Arquitecturas de Datos

Comparativa Databrics vs Fabric vs Snowflake

Top Open Source Data Integration Tools

Como extraer y trabajar con los datos de SAP

Los 40 mejores libros de gestión, tecnología e innovación

30 Consejos y Buenas Prácticas para hacer un proyecto de Power BI con éxito

Cómo aplicar NoSQL en casos reales

Videotutorial: Trabajando con Python en Power BI