Apache NiFi [https://nifi.apache.org/] es un sistema de flujo de datos basado en
los conceptos de programación basada en flujo (FBP, del inglés Flow-Based
Programming).
Descargar Tutorial en español [https://stratebi.es/todobi/Feb21/Apache_NiFi.pdf]
sobre Apache Nifi
Admite gráficos dirigidos de enrutamiento de datos, transformación
Leer más...
Probably you want to learn from the best specialists in Big Data, Machine
Learning and Artificial Intelligence. Thanks to recent Big Things Conference you
can learn and enjoy of this On Demand Training.
Up to 50 lessons covered with about 35 hours lenght
Leer más...
Presto es un motor de consulta SQL distribuido de alto rendimiento para grandes
datos. Su arquitectura permite a los usuarios consultar una variedad de fuentes
de datos como Hadoop, AWS S3, Alluxio, MySQL, Cassandra, Kafka y MongoDB.
Incluso se pueden consultar datos de múltiples fuentes de datos en una sola
Leer más...
Muy interesante también sería conocer sobre lo siguiente:
--------------------------------------------------------------------------------
Muy interesante la aportación de Datastack [https://datastack.tv/] en donde se
definen los skills necesarios para ser un Data Engineer en este 2020
Recursos y enlaces gratuitos para aprender a ser Data Engineer:
Apache Beam: IntroducciónApache Beam es un modelo
Leer más...
Apache Airflow [https://airflow.apache.org/] es una herramienta de orquestación
que permite crear, programar y monitorizar flujos de trabajo mediante
programación en Python.
Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs
(del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde
los datos
Leer más...
Apache Atlas [https://atlas.apache.org/2.0.0/index.html] es una herramienta
open-source, con licencia Apache 2.0, para la gobernanza del dato la cual
permite la integración con todo el ecosistema de datos de las empresas. Puedes
descargarte un paper en español
[http://stratebi.es/todobi/May20/
Leer más...
The use of Business Intelligence (BI) systems usually gets a very fast and
interactive response when using dashboards, reports and detailed analytical
queries. BI applications that meet this interactive processing requirement are
known as OLAP (On-Line Analytical Processing) applications.
However, when we work with data sources with Big Data features
Leer más...
En este enlace [https://github.com/vertica/awesome-vertica] tenéis una muy buena
recopilación de enlaces sobre la mejor base de datos analítica, con tiempos que
mejoran en más de 5 a 10 veces los conseguidos con bases relacionales
tradicionales. En TodoBI hemos publicado mucho sobre Vertica. Síguelo en el tag
Leer más...
Muchas veces hablamos de herramientas, tecnologías, arquitecturas, bases de
datos, etc... pero no nos detenemos tanto en los usos y aplicaciones que todas
estas herramientas y tecnologías nos proporcionan, una vez que el mundo
analytics ha complementado el Business Intelligence, gracias al uso masivo de
datos con técnicas estadisticas y
Leer más...