Presto es un motor de consulta SQL distribuido de alto rendimiento para grandes datos. Su arquitectura permite a los usuarios consultar una variedad de fuentes de datos como Hadoop, AWS S3, Alluxio, MySQL, Cassandra, Kafka y MongoDB. Incluso se pueden consultar datos de múltiples fuentes de datos en una sola
Leer más...
Cada vez son más las iniciativas Smart City que se llevan a cabo, no solo en España, en donde hay iniciativas pioneras, si no a lo largo de todo el globo En este post, os hacemos un resumen de las principales tecnologías open source que se usan en estos proyectos,
Leer más...
Muy interesante también sería conocer sobre lo siguiente: Muy interesante la aportación de Datastack en donde se definen los skills necesarios para ser un Data Engineer en este 2020 Recursos y enlaces gratuitos para aprender a ser Data Engineer:Apache Beam: IntroducciónApache Beam es un modelo unificado de código abierto
Leer más...
Apache Airflow es una herramienta de orquestación que permite crear, programar y monitorizar flujos de trabajo mediante programación en Python. Estos flujos de trabajos se representan como Grafos Acíclicos Dirigidos o DAGs (del inglés Directed Acyclic Graph) de tareas / procesos, es decir grafos donde los datos fluyen en una sola
Leer más...
Apache Atlas es una herramienta open-source, con licencia Apache 2.0, para la gobernanza del dato la cual permite la integración con todo el ecosistema de datos de las empresas. Puedes descargarte un paper en español que te explica los conceptos y funcionalidades principales Atlas permite crear un almacén de
Leer más...
The use of Business Intelligence (BI) systems usually gets a very fast and interactive response when using dashboards, reports and detailed analytical queries. BI applications that meet this interactive processing requirement are known as OLAP (On-Line Analytical Processing) applications. However, when we work with data sources with Big Data
Leer más...
En este enlace tenéis una muy buena recopilación de enlaces sobre la mejor base de datos analítica, con tiempos que mejoran en más de 5 a 10 veces los conseguidos con bases relacionales tradicionales. En TodoBI hemos publicado mucho sobre Vertica. Síguelo en el tag ContentsClientsToolsUDXsExamplesIntegrationsOther ResourcesClientsvertica-python - Official Python
Leer más...
Muchas veces hablamos de herramientas, tecnologías, arquitecturas, bases de datos, etc... pero no nos detenemos tanto en los usos y aplicaciones que todas estas herramientas y tecnologías nos proporcionan, una vez que el mundo analytics ha complementado el Business Intelligence, gracias al uso masivo de datos con técnicas estadisticas y
Leer más...
Si hace unos días, os dejábamos disponibles la charla de los Open Spaces sobre Real Time Big Data con Apache Storm y el de Apache Cassandra-NoSQL , hoy tenéis el video y la presentación del más que interesante de Bases de Datos Analíticas (orientadas a columnas). Estas bases de datos nos
Leer más...