Muchos os hemos hablado por aquí de Apache Kylin, probablemente el sistema de de consultas OLAP sobre Big Data más rápido y potente del mercado. En la linea de Apache Druid, incluso con más funcionalidades Aquí os dejamos unos pocos enlaces: Top real-time and best performance analytics tools (open source/
Leer más...
One of the great technological challenges for all of us who are passionate about Business Intelligence has always been to be able to meet three objectives that seemed impossible: Handling large volumes of data for analytical queries (olap, multidimensional models).To be able to do it in real-time or near
Leer más...
Kepler.gl es una herramienta web de código abierto desarrollada por Mapbox y Uber orientada a la visualización y análisis de datos espaciales sobre mapas interactivos. La herramienta permite construir fácilmente visualizaciones de datos sobre mapas interactivos que pueden ser integrados en plataformas de terceros como CARTO, así como en
Leer más...
Cada vez son más las iniciativas Smart City que se llevan a cabo, no solo en España, en donde hay iniciativas pioneras, si no a lo largo de todo el globo En este post, os hacemos un resumen de las principales tecnologías open source que se usan en estos proyectos,
Leer más...
En el primer capitulo que ha creado nuestro compañero Emilio Arias, tras el capitulo piloto de introducción, nos habla sobre la muerte del Business Intelligence, que muchos vienen contando en los últimos meses/años, tras la llegada de las herramientas de Data Discovery, Cloud Analytics, Data Preparation, self service, etc.
Leer más...
Apache NiFi es un sistema de flujo de datos basado en los conceptos de programación basada en flujo (FBP, del inglés Flow-Based Programming). Descargar Tutorial en español sobre Apache NifiAdmite gráficos dirigidos de enrutamiento de datos, transformación y lógica de mediación del sistema. Apache NiFi tiene una interfaz de usuario
Leer más...
Probably you want to learn from the best specialists in Big Data, Machine Learning and Artificial Intelligence. Thanks to recent Big Things Conference you can learn and enjoy of this On Demand Training. Up to 50 lessons covered with about 35 hours lenght
Leer más...
Presto es un motor de consulta SQL distribuido de alto rendimiento para grandes datos. Su arquitectura permite a los usuarios consultar una variedad de fuentes de datos como Hadoop, AWS S3, Alluxio, MySQL, Cassandra, Kafka y MongoDB. Incluso se pueden consultar datos de múltiples fuentes de datos en una sola
Leer más...
Muy interesante también sería conocer sobre lo siguiente: Muy interesante la aportación de Datastack en donde se definen los skills necesarios para ser un Data Engineer en este 2020 Recursos y enlaces gratuitos para aprender a ser Data Engineer:Apache Beam: IntroducciónApache Beam es un modelo unificado de código abierto
Leer más...