A finales del mes pasado (Junio 22-26) tuvo lugar el evento anual de Databricks, la conocida distribución cloud del motor de procesamiento distribuido Big Data y machine learning open source, Apache Spark. En esta ocasión, las circunstancias impuestas por el Covid-19 han motivado que el evento se desarrolle íntegramente online
Leer más...
Dataiku es una herramienta colaborativa de tratamiento de datos donde pueden trabajar conjuntamente científicos de datos, ingenieros de datos y analistas de datos. A su vez tiene paneles dedicados a la monitorización de los equipos para ayudar a los gerentes de proyecto a controlar la actividad de su equipo. Descarga
Leer más...
This is a must. If you need extra info for this tools don´t hesitate to read this blog or write us. You can check more of this technologies in action here Big Data Lab
Leer más...
Os mostramos un ejemplo de como hacer funcionar un Cluster Hadoop con ejemplos y aplicaciones prácticas: Se trata de un clúster Hadoop con la distribución de Hadoop de Hortonworks HDP 2.6.5, la cual es 100% open source e incluye las últimas versiones de Apache Hive, Spark, Kafka, Superset,
Leer más...
Las empresas cada vez necesitan almacenar y procesar más datos sobre sus clientes, proveedores, personal o pedidos. Sin embargo, a mayor Volumen de datos, mayor es la probabilidad de que existan datos incorrectos, como las direcciones o teléfonos que afecten de forma negativa a nuestro negocio. Por ejemplo, un pedido
Leer más...
En las siguientes Aplicaciones, Cuadros de Mando y ejemplos podéis ver el funcionamiento práctico del Big Data en diferentes casos y usando diferentes tecnologías: Kafka, Spark, Apache Kylin, Neo4J.... Acceder a los ejemplos Si quieres saber más de Big Data, te pueden interesar estos enlaces: - OLAP for Big
Leer más...
Acceso Dashboard online Al abrirse la página de esta demostración, se solicita una conexión con el end point que provee los datos de la wikipedia, mediante un WebSocket . Enel servidor se crea una conexión con el cliente y mientras esté abierta y no ocurran errores en el
Leer más...
We could consider three types of Real Time when we manage data and depends on each stage: 1. Real Time Processing: Is the possibility of ingest data at the time the event is produced in real live. This includes only processing step, i.e copying data from source
Leer más...
Uno de los capítulos más interesante del curso ' Curso de Data Engineers' , de nuestros compañeros de Stratebi es el 11 . Machine Learning con Spark Este curso incluye ejercicios prácticos sobre nuestro Cluster . Os dejamos unas pinceladas del contenido de este capítulo:
Leer más...