TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Una oportunidad para los Datawarehouse Appliances

Los Datawarehouse Appliances , cada vez más se están convirtiendo en una gran alternativa a la hora de montar nuestros sistemas Business Intelligence y DataWarehouse. De hecho, no se puede hablar de ellos de forma uniforme, pues existen diferentes tipos , como ya comentamos en un post anterior en TodoBI .

netezza
Ejemplo de DW Appliance de Netezza
Básicamente, lo que se pretende es 'quitar complejidad' en la implementación de un DW. Durante muchos años he visto en implmentaciones en las que ya se tenía decidido usar, por ejemplo, Oracle como Gestor de Base de Datos y Business Objects como Suite Business Intelligence y, sin embargo, se dejaba para el final el tema de los servidores, SO, backups, etc... Es decir, se podía haber iniciado el proyecto y aún no saber si correría sobre Windows, Unix, Linux... o IBM, Sun, HP, Microsoft, Dell, etc...
Incluso, había un gran desconocimiento por parte de los fabricantes de Hardware de en saber en qué consistía un DW preparado y optimizado para consultas analíticas... por ello, son muy buenas noticias que surgieran alternativas intermedias que proporcionaran un 'todo incluido' , tan famoso en nuestros días y aplicable a todo tipo de situaciones: viajes, restaurantes, gestiones bancarias, etc...
Basicamente, un DW Appliance es un conjunto integrado de servidores, discos de almacenamiento, Sistemas Operativos, Bases de Datos y Software, ya preinstallado y preparado para montar y hacer funcionar (incluyendo las facilidades de escalabilidad y performance, tan importantes en el mantenimiento de un DW), un sistema DataWarehouse.
De forma derivada, tambien se ha empezado a aplicar el término a soluciones en las que las combinaciones priman sobre todo los componentes de Software.
Porqué ha llegado el momento a los DW Appliances?
- Nuevas empresas, con gran crecimiento de datos (muchas de ellas de los países emergentes, como la India Reliance Communications , que es una especie de Verizon o AT&T, con 40 millones de clientes, añade cada mes, un millón y medio mas... y para ello, están usando Greenplum (que, por cierto, tiene una versión Open Source para la comunidad), y han conseguido que (con mas datos), vaya tres o cuatro veces más rápido que su antiguo DW.
- Otras empresas empresas estan optando por HP Neoview, Netezza, Brighthouse appliance. Existen grandes clientes como New York Stock Exchange y WalMart , que están optando por Appliances, por lo que sólo cabe concluir que el momento ha llegado, basicamente por dos motivos muy simples (según indican los responsables de las empresas que los están usando: cuestan menos dinero y se obtienen mejores rendimientos).
- En España y en el mundo latino en general, su uso es aún testimonial, pero no cabe duda, que poco a poco empezarán a ser utilizadas en grandes organizaciones.
Cuales son las principales ventajas :
- Reducción del Coste Total:
Gran parte de los costes asociados, como los de monitorización y tuning, se ven claramente reducidos con estos sistemas ya preparados, así como otros costes de entrada y puesta en funcionamiento, parches, compatibilidad de versiones entre todos los elementos de la infraestructura (todos los que hayan tenido que montar un DW en los ultimos 15 años, sabrán a que tipo de problemas y 'torturas' me refiero).
Ni que decir tiene, que en un entorno como el actual, en el que la reducción de costes es tan importante, este tipo de soluciones estan encontrando una gran acogida.
- Mejoras en el rendimiento:
Como están orientados al análisis, este tipo de DW Appliances optimizan el rendimiento de las queries mediante el uso de paralelización de queries, a través de diferentes tipos de particionamiento.
- Reduce el tiempo dedicado a la Administracion:
Como un solo vendedor proporciona toda la solución, no se necesita que un Administrador sea experto en DW, BI, DBA, tuning, etc... Se crean consolas de administración que alejan toda esta complejidad.
- Mejora la disponibilidad del sistema ante 'caidas'
Se crean elementos redundantes dentro del DW y otro tipo de tecnologías de duplicidad (mirroring, dual servers...etc)
- Escalabilidad.
Este sea probablemente uno de los puntos críticos y claves del éxito de los DW Appliances. Puesto que nos garantizan de forma real la escalabilidad tanto en rendimiento, como en capacidad... pues no 'manejamos un frankenstein de componentes', sino un sistema integrado.
Todo esto se hace, además, sin necesidad de dejar los sistemas parados durante upgrades, realizar updates periódicos, etc...
- Rápido retorno de la inversión.
Este es un punto discutible de cualquier sistema BI/DW, pero está claro que si se facilita la instalación/confuguración, se automatiza la creación de indices, se paralelizan queries y se automatiza la administración... la creación de prototipos rápidos y valoración de resultados será mucho más facil.