TodoBI - Business Intelligence, Big Data, ML y AI TodoBI - Business Intelligence, Big Data, ML y AI

Conceptos Fundamentales de Business Intelligence

🚀 Me podréis llamar 'pesado', pero para crear completas y complejas Arquitecturas de Datos en Producción, incluso en la 'Era AI' y 'Cloud Native', hay que tener muy claros los conceptos fundamentales

Veo a menudo, tanto en 'roles analíticos de entrada', como en 'roles altos de IT', que se pierde el foco en lo que es 'Analizar información de valor'

Hay muchos tipos de Arquitecturas de Datos nuevas, por aquí lo cuento, https://lnkd.in/e-fk8cTF, pero 'back to basics' 😊

1. Definición de Data Warehouse (DW) y Data Mart: El DW e es un repositorio unificado, físico o lógico, que recopila datos de los diversos sistemas de una empresa con fines principalmente analíticos. Un DM es un subconjunto de datos diseñado para ayudar a un área específica del negocio a tomar mejores decisiones

2. Características del Data Warehouse: Incluyen estar orientado a temas (organizado por áreas de negocio), ser integrado (procedente de diferentes fuentes), ser variable en el tiempo (registra periodos incrementales de datos) y ser no volátil (los datos se añaden, no se actualizan ni se modifican)

3. Dimensiones: Representan los conceptos desde los que se analizan los hechos y responden a las preguntas ¿QUIÉN, DÓNDE, CUÁNDO?. Contienen los descriptores textuales de los hechos y se encuentran en tablas separadas. Ejemplos comunes incluyen Fecha, País y Cliente

4. Hechos: Representan aquello que se quiere medir, respondiendo a la pregunta ¿QUÉ?. Almacenan datos numéricos e Indicadores Clave de Rendimiento (KPIs) y constituyen la tabla central en un modelo multidimensional. Estas tablas tienden a crecer "a lo alto" (añadiendo nuevos sucesos), no a lo ancho

5. Importancia de la Granularidad: Establece con precisión lo que representa una sola fila de la tabla de hechos. Declarar el grano (el nivel de detalle, por ejemplo, Año, Mes o Día) es el paso fundamental en el diseño dimensional, ya que garantiza que todos los hechos y dimensiones sean consistentes

6. Gestión de Claves en Dimensiones: Los DW deben utilizar claves sustitutas (subrogadas o surrogated keys), que son números asignados en secuencia, en lugar de las claves naturales provenientes del sistema transaccional. Esto se debe a que las claves naturales de origen pueden ser incompatibles, mal administradas o cambiar a lo largo del tiempo, lo que generaría múltiples filas de dimensión para la misma clave natural

7. Modelado en Estrella (Star Schema): Este es el modelo de diseño dimensional más habitual y sencillo. Se caracteriza por una tabla central de hechos relacionada con múltiples tablas de dimensiones desnormalizadas, lo que significa que la información de distintos niveles (como Continente, País y Ciudad) reside en la misma dimensión. Es fácilmente reconocible por los usuarios de negocio y generalmente reduce el número de tablas