Una definición de Data Warehousing
Existen muchas definiciones de Data Warehousing. Aquí va a alguna de las que más me gusta.
Mi definición favorita de un Data Warehouse es una versión levemente modificada de la definición de Ralph Kimball :
Un Data Warehouse es una copia de los datos de la transacción estructurados específicamente para preguntar y divulgar .
Ralph indica que un Data Warehouse es "una copia de los datos de la transacción estructurados específicamente para la pregunta y el análisis". Dos precisiones que tengo con la definición de Ralph son:
1) los datos no transaccionales se almacenan a veces en un Data Warehouse, aunque el 95-99% de los datos es sin embargo generalmente datos de la transacción.
2) Prefiero decir "pregunta y divulgación" más bien que "pregunta y análisis" porque la salida principal de sistemas de un Data Warehouse son listados tabulares (preguntas) con el formato mínimo o informes "formales" altamente ajustados a formato. Las preguntas y los informes generados de la información almacenada en un Data Warehouse puede o no utilizarse para el análisis.
La forma de los datos almacenados no tiene nada hacer con si algo es un Data Warehouse o no.
Un Data Warehouse se puede normalizar o desnormalizar. Puede ser una base de datos relacional, base de datos multidimensional, fichero "plano", base de datos jerárquica, base de datos por objetos, etc.
El Data Warehouse no está exclusivamente dedicado al uso de los "decision-makers" o utilizado en el proceso de la toma de decisión.
Por supuesto si usted desea definir a cada usuario como un 'decision-maker' y todas las actividades como procesos de toma de decisión, entonces mi aserción es falsa. Pero en mi experiencia, muchas de las aplicaciones de los Data Warehouses están para cosas mucho más mundanas y puntuales. De hecho, creo que la mayor parte de Data Warehouses se usan para ver el efecto en los datos de decisiones tomandas previamente por otros.
Comentarios recogidos de: The Data Warehousing Information Center
Tags: Teoria