Uno de los temas más delicados en el Business Intelligence es la arquitectura del data warehouse y en particular la modelización. Ya conocemos el uso de tablas de hecho y dimensiones, y esquema en estrella y esquema en copo de nieve. Como todo, este modelo tiene sus limitaciones. Y no es otro que el impacto de un cambio en nuestros sistemas origen. Por mucho que la experiencia nos permita preparar por avanzado el data warehouse siempre hay detalles no previsibles.
Para intentar paliar este problema aparece un nuevo tipo de modelización: data vault, creado por Dan Lindsted.
¿En qué consiste?
Este método de modelización busca cubrir principalmente dos aspectos: proporcionar una trazabilidad máxima respecto los sistemas origen y ser absolutamente flexible ante cambios en los sistemas transaccionales. Por ello considera tres tipos de tablas:
- Hubs: contiene las claves de negocio.
- Links: relaciones n-m entre diferentes claves de negocio.
- Satellits: contienen la información histórica.
La idea es separar las claves de los atributos (siendo estos últimos los que realmente varían en el tiempo).
Para saber más, aquí.
Hola, estoy preparando una pasantia de la universidad (en Montreal, Canada) y posiblemente lo haga sobre este tema. Muchas gracias por la info.
German