Sobre la evolución del data warehouse

El concepto del data warehouse ha evolucionado de sobre manera en estos últimos años de forma que el concepto original nos sirve de partida pero para nada representa toda la variedad y riqueza de opciones presentes. Actualmente existen diferentes enfoques / tecnologías que aúnan una visión de tecnología optimizada, de necesidades de negocio y de incluso software específico para desplegar soluciones de Inteligencia de negocio.

Listemos alguna de ellas:

  • Inclusión de mapreduce en el software del data warehouse, que permite procesar grandes cantidades de datos distribuidas en clústers. Por ejemplo, en este punto tenemos a fabricantes como Greenplum o Aster Data Systems. Y empresas como Google o Facebook como usuarios destacados.
  • Soluciones in-memory, que despliegan estructuradas de datos multidimensionales en memoria con el objetivo de minimizar el tamaño de estructuras MOLAP así como agilizar la velocidad de consulta. Entre estos ejemplos tenemos Qlikview y Panopticon.
  • Estructuras multidimensionales.
  • Estructuras federadas de data marts.
  • Integración a tiempo real.
  • Data marts específicos.
  • Active Data Warehouse.
  • Soluciones que conjunta software y hardware optimizado (con algunas de las características comentadas). Por ejemplo, estamos hablando de fabricantes como Teradata o Kickfire.
  • Bases de datos híbridas (columnas y filas) que permiten beneficiarse de las características singulares tanto de desarrollos por filas o por columnas.

Es decir, estamos hablando de elementos que pueden formar parte de la arquitectura de un data warehouse.  Y es por lo tanto necesario, en el momento de su diseño, tener una visión a corto, medio y largo plazo para no estar limitados a posteriori en nuestras necesidades de análisis de información. Me reafirmo: por lo que es importante, primero identificar las necesidades, plasmar qué tipo de arquitectura es la adecuada para las mismas y posteriormente ir a buscar la tecnología que resuelva nuestras necesidades.

CIF vs MD

Si bien hace ya muchos días que escribí este articulo (en el año pasado, como en el olvido), ahora por fin está disponible para su descarga mi nuevo artículo para la revista gestión del rendimiento. Lo podéis encontrar en el número 10: CIF vs MD.

Espero que lo encontréis interesante.