How to create a data warehouse/Como crear un data warehouse

This is a really special month for me. At the beginning of November, my second book (that reviews Customer Analytics) was published. Probably you already know that my first book is about Business Intelligence.

And now my third book has been published as well! This book is about «How to create a data warehouse«. What is interesting is that the book has a complementary wiki with additional content (videos and detailed explanations) that will help the readers in their journey. As you can imagine, this is a technical book and we use, in this case, Microsoft Technologies.

You can find it here:

http://www.editorialuoc.cat/como-crear-un-data-warehouse

This book is the recommended book in some of my courses.

—-

Este mes es realmente especial para mí. Al principio del mismo, mi segundo libro (cuya temática es Customer Analytics) fue publicado. Como ya sabéis, mi primer libro trata sobre Business Intelligence.

¡Y ahora mi tercer libro ha sido publicado también! Este libro trata de «cómo crear un data warehouse». Ya sabéis, el núcleo de un sistema de Inteligencia de Negocio. Una de las cosas que es interesante de este libro es que tiene un Wiki complementario (que incluye videos e instrucciones detalladas) que a bien seguro ayudará a los lectores. Como os podéis imaginar este es un libro técnico que, en este caso, se apoya en las tecnologías de Microsoft.

Lo podéis encontrar aquí:

http://www.editorialuoc.cat/como-crear-un-data-warehouse

Este libro es la base de algunos de los cursos que imparto.

Sobre la evolución del data warehouse

El concepto del data warehouse ha evolucionado de sobre manera en estos últimos años de forma que el concepto original nos sirve de partida pero para nada representa toda la variedad y riqueza de opciones presentes. Actualmente existen diferentes enfoques / tecnologías que aúnan una visión de tecnología optimizada, de necesidades de negocio y de incluso software específico para desplegar soluciones de Inteligencia de negocio.

Listemos alguna de ellas:

  • Inclusión de mapreduce en el software del data warehouse, que permite procesar grandes cantidades de datos distribuidas en clústers. Por ejemplo, en este punto tenemos a fabricantes como Greenplum o Aster Data Systems. Y empresas como Google o Facebook como usuarios destacados.
  • Soluciones in-memory, que despliegan estructuradas de datos multidimensionales en memoria con el objetivo de minimizar el tamaño de estructuras MOLAP así como agilizar la velocidad de consulta. Entre estos ejemplos tenemos Qlikview y Panopticon.
  • Estructuras multidimensionales.
  • Estructuras federadas de data marts.
  • Integración a tiempo real.
  • Data marts específicos.
  • Active Data Warehouse.
  • Soluciones que conjunta software y hardware optimizado (con algunas de las características comentadas). Por ejemplo, estamos hablando de fabricantes como Teradata o Kickfire.
  • Bases de datos híbridas (columnas y filas) que permiten beneficiarse de las características singulares tanto de desarrollos por filas o por columnas.

Es decir, estamos hablando de elementos que pueden formar parte de la arquitectura de un data warehouse.  Y es por lo tanto necesario, en el momento de su diseño, tener una visión a corto, medio y largo plazo para no estar limitados a posteriori en nuestras necesidades de análisis de información. Me reafirmo: por lo que es importante, primero identificar las necesidades, plasmar qué tipo de arquitectura es la adecuada para las mismas y posteriormente ir a buscar la tecnología que resuelva nuestras necesidades.