A rey muerto, rey puesto

Dicen que tras las últimas elecciones presidenciales, Big Data ha muerto o, como mínimo, sus beneficios se han puesto en duda. Casi todos los medios han fallado en predecir la victoria de Donald Trump y algunos de ellos bastante famosos como Nathan Silver’s FiveThirtyEight. No es la primera vez, tenemos también que las encuestas del Brexit fallaron considerablemente en predecir su éxito. O por ejemplo, el sorpasso de Podemos al PSOE en España hace unos meses.

Algunas de los comentarios es que Trump no uso Big Data y simplemente se apoyó en un carisma y mensaje populista que ha llamado la atención a un considerable segmento de la población. Y la canción reza que Big Data, y por extensión Analytics, no son necesarios. Nada más lejos de la realidad cuando todo parece indicar a parte de apoyarse en dicho factor, su equipo ha estado apalancándose en los productos y servicios de Cambridge Analytics. Sin duda alguna estamos ante la siguiente fase del competir en el dato en las elecciones generales de un país fundamentadas en behavioral microtargeting y miles puntos dinámicos por persona. Esto no es nuevo y ya lo hemos visto en otras empresas con enfoque similar pero diferente sector como Kreditech.

Otra lectura mucho más realista es analizar el error. Partamos de un hecho, los modelos que usamos son una representación de la realidad y, por lo tanto, por definición erróneos. Nos permiten predecir la realidad siempre y cuando las condiciones de partida (nuestras hipótesis) se mantengan constantes. El error puede estar en múltiples puntos: en el conjunto que datos que es incompleto, erróneo o no representativo, en el modelo o incluso en nuestra interpretación. Además, a esto debemos añadir el contexto que se tiene en cada una de las elecciones. FiveThirtyEight empieza una discusión sobre el tema, desde mi punto de vista más como una excusa para explicar que fallaron menos que los demás y no perder crédito.

La lectura, desde mi punto de vista, es triple: (1) desarrollar un pensamiento crítico y análitico para con nuestros análisis, (2) tener presente siempre que estamos trabajando con una simplificación de la realidad y (3) que debemos mejorar de forma continua los dos activos más críticos sobre los que se apalancan las organizaciones orientadas al dato: los conjuntos de datos relevantes y los algoritmos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.