Es, sin duda, uno de los ejemplos más clásicos de la llamada business intelligence (BI), utilizado en las escuelas de negocio de todo el mundo para ilustrar cómo el análisis de los datos de los clientes puede llevar a conclusiones interesantes y aprovechables en el contexto del denominado market-basket analysis: la correlación entre los pañales y la cerveza. Estos dos productos, aparentemente tan poco relacionados, protagonizan una historia que los profesores y estudiantes de marketing suelen atribuir a lo que ocurrió en una gran superficie (unas veces es Wal Mart, otras veces Osco) cuando se empezó a utilizar software analítico para combinar el análisis de los datos de compras con los demográficos obtenidos de la tarjeta de lealtad de los clientes. Según la historia, se descubrieron una serie de asociaciones, algunas perfectamente lógicas (cereales y leche, o ginebra con tónica y limones), y una completamente inesperada: pañales y cerveza. Aparentemente, los clientes masculinos, cuando compraban pañales los viernes por la noche, tenían además una gran tendencia a adquirir también cerveza. De ahí surgió toda una amplia gama de teorías psicológicas sobre cómo los hombres, cuando eran enviados a por pañales al supermercado, asociaban la idea con la de obtener alguna recompensa para ellos, o unían viernes noche con cerveza y, a pesar de ser ya padres, proseguían con el comportamiento aprendido de solteros. A resultas de esa recién descubierta correlación, la gran superficie decide mover la cerveza al lado de los pañales, y obtiene gracias a ello un incremento de ventas.
Hasta aquí, todo muy bien. Es, como dice Seth Godin en su fantástico libro, una buena historia, una de esas que aparentemente tiene patas, que se sostiene, que gusta contar. ¿El problema? Muy sencillo: que es mentira. Lisa y llanamente falsa. Es una recolección de datos inconexos que comienza con el descubrimiento de una inofensiva correlación entre consumo de pañales y cerveza no adscrita a sexo ni a día de la semana alguno, que continúa con unos cambios en el store layout que las grandes superficies nunca tomaron, y que prosigue con los supuestos buenos resultados que las grandes superficies presuntamente obtuvieron. En realidad, nada. Simplemente, una correlación inofensiva no sustentada que podría servir para ilustrar la diferencia entre la búsqueda orientada de hipótesis y la mera exploración de los datos, y que los vendedores de software de BI suelen usar con profusión para poner los dientes largos a los clientes con eso de “anda que si encuentras algo así, inesperado y rentable…” Pues a lo mejor lo encuentras, pero esperemos que si lo haces sea, al menos, más cierto que la historia de los pañales y la cerveza.
Para más explicaciones, este artículo en The Register y esta anotación de Daniel J. Power, uno de los implicados en el comienzo de esta leyenda urbana.






18.04.2007 a las 13:41 Permalink
[...] Cesar de Miguel, Nuevos Enfoques de BBDD Y encima es mentira. Casi casi haciendo live-blogging en [...]
24.06.2010 a las 08:01 Permalink
[...] Los puedes situar por formas, colores, espacios, categorías, tipología de clientes o precios, pero ten presente que entre el 50 y el 70% de las decisiones de compra se toman en el punto de venta y la exhibición del genero es determinante, especialmente, si hay espacios de libre servicio. Además de los criterios de clasificación de tus productos analiza el rendimiento por zonas de exposición y la afinidad de los productos que llevan en un mismo ticket, como el famoso caso de los pañales con la cerveza. [...]
27.12.2010 a las 02:08 Permalink
[...] (Para mas información, lean sobre “La Minería de Datos“, y el ejemplo del Por que los pañales están al lado de las cervezas) [...]