El Blog de Enrique Dans

¿Pañales y cerveza?

Escrito a las 11:15 pm
15

ImagenEs, sin duda, uno de los ejemplos más clásicos de la llamada business intelligence (BI), utilizado en las escuelas de negocio de todo el mundo para ilustrar cómo el análisis de los datos de los clientes puede llevar a conclusiones interesantes y aprovechables en el contexto del denominado market-basket analysis: la correlación entre los pañales y la cerveza. Estos dos productos, aparentemente tan poco relacionados, protagonizan una historia que los profesores y estudiantes de marketing suelen atribuir a lo que ocurrió en una gran superficie (unas veces es Wal Mart, otras veces Osco) cuando se empezó a utilizar software analítico para combinar el análisis de los datos de compras con los demográficos obtenidos de la tarjeta de lealtad de los clientes. Según la historia, se descubrieron una serie de asociaciones, algunas perfectamente lógicas (cereales y leche, o ginebra con tónica y limones), y una completamente inesperada: pañales y cerveza. Aparentemente, los clientes masculinos, cuando compraban pañales los viernes por la noche, tenían además una gran tendencia a adquirir también cerveza. De ahí surgió toda una amplia gama de teorías psicológicas sobre cómo los hombres, cuando eran enviados a por pañales al supermercado, asociaban la idea con la de obtener alguna recompensa para ellos, o unían viernes noche con cerveza y, a pesar de ser ya padres, proseguían con el comportamiento aprendido de solteros. A resultas de esa recién descubierta correlación, la gran superficie decide mover la cerveza al lado de los pañales, y obtiene gracias a ello un incremento de ventas.

Hasta aquí, todo muy bien. Es, como dice Seth Godin en su fantástico libro, una buena historia, una de esas que aparentemente tiene patas, que se sostiene, que gusta contar. ¿El problema? Muy sencillo: que es mentira. Lisa y llanamente falsa. Es una recolección de datos inconexos que comienza con el descubrimiento de una inofensiva correlación entre consumo de pañales y cerveza no adscrita a sexo ni a día de la semana alguno, que continúa con unos cambios en el store layout que las grandes superficies nunca tomaron, y que prosigue con los supuestos buenos resultados que las grandes superficies presuntamente obtuvieron. En realidad, nada. Simplemente, una correlación inofensiva no sustentada que podría servir para ilustrar la diferencia entre la búsqueda orientada de hipótesis y la mera exploración de los datos, y que los vendedores de software de BI suelen usar con profusión para poner los dientes largos a los clientes con eso de “anda que si encuentras algo así, inesperado y rentable…” Pues a lo mejor lo encuentras, pero esperemos que si lo haces sea, al menos, más cierto que la historia de los pañales y la cerveza.

Para más explicaciones, este artículo en The Register y esta anotación de Daniel J. Power, uno de los implicados en el comienzo de esta leyenda urbana.

Publicidad

3 trackbacks

[...] Cesar de Miguel, Nuevos Enfoques de BBDD Y encima es mentira. Casi casi haciendo live-blogging en [...]

[...] Los puedes situar por formas, colores, espacios, categorías, tipología de clientes o precios, pero ten presente que entre el 50 y el 70% de las decisiones de compra se toman en el punto de venta y la exhibición del genero es determinante, especialmente, si hay espacios de libre servicio. Además de los criterios de clasificación de tus productos analiza el rendimiento por zonas de exposición y la afinidad de los productos que llevan en un mismo ticket, como el famoso caso de los pañales con la cerveza. [...]

003

[...] (Para mas información, lean sobre “La Minería de Datos“, y el ejemplo del Por que los pañales están al lado de las cervezas) [...]

12 comentarios

001
Clotilde
20.08.2006 a las 23:42 Permalink

O sea, que al final era mentira.

Pues vaya, yo ya me había emocionado.

002
tendero_digital
21.08.2006 a las 07:38 Permalink

En mi trabajo de por las mañanas me peleo con un Datawarehouse y unas cuantas herramientas de BI. Una de nuestras tareas más divertidas es cuando nos viene algún jefe con una de esas hipótesis de que los clientes que hacen xxx también comparan fff. Y lanzas las consultas y no encuentras ningún resultado empírico que sustente la teoria…
Por cierto ha sido asociación mientras leía tu entrada tenía encima de la mesa (en su enésima relectura) el mejor libro de gestión empresarial del universo: “El Principio de Dilbert” en el capítulo dedicado a los consultores, donde se cuenta el caso de una empresa a la que los consultores le estaban planteando un plan de rediseño y ponían como ejemplo una empresa que se había reconvertido a vender bicicletas hechas a medida. Uno de los mandos intermedios de la empresa decide comprarse una de las bicicletas de la empresa puesta como ejemplo por los consultores y resulta que la empresa hacía 6 meses que había quebrado… consultores…

003
josempelaez
21.08.2006 a las 07:56 Permalink

Lo que más me ha gustado de esta ilustrativa historia es que podamos devolver ciertas creencias al estadio de las ideas cuestionadas, ¡tan sólo con una “marca personal” en la web 2.0 ;)!
Otro punto que me ha parecido interesante es que puedan apreciarse algunos distingos entre una labor típica de mercadotécnico, consultor y académico… Todos podemos opinar, evidentemente, pero la epistemología tiene sus cositas.

004
Pablo
21.08.2006 a las 08:53 Permalink

Los pañales nunca están al lado de las cervezas; y lo sé perfectamente, ya que, en el camino de un producto a otro por el Mercadona, aprovecho para coger el aceite.
(Ya hago la compra solito, y sin GPS…y no se me cuelan las viejas en la carne).

005
Jorge
21.08.2006 a las 09:01 Permalink

Anda, con las veces que he explicado esto yo en clase para ilustrar la utilidad de la Mineria de Datos, además siempre lo he sazonado con “… y su os fijais nunca encontrares en ningún supermercado los pañales al lado de las cervezas, eso es para que os lo recorrais todos y sigais comprando”. Este año tendré que poner delante lo de “cuenta la leyenda” a la hora de explicarlo.

Pero no confundamos Business Intelligence con Mineria de Datos. Siendo muy relajados podríamos decir que la segunda es parte de la primera pero son dos disciplinas totalmente diferentes.De hecho en el link que nos ha puesto Enrique se hace referencia a… “What is the “true story” about data mining, beer and diapers?”

Como dice tendero_digital, una cosa es probar a ver si hay suerte con los datos y buscar una relación entre conductas de clientes (que seguranmente fallará como el ejemplo que nos ha dicho) y otra muy distinta es que sean los datos los que te digan que correlaciones tienen entre ellos, muchas serán tonterias pero puedes encontrar alguna que sea util y se te haya pasado por alto.

Si no fijaos en las compañias farmaceuticas, los bancos y las compañias de seguro, no podrían sobrevivir sin el uso de la mineria de datos.

006
Gurus
21.08.2006 a las 12:08 Permalink

Bueno, al final por mucha Data Mining, Consultoria, CRM o Business Intelligence, como no pises el terreno y le vayas a preguntar a los que están en las trincheras lidiando con los clientes, puedes cometer graves errores si tomas las decisiones sentadito desde la Torre de Cristal. Todo se complementa, pero la toma de decisiones basada en la fría lectura de cifras suele ser fatal.

007
jose luis portela
21.08.2006 a las 16:19 Permalink

Hola

Pues yo tambien he utilizado el ejemplo en mis clases del IE. La verdad es que aunque sea mentira, era un buen ejemplo ya que ilustraba bien el tema, y se podrá seguir utilizando concretando que es una leyenda urbana.

La segunda lectura que saco es que existen como estas muchisimas cosas en la vida que se tratan de leyendas urbanas y que la mayoría las damos por buenas y correctas. Pero ojo no solo leyendas sino fenomenos o explicaciones a cosas que llevamos años utilizando y que son falsas

Si os interesan esta cosas compraros “lo que Einstein le conto a su barbero” que es un libro que explica fenomenos fisicos cotidianos que muchos pensamos que son de otra forma. Es mas yo como ingeniero estaba equivocado en muchas cosas

En fin como siempre llego a la misma conclusion, TODO LO QUE SABEMOS TIENE UNA CIERTA PROBABILIDAD DE SER MENTIRA POR LO QUE TENEMOS QUE ESCUCHAR MUCHO, Y NO CREERNOS SIEMPRE EN LA VERDAD ABSOLUTA DE TODO. POR TANTO LA MAYORIA DE LAS DISCUSIONES QUE TENEMOS A DIARIO NO SIRVEN PARA NADA YA QUE NOS EMPEÑAMOS EN DEMOSTRAR QUE TENEMOS LA VERDAD EN LUGAR DE PENSAR SI LO QUE NOS ESTAN DICIENDO PUDIERA SER MAS VERDAD QUE LO NUESTRO

008
Javier's Economics
22.08.2006 a las 15:26 Permalink

Otro ejemplo de marketing que ha resultado ser una leyenda urbana.

009
Ángel M.
30.08.2006 a las 09:50 Permalink

En realidad estáis dejando atrás una conclusión (o más bien un principio) muy importante: La correlación no implica la causa. El ejemplo de los pañales y la cerveza me recuerda muchísimo al genial gráfico de “calentamiento del planeta frente a número de piratas” de los pastafaris (ver “pastafarismo” en la wikipedia castellana para pasar un buen rato) ;-)

Un saludo y, una vez más, enhorabuena por tu blog.

010
jose
14.10.2008 a las 00:19 Permalink

pues resulta que el jueves pasado mi profesor de gestion de la informacion, para hacernos creer que su asginatura a pesar de ser optativa es de gran importancia, nos conto dicha historia. nos conto que en una gran superficie de cordoba vieron como las ventas de cerveza y productos parecidos bajaban en un 30% y como la gerente de dicho almacen, observo como los pañales se comportaban de la misma forma que la cerveza y demas productos parecidos. el problema segun él, fue que movieron los pañales de sitio en la tienda y esto provoco las caidas de las ventas. para su comparación la gerente utilizo el coeficiente estadistico r2 y segund nuestro profesor ahora es una de las gerentes que mas cobra. mi curiosidad me llevo a buscarlo en internet y cual ha sido mi sorpresa cuando he visto esto jajajaja.

011
Eduardo Sanchez
22.12.2010 a las 21:33 Permalink

Estoy de acuerdo con Jorge y en tener cuidado entre la confusión de lo que es un Business Intelligence y para qué sirve…y para qué se utilizan los sistemas de inteligencia artificial, donde una de sus aplicaciones es el data mining. El Business Intelligence está situado en una capa superior a los ERPs, CRM y demás sistemas de gestion empresarial para extraer de forma rápida la informacion además de reflejar los resultados de las estrategias empresariales, entre muchas otras cosas. Y capturar inferencias a través de modelos matemáticos es otra cosa.

012
Javier
02.01.2012 a las 18:08 Permalink

Hola amigos, soy de Perú y me encuentro realizando un estudio de Market Basket Analysis,la verdad es realmente emocionante estos temas BI.

Por favor me podrían proporcionar cual es el Support, Confidence y Lift de este estudio (Pañales y cerveza), necesito compararlo con los valores que obtuve.

Cualquier consulta sobre modelos estadísticos me escriben.

javier_javicho@yahoo.es

Saludos

Dejar un comentario

Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

XHTML: Puedes utilizar estas etiquetas: A ABBR ACRONYM B BLOCKQUOTE CITE CODE DEL EM I Q STRIKE STRONG IMG

Logotipo de Blogestudio Logotipo de Acens