Análisis de la cesta de la compra [Análisis de asociación]
Ejemplo de datosEl análisis de la cesta de la compra (también llamado análisis de asociación) es uno de los métodos más importantes utilizados para descubrir las relaciones entre los artículos. Busca las combinaciones de artículos que aparecen juntas con frecuencia en las transacciones. En otras palabras, permite a los minoristas identificar las relaciones entre los artículos que compran los clientes.
¿Qué hace el análisis de asociación?
Supongamos que has creado tu propia tienda de ropa online. Tu objetivo ahora es conseguir el mayor volumen de negocio posible con la misma.
Para lograr las mayores ventas posibles, naturalmente quieres que cada cliente compre lo máximo posible. Una forma de motivar al cliente para que compre más productos es sugerirle más productos. La gran pregunta ahora es: ¿Qué producto sugiero mejor al cliente? Aquí es donde entra en juego el análisis de la cesta de la compra o el análisis de asociación.
El análisis de la cesta de la compra da una respuesta a la pregunta: ¿Qué probabilidad hay de que un cliente compre el producto A si ya tiene el producto B en su cesta de la compra?
El análisis de la cesta de la compra indica qué productos o bienes se suelen comprar juntos. Así, si un cliente ya tiene unos vaqueros y unos zapatos en la cesta de la compra, ¿qué probabilidad hay de que este cliente compre también una camisa, unos calcetines o una camiseta?
Ejemplo de análisis de la cesta de la compra
Para calcular un análisis de la cesta de la compra, es necesaria una lista de compras anteriores, en la que se pueda ver qué productos se compraron juntos en una sola compra.
Así que tienes los respectivos productos en la lista y cada fila es una transacción. Digamos que en los datos de ejemplo se encuentran los productos vaqueros, camisa, chaqueta y zapatos.
Cada fila es una transacción o una compra. "1" significa comprado, "0" significa no comprado. Por lo tanto, la primera persona compró unos vaqueros, una camisa y unos zapatos.
Ahora, para tener resultados que podamos interpretar, vamos a realizar primero un análisis de la cesta de la compra utilizando numiqo para estos datos. Para ello, dirígete a la calculadora de análisis de la cesta de la compra en numiqo y copia tus datos en la tabla.
Ahora podemos especificar un soporte mínimo y una confianza mínima. Para estos datos, numiqo nos ha calculado estas reglas de asociación:
Las reglas de asociación son de la siguiente forma: si los productos de la columna Lhs (Left hand side - lado izquierdo) están presentes en una transacción, entonces los productos de la columna Rhs (Right hand side - lado derecho) también están presentes con cierta probabilidad.
Interpretar los resultados del análisis de la cesta de la compra
Observamos los resultados del análisis de la cesta utilizando el primer conjunto de reglas de asociación.
Frecuencia
La frecuencia en la tabla de resultados nos indica la frecuencia con la que los productos de la izquierda y la derecha aparecen en una transacción. En nuestro caso, la frecuencia con la que la camisa y los zapatos aparecen en una transacción.
Así que vamos a contar en cuántas transacciones aparecen ambos: son 8 transacciones.
Soporte
El soporte nos dice en qué porcentaje de todas las transacciones se da la compra o, en otras palabras, qué probabilidad hay de que la camisa y los zapatos aparezcan juntos en una transacción. Así que simplemente dividimos la frecuencia por el número de todas las transacciones.
Tenemos 19 transacciones en total, así que obtenemos 8/19, que es igual a 0.42. Por lo tanto, la probabilidad de que la camisa y los zapatos aparezcan en una transacción es del 42%.
Confianza
La confianza nos indica qué probabilidad hay de que, si los productos bajo las Lhs están en un pedido, los productos bajo las Rhs estén también en la cesta de la compra.
En nuestro ejemplo esto significa: ¿Qué probabilidad hay de que, si la camisa está en la cesta, entonces los zapatos también lo estén? Podemos calcularlo dividiendo la frecuencia de la camisa y los zapatos por la frecuencia de la camisa.
Elevación
Y por último, la elevación. La elevación indica el factor por el cual la probabilidad de comprar los productos bajo Rhs aumenta si los productos bajo Lhs ya han sido comprados. Así, en nuestro ejemplo, si el producto camisa está en la cesta de la compra, es 1.27 veces más probable que se compre zapatos que si el producto camisa no está en la cesta.
Análisis de la cesta de la compra y minería de datos
El análisis de la cesta de la compra es un método del campo de la minería de datos. Dependiendo de la cantidad de datos disponibles, el análisis puede ser muy intensivo desde el punto de vista computacional.
Sin embargo, con el algoritmo Apriori, existen métodos muy eficaces para determinar de forma eficiente las reglas de asociación.
Nota crítica sobre el análisis de la cesta de la compra
Supongamos que el análisis de la cesta de la compra muestra que si una persona compra unos vaqueros y zapatos, hay una alta probabilidad de que también compre una camisa. Ahora sugieres una camisa a todos los clientes que compran vaqueros y zapatos. Esto aumenta la probabilidad de que se compre una camisa bajo esta condición y se falsea otro análisis futuro de la cesta de la compra.