[MÚSICA] Bienvenidos a un nuevo video en este curso de Minería de Datos. Hoy veremos lo que son las reglas de asociación. Una de las aplicaciones más directas de las reglas de asociación es el análisis de las compras de productos en tiendas. Este análisis nos puede llevar a encontrar patrones de interés que sirven para descubrir grupos de productos que se venden juntos o productos cuya venta es gatillada por la venta de otros. Algunas de las aplicaciones del análisis mencionado anteriormente pueden ser el ordenamiento de productos, definir patrones de navegación dentro de tiendas, sugerir promociones efectivas de pares de productos, generar descuentos específicos para cada cliente. Otra aplicación muy interesante es el análisis de encuestas, aquí podemos imaginar una encuesta como una compra donde cada respuesta corresponde a un producto específico que incluye la encuesta. Esta analogía nos permite ver una base de datos de encuestas de la misma forma en que vemos una base de datos de compras de productos. Algunas aplicaciones del análisis mencionado anteriormente son: descubrir patrones desconocidos de las respuestas de la gente encuestada, comprobar algunas hipótesis sobre las preferencias de las personas y, encontrar relaciones de asociación entre variables incluidas en las preguntas. Por ejemplo cuando una persona responde que su profesión es médico y que su edad está entre 25 y 30 años en el 80% de los casos esas personas responden que son solteras. El algoritmo más comúnmente usado para encontrar reglas de asociación es el algoritmo Apriori, este algoritmo nos permite encontrar reglas de asociación en forma automática desde los datos. A continuación veremos algunas definiciones básicas que nos permitirán entender el funcionamiento de este algoritmo. Un Itemset es una colección de uno o más ítems, por ejemplo el conjunto leche, pañales y cerveza corresponde a un itemset. El Soporte tiene que ver con el número de veces que aparece un itemset en la base de datos, típicamente el soporte es relativo es decir corresponde a la cantidad de veces que aparece un itemset en la base de datos de compras dividido por el total de las transacciones. Diremos que un itemset es frecuente cuando su soporte es mayor a un umbral que tendremos que definir previamente, en otras palabras, cuando el itemset aparece en la base de datos con una frecuencia mayor a ese umbral. Una regla de asociación es una expresión de la forma x flecha y donde x e y son los itemset, por ejemplo leche y pañales flecha cerveza. Podemos interpretar una regla de asociación como que la compra de leche y pañales implica la compra de cerveza pero esta implicancia no es del todo correcta you que está asociada a valores de confianza y soporte empírico, es decir, previamente obtenidos desde los datos. Al lado izquierdo de la regla la llamaremos antecedente y al lado derecho la llamaremos consecuente. Supongamos que tenemos la siguiente tabla de datos con transacciones, cada fila corresponde a una compra con los productos listados hacia la derecha, en este caso podemos ver que hay cinco compras una que contiene dos productos y cuatro que contienen cuatro productos. Aquí podemos ver algunos ejemplos de reglas de asociación entre los ítems leche, pañales y cerveza. Vemos que a pesar de que todas combinen los mismos productos son distintas entre si you que no es lo mismo decir que la compra de pañales implica la compra de leche y cerveza que decir que la compra de cerveza implica la compra de leche y pañales, más adelante veremos como estas reglas serán encontradas automáticamente usando el algoritmo Apriori. Notar que a pesar de que existen muchas posibles reglas dada la combinación entre los posibles grupos de productos sólo serán seleccionadas las que superen ciertos umbrales de interés. En este video entonces aprendimos que las reglas de asociación nos pueden servir para analizar datos de compras de productos, de encuestas a personas o de cualquier otro contexto similar. Vimos algunas definiciones importantes como itemset, soporte y reglas de asociación. También vimos que las reglas de asociación son una especie de implicancia que está asociada a indicadores que obtenemos directamente desde los datos. En el próximo video veremos otros indicadores y cómo encontrar estás reglas.