[MUSIC] En esta segunda sesión del segundo módulo trabajaremos básicamente con dos conceptos. Uno es el de la probabilidad condicional, y el otro es el de independencia. Imaginemos lo siguiente. Vamos a lanzar dos dados, y vamos a observar el resultado obtenido. Hay 36 resultados que son igualmente probables, es decir, X probables. Entonces, acá tenemos representado el conjunto total de resultados posibles. ¿Cómo se lee esto? Podemos obtener un uno con el primer dado, un uno con el segundo dado, o un dos con el primer dado o un uno con el segundo dado. Y así, hay 36 resultados posibles, todos con igual probabilidad. ¿Qué es lo que haremos? Vamos a definir dos variables aleatorias. Una variable X que es la puntuación obtenida con el primer dato, es decir, oscila de 1 a 6, y otra variable Y que es la puntuación obtenida con el con el segundo dado, es decir, que oscila también de 1 a 6. Entonces, llamaremos distribución conjunta de probabilidad aquella que permite obtener las probabilidades de que X tome cierto valor x chiquita, y de que Y tome cierto valor y. Es decir, la probabilidad de X = x, e Y = y. Esta expresión, por le general, se le abrevia de la siguiente manera. La probabilidad de X, Y. Es decir, me interesa la probabilidad de que se vean en forma simultánea estos dos eventos. Entonces, lo podemos representar en la siguiente tabla. En la primer fila está representado los resultados posibles del lanzamiento del segundo dado. O sea, de la variable Y. En la primera columna están representados los resultados de el lanzamiento del primer dado, o sea de la variable X. Como los 36 resultados del lanzamiento de estos dos dados son igualmente probables, la probabilidad de cada uno es 1 en 36. Bien, todas las probabilidades que están dentro de esta tabla, se conocen como la probabilidad conjunta, es decir, 1,36 es por ejemplo la probabilidad conjunta de obtener un 3 con el primer dado, y un 2 con el segundo dado. Entonces, si estamos pensando en la intersección de que X = 3, e Y = 2. Bien, si sumamos cada una de las filas, cada una de las probabilidades, estaremos obteniendo lo que se llama la probabilidad marginal de X. Es decir, es ¿Cuál es la probabilidad de que X sea igual a uno más allá del número que obtuve con el lanzamiento del segundo dado? Eso es un sexto. La probabilidad marginal de Y surge de sumar las columnas, si digo las probabilidades que están en las columnas y también son de un sexto. Es decir, es la probabilidad de los resultados que puedo obtener del lanzamiento del segundo dado, más allá del resultado que yo obtuve con el lanzamiento del primer dado. Entonces, en el ejemplo de los dados, estas variables X e Y son independientes, you que se verifica que la probabilidad conjunta es igual al producto de las probabilidades. Okey, en cambio, en la mayoría de los casos, nos vamos a encontrar con variables que son dependientes. Pensemos en el siguiente ejemplo. Llamemos X a la cantidad de viviendas que vende una inmobiliaria A por mes. Y llamemos Y a la cantidad de viviendas que vende la inmobiliaria B por mes. Su distribución conjunta puede estar dada por la siguiente tabla. Imaginemos que la inmobiliaria A solo puede vender en el mes entre 1 y 3 viviendas, y la inmobiliaria B también, para simplificar el problema. Entonces, todas esas probabilidades que están dentro de la tabla son probabilidades conjuntas. Es decir, ese 0,12 es la probabilidad de que la inmobiliaria A venda solo una vivienda al mes, y que la inmobiliaria B también venda sólo una inmobiliaria al mes. Una vivienda al mes. Entonces si queremos calcular las probabilidades marginales, lo que tenemos que hacer es sumar filas y sumar columnas. Entonces, este 0,38 está indicando la probabilidad de que la inmobiliaria A venda solo una vivienda al mes. Más allá de la cantidad de viviendas que vendió la inmobiliaria B. Si queremos demostrar que estas dos variables X e Y no son independientes, lo que deberíamos probar es que, si multiplicamos las probabilidades marginales no va a coincidir con la probabilidad conjunta. Es decir, si multiplicamos 0,21 con 0,38, o sea la probabilidad de que Y sea igual a 1, y la probabilidad de que X sea igual a 1, verán que no nos va a dar 0,12, o sea la probabilidad de que X sea igual a 1, y que Y sea igual a 1. Entonces, para introducir el concepto de la probabilidad condicional, utilizaremos este ejemplo. Se lleva a cabo una investigación de mercado sobre la calidad de servicio gastronómico que ofrecen 50 restaurantes en esta ciudad. Para cada restaurante se registra si tiene más de 10 años de experiencia en el mercado o no los tiene. Y si su servicio gastronómico es de buena o mala calidad. Entonces, podemos representarlo en un cuadro de doble entrada. Entonces, aquí tenemos representada la experiencia de estos restaurantes, aquellos que tienen más de 10 años de experiencia en el mercado, y aquellos que tienen hasta 10 años. Y por acá tenemos representado la calidad de servicio, si es buena o si es mala. Entonces, tenemos 50 restaurantes, Y la pregunta es la siguiente, si elijo un restaurante al azar, ¿cuál es la probabilidad de que ofrezca un buen servicio gastronómico? Entonces, quiere decir que no nos vamos a centrar en el nivel de experiencia que tengan, o los años de experiencia que tengan estos restaurantes de esta ciudad, sino tan solo en la buena calidad del servicio. Hay 26 restaurantes sobre 50 que ofrecen un buen servicio gastronómico, entonces esa será la probabilidad, 26 sobre 50. En cambio y si nos preguntan lo siguiente, y si entro a un restaurante que tiene más de diez años en el mercado, ¿cuál es la probabilidad de que ofrezca un buen servicio gastronómico? Es decir, ahora lo que voy a hacer es centrarme solo en aquellos restaurantes que tienen más de 10 años en el mercado, es decir, vamos a desechar esta fila que considera los restaurantes que tienen hasta 10 años. Es decir, you no estaremos trabajando con 50 restaurantes. Estamos achicando el espacio muestral, you no son 50 restaurantes sino tan solo 25 aquellos que tienen más de 10 años de experiencia en el mercado. Y dentro de estos 25, me interesan aquellos que ofrecen un buen servicio gastronómico, es decir, 16 sobre 25 es la probabilidad. Esto es lo que se llama una probabilidad condicional. Hay información que me es dada ¿sí?, en este caso es, me quiero centrar solo en los restaurantes que tienen más de 10 años en el mercado, y esta información permite reducir el tamaño del espacio muestral. En vez de trabajar con 50 restaurantes estaremos trabajando con 25 y calculando la probabilidad de que sea un buen servicio gastronómico. O sea que en el segundo caso, la probabilidad es mucho más alta que en el primer caso.