[MUSIC] Como vimos en el módulo de estadística descriptiva, you no podemos limitar solamente a fijarnos en las medidas de tendencia central como es la media, o sería la esperanza o valor esperado. you que no vamos a tener una idea acabada de cómo se distribuyen los datos. Entonces, también conviene calcular la varianza (o el desvío) asociado a esta variable aleatoria como medida de dispersión. Si X es una variable aleatoria que es discreta, la varianza va a ser la esperanza del desvío al cuadrado respecto de la media. Es decir, tengo que aplicarle la esperanza a todo éste término de acá. Es decir a cada valor que toma X le voy a restar su media, y a esa diferencia respecto de la media la elevo al cuadrado. Y tomo la esperanza de esa expresión. Eso lo vamos a denotar como V(X) o varianza de X. O sigma cuadrado de X, otra letra griega. Hay una fórmula alternativa que pueden encontrar en algunos libros de textos. Y es que la varianza de X también se puede expresar como la esperanza de X al cuadrado, menos la media al cuadrado. Entonces, una intuición de qué es lo que estamos haciendo cuando calculamos de esta manera la varianza. La varianza no es más que un promedio ponderado por su probabilidad de la distancia cuadrática entre la media y cada valor que toma X. Es decir, lo que haremos es agarrar cada uno de los valores que toma X, restarle la media, elevarlo al cuadrado. Y a esa expresión la vamos a multiplicar por la probabilidad que tiene X, y luego sumaremos todo eso. Obviamente, la varianza es mayor cuanto más lejos estén los valores que toma X respecto de la media. Y cuanto mayor sea el peso o la probabilidad de ocurrencia de esos valores. Usualmente, la varianza la vamos a asociar con el concepto de variabilidad o de riesgo. Entonces, en el ejemplo de la cantidad de autos que compra una familia en un lapso de cinco años. Si queremos calcular la varianza lo que tenemos que hacer es lo siguiente. Teníamos los distintos valores que puede tomar X y la probabilidad asociada a cada uno de ellos, y you habíamos calculado su media. La media era de 1,51. Es decir, para calcular la varianza lo que tengo que hacer es centrar cada uno de los valores que toma X respecto de la media. Es decir, lo que haremos es 0 menos la media de 1,51, 1-1,51, 2-1,51, así con todos los valores. Es decir, algunas de estas diferencias serán negativas y otras serán positivas. Porque algunos valores están por debajo de la media, y otros están por arriba de la media. Pero si yo sumara todas esas diferencias, me va a dar 0. No nos interesa tanto el signo de la diferencia, sino la magnitud. Entonces, lo que haremos es elevar al cuadrado esas diferencias. Todo se va a volver positivo, y voy a estar potenciando aquellas observaciones que se alejan mucho de la media. Y luego, lo que haremos es a esas diferencias respecto de la media al cuadrado, multiplicarlos por su probabilidad. Entonces, 2,28 por la probabilidad de que X=0,3, eso me da 0,68. Eso lo haremos para todos los valores que pueda tomar esta variable. Y si sumamos esas diferencias respecto de la media al cuadrado, ponderado por su probabilidad, eso es la varianza. Quiere decir que la varianza es de 2,03, que si le aplicamos la raíz cuadrada positiva, nos da 1,42 y esa es la dispersión de esta variable. Es decir, en promedio, la dispersión es de 1,42 autos en el lapso de 5 años. La varianza también tiene algunas propiedades que son deseables conocer. Si a y b son dos números, dos constantes, no son variables. Y X es una variable aleatoria. Entonces la varianza de un número es igual a 0 porque no hay variabilidad en una constante, en un número. La varianza de a por X es a al cuadrado por la varianza de X. Es decir la varianza lo que hace es elevar al cuadrado todas las unidades de medida. Y por lo tanto la varianza de a + bX, será tan solo b cuadrado por la varianza de X. Ahora, si tenemos dos variables aleatorias X e Y. Y queremos por ejemplo sumar estas variables aleatorias y calcular su varianza. La varianza de X + Y será la varianza de X más la varianza de Y, y aparece un nuevo término que es la suma de dos veces la covarianza entre X e Y. En cambio, si queremos restarlas, la varianza de X- Y será la varianza de X más la varianza de Y, menos dos veces la covarianza entre X e Y. La covarianza es una medida que veremos más adelante, pero se refiere a la asociación que hay entre dos variables. En la medida en que estas variables estén asociadas entre sí, eso va a afectar a la varianza de la suma o de la diferencia de estas dos variables. En cambio, si X e Y son dos variables aleatorias que son independientes, no van a tener ningún tipo de asociación. Ni lineal, ni de ningún tipo, es decir, la covarianza va a a ser nula. En esos casos, es cierto que la varianza de las sumas es la suma de las varianzas. O que la varianza X menos Y es la varianza de X más la varianza de Y. you que recuerden la varianza eleva todo al cuadrado, y lo negativo se vuelve positivo.