[MUSIC] Pero, conocer la varianza poblacional puede ser un supuesto muy fuerte. Un caso más realista es asumir que no la conocemos. Entonces, cuando no conocemos sigma cuadrado lo que haremos es estimarla usando la varianza muestral S cuadrado. Entonces en esos casos, you no trabajaremos más con la distribución normal estándar. Sino con una versión del estadístico que se parece mucho al caso de la normal estándar, you que al promedio le resto la media y la divido, en este caso, en vez de por sigma por S sobre la raíz de n, y dicho estadístico tendrá otra distribución. Y es la distribución que se conoce como la t de Student, que depende de los grados de libertad, que en este caso serán n menos uno, es decir, el tamaño de la muestra menos uno. O sea, que la estructura de este intervalo de confianza será el estimador puntual, X raya, más menos su margen de error. El margen de error tiene, nuevamente, tres componentes, un valor. T que depende de los grados de libertad y de alfa sobre dos, que será un valor de la tabla, pero en este caso de la distribución t de Student, por S, es decir, el desvío estándar muestral dividido a la raiz de n, es decir, la raiz del tamaño de la muestra. Veamos cómo es la distribución t de Student. La distribución t de Student se parece mucho a la normal, en el sentido de que va a estar centrada en la media y va a ser simétrica como la normal. Pero, por lo general tiene colas más anchas. Comparemos. La curva gris es el caso de la normal estándar, es decir, la normal que está centrada en el cero y tiene una varianza de uno. La curva azul es el caso de la t de Student con dos grados de libertad, es decir, este sería el caso en el que el tamaño de la muestra es de tres. Fíjense que las colas son más anchas que en el caso normal estándar. La naranja sería la t de Student con cinco grados de libertad. Entonces, en la medida en que se incrementen los grados de libertad, esto es que se incremente el tamaño de la muestra, una t de Student va a converger o va a tender a la normal estándar. Vayamos entonces a un ejemplo. Vayamos al caso uno, en el cual queríamos construir un intervalo de confianza para la media conociendo la varianza poblacional. El ejemplo dice lo siguiente. Se conoce, de estudios anteriores que el costo variable de construcción de determinado tipo de vivienda prefabricada, por metro cuadrado, se distribuye normalmente con un desvío estándar de 135. Es decir, ese 135 es sigma, es el desvío estándar poblacional. Se tomó una muestra aleatoria de 12 viviendas, ese sería n, con los cuales se calculó un costo variable promedio de 1440 pesos por metro cuadrado, es decir, ese sería X raya, el promedio. La pregunta es, ¿Entre qué valores estará el costo variable medio de la construción de dicho tipo de vivienda si se lo estima con una confianza del 95%? La solución es la siguiente, tenemos los datos del ejercicio. Conocemos sigma, que es de 135. La cantidad de observaciones, n, es 12. El promedio es de 1440 y nos piden trabajar con una confianza, es decir, una menos alfa del 95%. Si reemplazamos en la fórmula del estimador. Del intervalo de confianza de la media, tenemos que, el promedio es de 1440 más menos el margen de error, que está compuesto por el valor de la tabla de la normal estándar. Que acumula una probabilidad del 2,5%, alfa sobre dos, por el desvío estándar poblacional dividido a la raiz de n, dividido a la raiz de 12. Si hacen las cuentas, el intervalo de confianza al 95% resulta estar comprendido entre 1363,6 pesos por metro cuadrado y 1516,4 pesos por metro cuadrado. Ahora vayamos al segundo caso, que es un caso más realista en el cual la varianza poblacional es desconocida. No conozco sigma, no conozco sigma cuadrado. Vamos a hacer una aplicación en el Excel. Lo que vamos a hacer es volver a trabajar con la base de datos que usamos en el módulo uno en la cual calculamos el retorno diario del precio del cierre ajustado de IBM entre el 4 de enero de 2016 y el 22 de julio de 2016. Vamos a usar nuevamente el complemento o add-in de Excel, Herramientas para análisis, pero esta vez vamos a calcular un intervalo de confianza al 95% del retorno medio diario de IBM. Y luego ustedes podrán hacer un análisis similar, tratando de estimar un intervalo de confianza al 99%.