[MUSIC] En esta sesión hablaremos de estimaciones a través de intervalos de confianza. Estuvimos viendo que la media muestral, esto es X raya, se usa para estimar a la media poblacional, mu, que no conocemos. Pero, ¿cuál es la probabilidad de acertarle en esta estimación? Es decir, por ejemplo, si quiero conocer cuál es el nivel medio de consumo de cerveza anual per cápita en cierto país, y tomo una muestra aleatoria de 100 individuos, que me arroja un promedio medio de 80,2 litros per cápita. ¿Cuál es la probabilidad de que la verdadera media, el verdadero nivel de consumo medio de cerveza, sea efectivamente 80,2? Prácticamente es 0. Okey, pero ¿puedo saber más o menos en qué rangos se encontraría el verdadero valor de la media? Sí, a través de la construcción de intervalos de confianza. Entonces, la estimación por intervalos es generalmente preferida a los estimadores puntuales, you que esta última estimación no provee información respecto al error que podemos cometer. Veremos cómo construir intervalos de confianza para la media poblacional y para la proporción poblacional. Entonces, un intervalo de confianza va a ser un rango de valores que se va a determinar en base a información muestral, con el cual es probable que el parámetro poblacional esté contenido. Entonces, los intervalos de confianza van a tener la siguiente estructura. Al estimador puntual, le vamos a sumar y restar lo que se conoce como el margen de error. Los niveles de confianza más usados en la estimación de estos intervalos son del 90%, 95% o 99%. Bien, entonces comentamos que íbamos a ver intervalos de confianza para la media poblacional mu, para la proporción poblacional p. Bien, vimos que el estimador puntual de la media poblacional es el promedio o media muestral X raya, al cual tendremos que sumarle y restarle el margen de error. Y para el caso de la proporción poblacional, vimos que el estimador puntual es p sombrero, es decir, la cantidad de casos exitosos sobre el total de casos, al cual tendremos que sumarle o restarle el margen de error. Entonces, queremos hallar un intervalo de confianza primero para la media poblacional, para mu, es decir, quiero construir un intervalo con la siguiente estructura. Yo quiero conocer cuál es el límite inferior y superior de ese intervalo, para poder decir que la verdadera media, mu, se encontrará entre ese valor inferior, I1, y ese valor superior, I2, con una probabilidad asociada. Donde la probabilidad será 1 menos alfa, que se conoce como el nivel de confianza. Como les comentaba, usualmente los valores son del 90, 95, ó 99%. Si 1 menos alfa es el nivel de confianza, entonces alfa es lo que se llama el nivel de significación. Piénsenlo como el riesgo que están asumiendo en esa estimación. Que si trabajo con una confianza del 90%, el nivel de significación será del 10%. Si trabajo con un nivel de confianza entonces del 99%, el nivel de significación será del 1%. Éste es un chiste, una broma que les pongo, a raíz de un comentario que una vez me hizo un alumno, y fue el siguiente. Si uno puede definir, o tiene que definir a priori cuál es el nivel de confianza con el que va a trabajar, el alumno me preguntó, ¿por qué no podemos trabajar con un nivel de confianza 100%? Mi respuesta fue que eso en realidad no tiene ningún sentido, piénsenlo. Ni siquiera hay que estimar un intervalo de confianza al 100%. Volvamos al ejemplo en el cual nos interesaba estimar si hubo un intervalo de confianza para el consumo medio de cerveza en cierto país. ¿Cuál sería el intervalo de confianza al 100%? Bueno, decir que la media va a estar ubicada entre 0 litros y más infinito, eso sería un intervalo de confianza al 100%. Claramente eso no es útil, yo quisiera tener un rango de oscilación que esté acotado. Por eso tenemos que trabajar con un nivel de confianza inferior al 100%, o lo que es lo mismo, asumir algo de riesgo en la estimación. Entonces, cuando queremos construir intervalos de confianza para la media, hay dos casos posibles. Vamos a llamar caso 1 al caso en el cual asumimos que la varianza poblacional es conocida. Es decir, quiero estimar un intervalo de confianza para la media, pero conozco por datos anteriores o datos históricos, la varianza poblacional de dicha variable. El caso 2 es el caso más realista, you que asume que la varianza poblacional, sigma cuadrado, es desconocida. Bien, vayamos al caso 1. Habíamos dicho que el intervalo de confianza para la media va a ser su estimador puntual, X raya, más menos, el margen de error. El margen de error en el caso 1 va a estar compuesto por los siguientes tres componentes. Por un lado, tenemos este valor que dice z alfa sobre 2, ese va a ser un valor de la tabla de la normal estándar. ¿Cuál valor? Aquel valor que acumule una probabilidad de alfa sobre 2, es decir, si trabajamos con un nivel de confianza del 95%, quiere decir que el nivel de significación alfa es del 5%, y que por lo tanto alfa sobre 2, es del 2,5%. Bien, si vamos a la tabla de la normal estándar y nos fijamos cuál es el valor z que acumuló un 2,5% de probabilidad, verán que ese valor es -1,96. Bien, entonces acá pondremos, sumaremos y restaremos 1,96. 1,96 veces el error estándar de la media muestral, es decir 1,96 por sigma, you que estamos en el caso 1 y es conocido, dividido en la raíz de n, es decir, la raíz del tamaño de la muestra, o cantidad de observaciones con las que estamos trabajando.