En este video de "Fundamentos de EstadÃstica Aplicada", vamos a presentar una sÃntesis de las principales fórmulas y supuestos para la aplicación y el cálculo de intervalos de confianza. En videos anteriores de este curso nos ocupamos de la definición conceptual de un intervalo de confianza, asà como de la lógica para su construcción, aplicación e interpretación. En el video que vamos a desarrollar, presentaremos un resumen de los intervalos de confianza de uso más común, asà como de los supuestos necesarios para aplicar y calcular dichos intervalos en la estimación de parámetros poblacionales de interés. Este resumen está estructurado en forma de tabla, en la que para cada caso de intervalo de confianza se presentan las diferentes caracterÃsticas que debe tener la población, y los supuestos y el tamaño de la muestra aleatoria que se requieren para poder aplicar y calcular dicho intervalo. Como caracterÃsticas relevantes se consideran la distribución de la población, si se conoce o no la varianza poblacional y el tamaño requerido de la muestra aleatoria. En la última columna de la tabla aparece la expresión matemática del intervalo de confianza, con base en la cual se puede obtener el cálculo del intervalo a partir de los resultados de la muestra aleatoria especÃfica que se haya utilizado. La tabla que vamos a presentar contiene 12 casos de intervalos de confianza que se utilizan para estimar la media poblacional Mu, la diferencia de medias poblacionales Mu_1 menos Mu_2, la proporción poblacional p, la diferencia de proporciones poblacionales p_1 menos p_2, la varianza poblacional Sigma al cuadrado y, finalmente, el cociente Sigma_1 al cuadrado sobre Sigma_2 al cuadrado entre las varianzas de 2 poblaciones. Esta primera parte de la tabla contiene 4 casos de intervalos de confianza que se refieren a la estimación de la media poblacional Mu. En particular, en el caso número 1 tenemos una población con distribución normal, la varianza poblacional Sigma al cuadrado se supone conocida, el tamaño de la muestra no tiene ninguna limitación particular. En ese caso, entonces, el intervalo de confianza está dado por el lÃmite inferior: X barra menos el percentil de 1 menos Alfa medios por ciento de la distribución normal estándar, multiplicado por Sigma dividido por la raÃz de n. De la misma manera, el lÃmite superior está dado por la expresión: X barra más el percentil de 1 menos Alfa medios por ciento de la distribución normal estándar, multiplicado por Sigma dividido por la raÃz de n. Debe ser perfectamente claro que una vez se tiene una muestra aleatoria particular, entonces todos los términos del intervalo serÃan conocidos. En este caso que estoy describiendo, por ejemplo, además de las constantes Sigma y n, tendrÃamos el percentil, que está determinado por el nivel de confianza del intervalo, asà que también se conocerÃa, y, finalmente, por X barra, que se calcula con base en los valores que se tienen en la muestra. A continuación, vamos a presentar un ejemplo numérico del caso de intervalo de confianza número 2. Consideremos una variable aleatoria X con distribución normal, de la cual tenemos una muestra aleatoria de tamaño 7 cuyos datos se presentan en la pantalla. Nuestro interés es calcular el intervalo de confianza del 95 por ciento de confiabilidad para la media de esta variable. ¿Cuál de los casos vistos anteriormente podemos utilizar? Verifiquemos los supuestos. Empecemos por precisar cuál es la distribución de la población. En nuestro caso, normal. ¿Cómo es la varianza poblacional, conocida o desconocida? En nuestro caso, no nos dan información, asà que la supondremos desconocida. Luego, debemos precisar si el tamaño de la muestra es grande o es pequeño. En nuestro caso, es pequeño. Verificados los supuestos, vemos que el caso número 2 se ajusta y las condiciones perfectas para nuestro ejercicio, asà que tomémoslo para poder encontrar cuáles son los lÃmites de nuestro intervalo. Empecemos por determinar qué valor toma la t. Recuerden que este valor depende de cuál es el nivel de confianza del intervalo que estamos construyendo. En nuestro caso, 95 por ciento. Eso quiere decir que el percentil de la variable aleatoria t que debemos encontrar es el percentil del 97,5. Una vez lo hallamos, que corresponde a 2,447, podemos, entonces, continuar obteniendo la información que necesitamos para nuestro intervalo. Calculamos a partir de los datos el valor de X barra y el valor de S al cuadrado para encontrar asà la desviación muestral. Una vez tenemos la información, lo que debemos hacer es reemplazar. Tal como aparece en la pantalla, luego de realizar las operaciones, obtenemos nuestro intervalo calculado. ¿Cómo lo interpretamos? Con un nivel de confiabilidad del 95 por ciento, el intervalo de confianza para la media de la variable aleatoria X se encuentra entre 4,27 y 7,65 unidades. Esta segunda parte de la tabla contiene 4 casos que se refieren a la estimación de la diferencia de medias poblacionales Mu_1 menos Mu_2. Voy a describir, en particular, el caso de intervalo número 7, que se refiere a 2 poblaciones cuyas muestras aleatorias son independientes entre sÃ, no hay ninguna restricción sobre la distribución de dichas poblaciones, las varianzas poblacionales Sigma_1 al cuadrado y Sigma_2 al cuadrado son conocidas, se requiere que el tamaño de las muestras de cada una de las 2 poblaciones sea suficientemente grande, mayor o igual que 30. Con esos supuestos tendrÃamos que el intervalo está conformado de la siguiente forma : el lÃmite inferior estarÃa dado por X_1 barra menos X_2 barra, que no es otra cosa que un estimador centrado de Mu_1 menos Mu_2, menos el percentil de 1 menos Alfa medios por ciento de la distribución normal estándar, multiplicado por la raÃz cuadrada de Sigma_1 al cuadrado dividido por n_1 más Sigma_2 al cuadrado dividido por n_2. De manera similar, el lÃmite superior estarÃa dado por X_1 barra menos X_2 barra más el percentil de 1 menos Alfa medios por ciento de la distribución normal estándar, multiplicado por la raÃz cuadrada de Sigma_1 al cuadrado dividido por n_1, más Sigma_2 al cuadrado dividido por n_2. A continuación, vamos a presentar un ejemplo numérico del caso de intervalo de confianza que acabo de describir. Consideremos 2 variables aleatorias independientes con varianzas poblacionales conocidas dadas por: varianza de la población 1 igual a 2, varianza de la población 2 igual a 1,5. Cada una de estas 2 variables aleatorias tiene su respectiva muestra. En este caso, la muestra aleatoria de la población 1 tiene un tamaño de 58 y la muestra aleatoria de la población 2 tiene un tamaño de 36 elementos. Nuestro interés es calcular el intervalo de confianza del 95 por ciento de confiabilidad para la diferencia de las medias Mu_1 menos Mu_2. ¿Cuál de los casos podemos utilizar en esta oportunidad? Verifiquemos los supuestos. Empecemos por validar si las 2 poblaciones que estoy analizando se comportan de manera independiente. En este caso, tenemos ese supuesto verificado. Ahora bien, debemos identificar cuál es la distribución de la población. No nos dan información, asà que podrÃa ser cualquier tipo de distribución. Luego, debemos verificar si las varianzas de la población son conocidas o desconocidas. En este caso, las 2 son conocidas y tenemos los valores especÃficos. Nos preguntan si el tamaño de las muestras son grandes o son pequeños. En nuestro caso, las 2 son grandes, ya que las 2 muestras aleatorias en un tamaño muestral superior a 30. Verificados los supuestos, vemos que el caso que podemos utilizar en esta oportunidad corresponde al caso número 7. ¿Cómo calculamos? Encontremos los valores de cada uno de los Ãtems que hacen parte de este intervalo; cuánto vale X barra 1, X barra 2, Sigma 1 cuadrado, Sigma 2 cuadrado, los respectivos tamaños de muestra y el valor de la variable aleatoria z. Con base en los datos de las muestras aleatorias, podemos calcular la media muestral, la desviación muestral y tenemos, obviamente, el tamaño de la muestra. ¿Qué utilizamos? Varianza poblacional, desviaciones muestrales o varianzas muestrales y lo elevamos al cuadrado. En esta oportunidad, dijimos que uno de los supuestos eran que las varianzas eran conocidas, es decir, que no podemos utilizar los valores muestrales porque conocemos el valor poblacional. Encontremos el valor de z. Teniendo en cuenta que el intervalo de confianza que estamos construyendo es del 95 por ciento, el percentil que debemos hallar corresponde al percentil del 97,5 por ciento. En nuestro caso, tiene un valor de 1,96; lo podrÃan verificar si ustedes realizan el cálculo en Excel. Vamos entonces a reemplazar la información que ya tenemos en el intervalo del caso número 7. Luego de resolver las operaciones que están planteadas en este intervalo, obtenemos el intervalo calculado que nos indica que el intervalo de confianza del 95 por ciento para la diferencia de las medias de la población 1 menos la población 2 se encuentra entre 1,46 y 2,54 unidades. Esta parte de la tabla contiene 2 intervalos de confianza. El primero se refiere a la estimación de una proporción poblacional p y el segundo, a la estimación de una diferencia de proporciones poblacionales p_1 menos p_2. Me voy a referir, en particular, al caso número 9, que corresponde a una población con distribución de Bernoulli. La varianza poblacional es desconocida puesto que depende del parámetro p, el tamaño de la muestra debe ser grande, mayor o igual que 30, y, en ese caso, el intervalo de confianza tendrÃa los siguientes lÃmites: p sombrero, que se calcula como la sumatoria de los xi dividido por n, es decir, no es otra cosa que la media muestral menos el percentil de 1 menos Alfa medios por ciento de la distribución normal estándar, multiplicado por la raÃz de p sombrero por 1 menos p sombrero dividido por n. Y, de la misma manera, el lÃmite superior del intervalo estarÃa dado por p sombrero más el percentil de 1 menos Alfa medios por ciento de la distribución normal estándar, multiplicado por la raÃz de p sombrero por 1 menos p sombrero dividido por n. A continuación, vamos a presentar un caso numérico que se refiere exactamente a la situación que acabo de describir. Consideremos una variable aleatoria X con distribución de Bernoulli de parámetro p, de la cual contamos con una muestra aleatoria [inaudible] de 50, cuyos datos parciales se presentan en la pantalla. Nuestro interés es calcular un intervalo de confianza al 95 por ciento de confiabilidad para el parámetro p de esta distribución. ¿Cuál de los intervalos vistos podemos utilizar? Verifiquemos los supuestos. La distribución de la población conocida, Bernoulli, tal como nos lo dan en el enunciado; varianza poblacional desconocida, no nos dan información al respecto; tamaño de la muestra grande, ya que nos dicen que el tamaño de la muestra tiene 50 elementos. Verificados los supuestos para utilizar el caso número 9, de los casos vistos, podemos entonces tomar este intervalo para desarrollar. Calculemos para empezar, el valor del p gorrito, que corresponde a la sumatoria de los Xi sobre n, donde esta sumatoria corresponde al total de éxitos dentro de una muestra; vamos a asumir un total de dÃas para nuestro ejercicio. Necesitamos encontrar el valor de z para este intervalo. Recuerden que depende del nivel de confiabilidad del intervalo que estamos construyendo, en este caso 95 por ciento, lo cual implica que debemos encontrar el percentil del 97,5 por ciento para la distribución normal estándar, la cual corresponde a 1,96. Pueden verificar este resultado en Excel. Una vez tenemos la información disponible, procedemos a reemplazar en el intervalo que tenemos. Una vez desarrollamos los procedimientos allà planteados, encontramos que el intervalo calculado corresponde a : con un 95 por ciento de confiabilidad, el parámetro p se puede encontrar entre 0,09 y 0,31. Para finalizar, tenemos 2 casos de intervalos de confianza que se refieren a la estimación de la varianza poblacional Sigma cuadrado y a la estimación de un cociente de varianzas poblacionales Sigma 1 al cuadrado sobre Sigma_2 al cuadrado. Me voy a referir, en particular, al caso número 11, que corresponde a una población con distribución normal; no hay ninguna restricción sobre el tamaño de la muestra. En ese caso, el intervalo de confianza para la varianza poblacional está dado por los siguientes lÃmites. El lÃmite inferior, n menos 1 por S cuadrado, donde S cuadrado, por supuesto, es la varianza muestral dividido por el percentil de 1 menos Alfa medios por ciento de una distribución ji cuadrado de n menos 1 grados de libertad. De manera similar, en el lÃmite superior del intervalo tendrÃamos n menos 1 por S cuadrado dividido por el percentil de Alfa medios por ciento de la distribución ji cuadrado de n menos 1 grados de libertad. Como en otros casos que ya hemos descrito en este video, a continuación, vamos a presentar un caso numérico que corresponde al intervalo que acabo de describir. Consideremos ahora una variable aleatoria X con distribución normal de la cual contamos con una muestra aleatoria de tamaño 9, cuyos datos se presentan en la pantalla. Nuestro interés es calcular un intervalo de confianza del 95 por ciento de confiabilidad para el parámetro Sigma cuadrado. ¿Cuál de los intervalos vistos podemos utilizar? Para eso debemos, primero, identificar cuál es el parámetro para el cual queremos realizar la estimación; en este caso, Sigma cuadrado. Verificar los supuestos: distribución de la población normal, tamaño de la muestra; pequeño o grande, en este caso no hay ningún inconveniente, en nuestro caso es pequeño, y verificados estos supuestos, podemos entonces hacer uso del intervalo que se plantea en el caso 11. Para empezar, debemos calcular el valor de la varianza muestral, tal como aparece en la pantalla. Pueden verificar este resultado. Luego, debemos encontrar cuáles son los valores de chi cuadrado que se necesita para construir el intervalo. En nuestro caso, debemos recordar que el intervalo que estamos construyendo es del 95 por ciento. Eso implica que debemos calcular no solamente el percentil de 97,5, que corresponde a 17,535, sino también el percentil de 2,5 por ciento, que corresponde a 2,180. Una vez hemos encontrado esta información, podemos simplemente reemplazar en el intervalo que hemos identificado y encontrar nuestro intervalo calculado. En este caso, el intervalo de confianza del 95 por ciento de confiabilidad para el parámetro Sigma cuadrado se encuentra entre 565,13 como el lÃmite inferior y 4.545,67 como lÃmite superior. Recuerden que las unidades de este parámetro son unidades al cuadrado. Esperamos que les haya sido útil la aplicación de estos intervalos de confianza.