[MUSIC] Vamos a poner a prueba el teorema central del límite. Y ésto lo vamos a hacer en el Excel para que no sea una cuestión de fe, y que puedan probar empíricamente que se verifica el teorema central del límite. Entonces en el Excel vamos a generar cinco variables aleatorias con una distribución uniforme 01, con mil datos cada una. Es decir, n es mil, es el tamaño de la muestra, tenemos cinco variables aleatorias con una distribución uniforme, en cualquier caso una distribución que no es normal. Y esta simulación la haremos usando la herramienta de análisis de datos. Análisis ToolPak. Luego lo que haremos es graficar el histograma de una de estas cinco variables para observar que efectivamente sigue una distribución uniforme con cualquier caso que no es una distribución normal. Y luego generaremos una nueva variable aleatoria que será el promedio de estas cinco variables. Graficaremos el histograma y deberíamos observar que se parece a una distribución normal, si es que vale el teorema central del límite. Luego ustedes podrán repetir el experimento, generando 10.000 variables y 100.000 datos y observar el histograma. Entonces, una vez estando en el Excel lo que haremos es esta simulación. Para ello, vamos a ir a Datos > Análisis de datos, que you tenemos activado, y en este caso iremos a Generación de números aleatorios > Aceptar. Tenemos que indicar el número de variables que queremos generar. En este caso son cinco variables. Y la cantidad de número aleatorios que queremos generar para cada una de estas cinco variables, es decir, el tamaño de la muestra en este caso es 1000. ¿Que distribución queremos asignarle a estas cinco variables? Acá seleccionaremos la opción Uniforme. Por default indica los valores comprendidos entre cero y uno, pero si uno quisiera lo podría alterar. Vamos a dejar entre cero y uno. Aceptar. El Excel acaba de generar cinco columnas, cada una de ellas es una variable aleatoria que tiene 1000 observaciones. Que provienen de una distribución normal que está acotada entre cero y uno. Lo que haré primero es ponerle un nombre, una etiqueta a cada uno de estas cinco variables. Las voy a llamar X uno, X dos, X tres, X cuatro, X cinco. Lo que haré primero es graficar el histograma de una de estas cinco variables para verificar que tiene una distribución que se parece a una distribución uniforme, en cualquier caso que no es una distribución normal. Entonces iremos a Datos > Análisis de datos. Y, en este caso, iremos a Histograma > Aceptar. Seleccionemos una de estas cinco variables. Voy a seleccionar la variable X uno, pero podría ser cualquiera de las cinco. Voy a indicar Rótulos you que seleccioné el nombre de la variable, y luego Aceptar. Acaba de armar la tabla de frecuencias asociada a esa variable. Entonces, para graficar el histograma tenemos que hacer un gráfico de columnas. Iremos a Insertar > Gráficos de columnas. Y ahí podemos observar que en el histograma la distribución claramente no es normal. Se asemeja a una distribución uniforme. Obviamente que cuanto mayor sea la cantidad de datos, el n, más parecida a una distribución uniforme será. Pero, en cualquier caso quiero que observen que esta variable aleatoria claramente no tiene una distribución normal, una distribución acampanada. Volvemos a la hoja de los datos. Y ahora, lo que voy a hacer es calcular X raya, es decir, el promedio de estas cinco variables. Y eso lo voy a hacer para los 1000 datos. Y ahora lo que voy a hacer es graficar el histograma de esta nueva variable, que es X raya, que es el promedio de estas cinco variables uniformes. Si vale el teorema central del límite, yo debería observar que X raya sigue una distribución normal. Aunque las X que lo componen, a partir de la cual se calculó el promedio, no son normales. Entonces, iremos a Datos > Análisis de datos > Histograma > Aceptar. En este caso, voy a seleccionar la variable X raya. Aceptar. Tenemos la tabla de frecuencias, y ahora lo que haremos es el gráfico de columnas. Insertar > Gráfico de columnas. Y voilà, ahí apareció una distribución que se aproxima mucho a la distribución normal. Fíjense, necesitamos un tamaño de muestra bien, bien grande. Cuanto mayor sea el tamaño de la muestra, más se va a aproximar a la distribución normal.