[MUSIC] Bien, ésta es una de las múltiples aplicaciones que tiene lo que se llama el modelo lineal de regresión. Es decir, estamos planteando una relación lineal entre dos variables donde la variable y, la variable que vamos a llamar dependiente o variable explicada, es nuestra variable de interés. Y vamos a denotar con la letra X la variable explicativa o regresor, es decir, aquel factor que condiciona a la variable dependiente. Entonces, estamos interesados en estimar los parámetros poblacionales beta 0 y beta 1, y la pendiente de esta recta. Acá aparece, adicionalmente, un término de error que llamaremos el error aleatorio. Es decir, nuestra variable y, en este caso las ventas, puede estar explicada por la inversión en publicidad y por un montón de otros factores que, en este caso, no estoy midiendo. Aquellos factores que yo estoy omitiendo iban a parar al término de error. Bien, entonces el problema se reduce en estimar estos parámetros poblacionales beta 0 y beta 1, a partir de datos de la muestra. Entonces, el método de estimación más usual que vamos a ver en este curso es el método de estimación de mínimos cuadrados ordinarios. El método de estimación de mínimos cuadrados ordinarios busca aproximar esta relación con nuestras observaciones, o sea, con datos de la muestra, de la siguiente forma. Minimizando la suma de los residuos al cuadrado. O lo que equivale a decir, tratando de que la nube de puntos esté lo más cercana posible a la recta estimada. ¿Qué quiere decir esto de minimizar la suma de los residuos al cuadrado? ¿Qué son los residuos? Los residuos son los errores estimados, esto que estamos llamando acá con la letra e. Es decir, la diferencia entre lo observado, lo que realmente sucede con las ventas y lo estimado por la recta de regresión. Es decir, las predicciones que yo tengo o estimaciones puntuales. Es decir, la distancia vertical entre cada punto y la recta. Algunos de esos residuos serán positivos, otros serán negativos. No nos interesa tanto el signo, sino la varianza que hay asociada a esos residuos. Es decir, lo que haremos es elevar al cuadrado esos residuos y aplicarles sumatoria, como una medida de la varianza o varialibilidad que hay en estos residuos. Es decir, nos interesa minimizar esa suma de los residuos al cuadrado como forma de obtener esta recta de mejor ajuste. Entonces, me interesa estimar y en función de X y poder obtener estos parámetros estimados beta 0 sombrero, y beta 1 sombrero. Donde beta 0 sombrero será la constante estimada, y beta 1 sombrero la pendiente estimada. Bien, si uno realiza ese ejercicio de minimización de esa función, va a llegar a la fórmula del estimador de la constante y de la pendiente. Empecemos por la fórmula del estimador de la pendiente, de beta 1 sombrero. Fíjense, en definitiva, es la covarianza entre X e y sobre la varianza de X. Entonces, el signo de la pendiente, que sea negativo o positivo, va a depender de la covarianza, you que la varianza de X va a ser siempre positiva. Entonces, si yo veo que la covarianza entre X e y es positiva, la pendiente será positiva. Y si la covarianza entre X e y es negativa, la pendiente será negativa. Pero, a diferencia del coeficiente de correlación, en este caso estamos dividiendo por la varianza de X, y no por el desvío de X por el desvío de y. Entonces, al obtener la pendiente, podemos medir el impacto que tiene una unidad adicional en X, en y. La fórmula de la constante beta 0 sombrero va a ser, el promedio de Y, o sea, el promedio de las ventas de mi variable dependiente. Menos beta 1 sombrero por el promedio de X, mi regresor o variable explicativa en el ejemplo anterior, era la inversión en publicidad. Entonces, una vez que estimamos. Entonces, una vez que estimamos dicho modelo de regresión, como lo hicimos en el ejemplo en el Excel, nos interesa interpretar estas estimaciones. ¿Qué nos dicen los valores de los coeficientes que obtuvimos antes? La constante estimada se va a interpretar como un efecto autónomo, es decir, cuando la variable explicativa es cero. ¿Cuál va a ser el valor de la variable dependiente, el valor esperado o valor medio de la variable dependiente, cuando X es igual a 0? La pendiente, por su parte, se interpreta como un efecto parcial. Es decir, nos va a indicar cómo cambia la variable explicada, la variable y, cuando la variable explicativa cambia en una unidad. Nos va a interesar, entonces, tanto el signo como la magnitud de ese coeficiente. Si volvemos a nuestro ejemplo, habíamos estimado que las ventas de esta compañía dependen de esta manera de la inversión en publicidad. ¿Cómo interpretamos este 79,324? Que cuando la inversión en publicidad es 0, X = 0, el valor esperado de las ventas es de 79,324 miles de dólares. ¿Cómo interpretamos entonces la pendiente de 102.59? Que por cada $1,000 que incrementamos la inversión en publicidad, las ventas se van a incrementar, porque el signo es positivo, en $102,590. Noten, entonces, que la interpretación de estos coeficientes dependen de las unidades en que están medidas X e y.