Clase 15: Método de Mínimos Cuadrados
Universidad Central de Venezuela- Escuela de Economía. 2025-1
2025-06-05
Predicción vs. Realidad: Para cada punto de dato \((X_i, Y_i)\), nuestra línea de regresión nos dará un valor predicho \(\hat{Y}_i\).
El Error (\(e_i\)): La diferencia entre el valor real observado (\(Y_i\)) y el valor predicho (\(\hat{Y}_i\)) se llama error o residual.
\[e_i = Y_i - \hat{Y}_i\]
Visualización: ver aplicación pestaña residuos
Problema de la Suma Simple: Si se sumam los errores (\(e_i\)), los errores positivos y negativos se cancelarían, dando una suma cercana a cero incluso si la línea no ajusta bien los datos y no sirve para encontrar la “mejor” línea.
La Solución del Cuadrado: Para evitar la cancelación y darle el mismo peso a los errores positivos y negativos, y además penalizar más los errores grandes, se eleva cada error al cuadrado antes de sumarlos.
Función Objetivo: El objetivo del MCO es encontrar la línea (es decir, los coeficientes \(\hat{\beta}_0\) y \(\hat{\beta}_1\)) que haga mínima la Suma de Cuadrados de los Errores (SCE) o Suma de Cuadrados Residuales (SCR):
\[\text{Minimizar } \sum_{i=1}^{n} e_i^2 = \text{Minimizar } \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2\]
Sustituyendo \(\hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i\):
\[\text{Minimizar } \sum_{i=1}^{n} (Y_i - (\hat{\beta}_0 + \hat{\beta}_1 X_i))^2\]
Cálculo Diferencial: Para encontrar los valores de \(\hat{\beta}_0\) y \(\hat{\beta}_1\) que minimizan la SCE, se utiliza cálculo diferencial.
Derivadas Parciales: Se toman las derivadas parciales de la función SCE con respecto a \(\hat{\beta}_0\) y \(\hat{\beta}_1\), y se igualan a cero. Esto nos da un sistema de dos ecuaciones con dos incógnitas, conocidas como las Ecuaciones Normales.
Sistema de Ecuaciones Normales:
\[\sum Y_i = n \hat{\beta}_0 + \hat{\beta}_1 \sum X_i\] \[\sum X_i Y_i = \hat{\beta}_0 \sum X_i + \hat{\beta}_1 \sum X_i^2\]
Resolución: Al resolver este sistema de ecuaciones, obtenemos las fórmulas para \(\hat{\beta}_0\) y \(\hat{\beta}_1\) que vimos anteriormente en la lámina de “Fórmulas para el Cálculo de los Coeficientes”.