Clase 15: \(R^2\) (Coeficiente de Determinación)
Universidad Central de Venezuela- Escuela de Economía. 2025-1
2025-06-05
Medida estadística que representa la proporción de la varianza de la variable dependiente (\(Y\)) que es predecible a partir de la variable independiente (\(X\)) en un modelo de regresión lineal.
Forma rápida de indicar lo bien que el modelo de regresión se ajusta a los datos observados.
Su valor siempre se encuentra entre 0 y 1 (o 0% y 100%).
\(R^2 = 0\): El modelo de regresión no explica absolutamente nada de la variabilidad de la variable dependiente. Las variables independientes no tienen ningún poder predictivo.
\(R^2 = 1\): El modelo de regresión explica el 100% de la variabilidad de la variable dependiente. Todas las observaciones se encuentran exactamente sobre la línea de regresión. Esto es extremadamente raro en datos económicos reales.
\(0 < R^2 < 1\): Indica que el modelo explica una parte de la variabilidad de la variable dependiente.
Mide la variabilidad total de la variable dependiente (Y) con respecto a su media. \[SST = \sum_{i=1}^{n} (Y_i - \bar{Y})^2\] Donde:
La SSE - Explained Sum of Squares / Sum of Squares Regression) mide la variabilidad de la variable dependiente que es explicada por el modelo de regresión. Es la diferencia entre los valores predichos y la media de Y. \[SSE = \sum_{i=1}^{n} (\hat{Y}_i - \bar{Y})^2\] Donde:
La SSR - Sum of Squares Residual / Sum of Squares Error) mide la variabilidad no explicada por el modelo, es decir, la suma de los cuadrados de los residuos (la diferencia entre los valores observados y los predichos). \[SSR = \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2\] Donde:
La variabilidad total se puede descomponer en la variabilidad explicada y la variabilidad no explicada: \[SST = SSE + SSR\]
El coeficiente de determinación \(R^2\) se calcula como la proporción de la variabilidad total que es explicada por el modelo:
\[R^2 = \frac{SSE}{SST}\]
Usar la Suma de Cuadrados de los Errores:
Dado que \(SST = SSE + SSR\), podemos reescribir \(SSE = SST - SSR\). Sustituyendo esto en la fórmula de \(R^2\):
\[R^2 = \frac{SST - SSR}{SST}\]
\[R^2 = 1 - \frac{SSR}{SST}\]
Esta segunda fórmula es en general más usada y conceptualmente clara, ya que muestra \(R^2\) como 1 menos la proporción de la variabilidad no explicada.
Si tenemos: * \(SST = 100\) (La variabilidad total de Y es 100 unidades) * \(SSR = 30\) (La variabilidad no explicada por el modelo es 30 unidades)
Entonces: * \(SSE = SST - SSR = 100 - 30 = 70\)
Y el \(R^2\) sería: \[R^2 = \frac{SSE}{SST} = \frac{70}{100} = 0.70\]O\[R^2 = 1 - \frac{SSR}{SST} = 1 - \frac{30}{100} = 1 - 0.30 = 0.70\]
Esto significa que el 70% de la variabilidad de la variable dependiente es explicada por el modelo de regresión.
A pesar de esta relación matemática, sus interpretaciones son distintas: