
Clase 15: Regresión Lineal Simple
Universidad Central de Venezuela- Escuela de Economía. 2025-1
2025-06-05
Esta línea se representa con la ecuación: \[\hat{y} = \beta_0 + \beta_1 x\]
El modelo de R.L.S., \(\hat{y} = \beta_0 + \beta_1 x\) , está compuesto por
\(\hat{y}\) es el valor predicho de \(Y\),
\(\beta_0\) es la intersección con el eje \(Y\), y
\(\beta_1\) es la pendiente.
Entender cómo cambios en una variable (ej. inversión) afectan a otra (ej. crecimiento del PIB).
Ecuación: La relación lineal se representa mediante la siguiente ecuación:
\[Y_i = \beta_0 + \beta_1 X_i + \epsilon_i\]
Donde:
Queremos minimizar
\(\sum_{i=1}^{n} (y_i - \hat{y}_i)^2\) que es el error cuadrático medio
dado que = \[\hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i\]
entonces:
\[\sum_{i=1}^{n} (y_i - \hat{y}_i)^2=\sum_{i=1}^{n} (y_i - (\hat{\beta}_0 + \hat{\beta}_1 X_i))^2\]
Donde:
\(\hat{Y}_i\): Es el valor predicho de \(Y\) para una \(X_i\) dada.
\(\hat{\beta}_0\): Es la estimación del intercepto.
\(\hat{\beta}_1\): Es la estimación de la pendiente.
Las fórmulas para calcular la pendiente (\(beta_1\)) y la intersección (\(beta_0\)) que minimizan la suma de los cuadrados de los errores son:
Estimación de la Pendiente (\(\hat{\beta}_1\)):
\[\hat{\beta}_1 = \frac{\sum_{i=1}^{n}(X_i - \bar{X})(Y_i - \bar{Y})}{\sum_{i=1}^{n}(X_i - \bar{X})^2}\]
O su forma equivalente:
\[\hat{\beta}_1 = \frac{n \sum_{i=1}^{n} X_i Y_i - (\sum_{i=1}^{n} X_i)(\sum_{i=1}^{n} Y_i)}{n \sum_{i=1}^{n} X_i^2 - (\sum_{i=1}^{n} X_i)^2}\]
Donde:
\(\bar{X}\): Media de \(X\).
\(\bar{Y}\): Media de \(Y\).
\(n\): Número de observaciones.
Estimación del Intercepto (\(\hat{\beta}_0\)):
\[\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X}\]

Ejemplo : Supongamos que regresamos “Gasto en Consumo (\(Y\))” sobre “Ingreso Disponible (\(X\))” y obtenemos:
\[\text{Gasto en Consumo} = 100 + 0.75 \times \text{Ingreso Disponible}\]
Interpretación:
Consideremos los siguientes datos sobre el número de horas dedicadas a un proyecto (\(X\)) y la calificación obtenida (\(Y\)):
| Estudiante | Horas (\(X\)) | Calificación (\(Y\)) |
|---|---|---|
| 1 | 1 | 2 |
| 2 | 2 | 4 |
| 3 | 3 | 5 |
Nuestro objetivo es encontrar la línea de regresión lineal que mejor se ajuste a estos puntos.

Primero, calculamos las medias:
\(\bar{x} = \frac{1 + 2 + 3}{3} = 2\)
\(\bar{y} = \frac{2+4+5}{3} = \frac{11}{3} \approx 3.67\)
Ahora, calculamos los términos necesarios para \(\beta_1\):
| \(x_i\) | \(y_i\) | \(x_i - \bar{x}\) | \(y_i - \bar{y}\) | \((x_i - \bar{x})(y_i - \bar{y})\) | \((x_i - \bar{x})^2\) |
|---|---|---|---|---|---|
| 1 | 2 | -1 | -1.67 | 1.67 | 1 |
| 2 | 4 | 0 | 0.33 | 0 | 0 |
| 3 | 5 | 1 | 1.33 | 1.33 | 1 |
| \(\sum = 3.00\) | \(\sum = 2\) |
Calculamos \(\beta_1\): \[\beta_1 = \frac{3.00}{2} = 1.5\]
Ahora, calculamos \(\beta_0\): \[\beta_0 = \bar{y} - \beta_1 \bar{x} = 3.67 - (1.5)(2) = 3.67 - 3 = 0.67\]
La ecuación de la línea de regresión lineal obtenida por el método de mínimos cuadrados es:
\[\hat{y} = 0.67 + 1.5 x\]
Esta ecuación nos permite predecir la calificación (\(\hat{y}\)) dado el número de horas dedicadas al proyecto (\(x\)), basándonos en el modelo lineal ajustado a nuestros datos.