Indique su nombre y cédula

Nombre:

Cédula:

Estadística I, Tarea 02

A continuación hay una serie de ejercicios que debe completar. Algunos de los códigos ya están vaciados para que se facilite realizar estar tarea.

Se recomienda para cada uno de los conjuntos de datos a trabajar, revise los datos que contienen, así como también usar las funciones de ayuda ? obtener información sobre los mismos y de esta manera lograr facilitar la comprensión sobre los datos a trabajar.

Recomendaciones

  1. Revisar el notebook clase 10

  2. Revisar el material clase 8 apoyo

  3. Revisar las láminas de apoyo de las clases

  4. Pautas del notebook de la tarea 1

Otras Recomendaciones

Usar funciones apropiadas para obtener los valores solicitados. Revise los ejercicios de codificación anteriormente presentados en el curso, las láminas, así como el libro Open Intro Stats.

Si realiza algún cálculo manualmente deberá añadir las celdas de código con tales cálculo, tantas como sea necesario.

En cada una de las celdas de código, añada comentarios con el símbolo numeral (#) al inicio de la celda para indicar los procedimientos realizados.

Recuerde cuidar la redacción y ortografía en la información que presente.

En caso de tener alguna duda sobre los procedimientos a seguir, usar el grupo de whatsapp.

Se recuerda que la terea debe ser realizada de forma individual.

# cargar librarías necesarias
library(ggplot2) #generar gráficos
library(dplyr) #procesar necesarios

## funciones de ayuda
media_armonica <- function(x) {
  n <- length(x)
  n / sum(1/x)
}



media_geometrica <- function(x) {
  prod(x)^(1/length(x))
}
# cargar los datos de la inflación de japón
inflacion_japon <- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1/refs/heads/main/data/inflacion_japon.csv', row.names = NULL)

Los datos de la inflación de Japón fueron obtenidos del Banco Mundial

# Visualizar los datos de la inflación de Japón desde el año 1961 a 2023
inflacion_japon

Primera Parte:

Previos Primera Parte:

En esta sección van a realizar los cálculos sin usar las funciones como mean, median, etc.

Se van a calcular usando operadores aritméticos como

  • suma (+)

  • menos (-)

  • por (*)

  • dividido (/)

  • potencia (^)

Nota: no usar operador igual (=)

# ejemplo de sumas
5+ 7 +19 + 20
# ejemplo de división
16/2
# operación compuesta de dos o más operadores con jerarquías
(3+12)/8
# este código es distinto a
3+12/8
# elevar valores al cuadrado u otra potencia
3^2
(2+3)^2

Inicio Primera Parte

Para hacer los cálculos usaremos sólo un subconjunto de datos de observaciones seleccionando valores de inflación que van del año 1961 a 1969.

inflacion_japon$inflacion[1:9]

Con los valores anteriores generar los siguientes “estadísticos” e ir agregando una celda de código para cada uno de ellos (tantas como sea necesario)

  • Media Aritmética

  • Mediana

  • Varianza

  • Desviación Típica

  • Media Geométrica

  • Media Armónica

# Media Aritmética
# ...
# ...
# ...
# ...
# ...
# ...

Segunda Parte: Representación de Gráficos

Representación Gráfico de Puntos (dotplot)

ggplot(data=inflacion_japon, aes(x=inflacion))+
  geom_dotplot()+
  annotate('point',
           x=mean(inflacion_japon$inflacion),
           y=-.01,
           col='red',
           size=2)

Ojo: El punto rojo representa la mediana

Representación Gráfico de Caja (Boxplot) sin bigotes

ggplot(data=inflacion_japon,
       aes(y=inflacion))+
  geom_boxplot()

Pregunta: puede indicar si observa alguna relación entre ambos gráficos? Cómo las puede establecer

respuesta:

…..

Nuevamente vamos a representar el dotplot

ggplot(data=inflacion_japon, aes(x=inflacion))+
  geom_dotplot()+
  annotate('point',
           x=median(inflacion_japon$inflacion),
           y=-.01,
           col='red',
           size=2)

Nuevamente vamos a representar el boxplot

En este caso vamos a rotar 90 grados a la izquierda el gráfico, pero siguen siendo los mismos valores

ggplot(data=inflacion_japon,
       aes(y=inflacion))+
  geom_boxplot()+
  coord_flip()

Preunta: puede observar de esta forma alguna relación entre los gráficos?

su respuesta:

Tercera Parte

Ahora vamos a usar las funciones que dispone R, las cuales ya hemos ido revisando, para obtener los siguientes valores. Los valores se deben calcular usando todos los datos que contiene la serie

Ejemplo:

calcular la mediana

###
median(inflacion_japon$inflacion)

cuando se indica inflacion_japon$inflacion es para solo usar en el cálculo anterior la columna inflación que es justamente la que contiene los datos de interes, ya que la otra columna es “year” que no la usamos en ninguno de los cálculos que estamos haciendo

“Estadísticos” a obtener

  • Rango

  • Primer Cuartil

  • Segundo Cuartil

  • Mediana 🧐

  • Tercer Cuartil

  • Rango Intercuartílico

  • Media Aritmética

  • Primer percentil

  • Cuántos valores hay en el primer percentil?

  • Cuáles valores se encuentran en el primer percentil?

  • Cuántos valores hay en el primer cuartil?

  • Cuántos valores se encuentran en el primer cuartil?

  • Cálculo de los alcances máximos de los valores de los bigotes superiores e inferior

  • Datos resumen de la variable (usar función summary)

  • Media armónica (usar funcion media_armonica)

  • Media geometrica (usar funcion media_geometrica)

Cuarta Parte

Dados sólo cuatro valores de la serie desde 1962 a 1965, cuál tipo de media recomendaría usar para entender mejor las variaciones de dicho período? Justifique su respuesta.

Puede usar las funciones precargadas o realizar sus propios cálculos

inflacion_japon$year[2:5]
# realizar cálculos

su respuesta

….