UCV Economía Estadística I

Instalar paquetes requeridos

install.packages("openintro")

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

also installing the dependencies ‘airports’, ‘cherryblossom’, ‘usdata’

Cargar librerías

library(openintro)
library(dplyr)

Loading required package: airports

Loading required package: cherryblossom

Loading required package: usdata


Attaching package: ‘dplyr’


The following objects are masked from ‘package:stats’:

    filter, lag


The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union

Crear muestra pseudo aleatoria

Vamos a generar una muestra simulando un grupo de 9 estudiantes que tienen edades entre 20 y 25 años

set.seed(1234)
# x= población de la cuál se obtendrá la muestra
# size= cantidad de elementos que tendrá la muestra
# replace= establece sin en la muestra se pueden repetir elementos contenidos en x

muestra = sample(x=20:25,size = 9, replace= TRUE)

muestra

23
21
25
24
23
20
24
25
23

Crear tabla de frecuencia para 3 intervalos

las clases
punto medio (Xi)
frecuencia absoluta (fi)
frecuencia relativa (hi)
frecuencia absoluta acumulada (Fi)
frecuencia acumulada relativa (Hi)

Ejercicio Nacimientos Babies

head(babies)

A tibble: 6 × 8
case	bwt	gestation	parity	age	height	weight	smoke
<int>	<int>	<int>	<int>	<int>	<int>	<int>	<int>
1	120	284	0	27	62	100	0
2	113	282	0	33	64	135	0
3	128	279	0	28	64	115	1
4	123	NA	0	36	69	190	0
5	108	282	0	23	67	125	1
6	136	286	0	25	62	93	0

edad_madres= babies$age[!is.na(babies$age)]
edad_madres

27
33
28
36
23
25
33
23
25
30
27
32
23
36
30
38
25
33
33
43
22
27
25
30
23
27
26
20
32
28
26
34
30
23
24
22
24
23
27
31
30
23
26
27
37
27
32
25
26
26
26
31
28
31
30
22
26
33
28
33
24
22
23
23
28
36
37
26
31
38
27
26
25
24
24
21
26
39
27
27
35
23
25
33
30
29
32
37
22
24
33
28
27
31
23
22
28
37
35
29
27
33
24
36
24
37
33
22
27
29
26
28
19
21
22
29
33
25
32
39
24
26
35
34
31
25
23
30
35
28
25
20
25
24
25
31
24
28
21
27
39
32
25
30
32
23
24
29
24
38
29
29
29
20
23
21
22
24
39
22
21
43
36
30
22
22
29
26
23
29
22
25
24
23
30
31
30
25
32
25
23
23
23
29
21
34
25
24
20
28
35
22
26
32
26
30
22
22
22
34
⋯
28
23
21
27
23
34
24
34
26
19
23
36
24
32
20
29
18
22
30
23
31
26
33
31
30
24
27
29
19
24
21
39
24
21
45
32
41
25
22
34
26
30
21
33
19
23
36
22
41
29
28
26
20
26
27
31
33
26
31
25
24
24
23
39
26
27
35
37
19
18
37
20
35
28
24
23
31
21
24
20
30
29
30
23
35
39
30
22
37
19
21
42
40
41
29
24
29
18
19
41
31
25
20
24
23
32
26
22
29
29
35
27
25
37
35
41
18
28
25
23
29
28
19
19
26
23
34
24
20
25
37
30
32
19
21
21
26
27
21
25
25
23
17
31
24
32
20
24
20
39
21
36
37
18
24
24
39
24
36
24
33
19
34
19
22
22
32
25
31
29
17
18
29
25
33
21
28
39
21
28
24
28
19
28
19
21
21
23
28
29
21
30
34
27
27
27
24
30
21
38

resultado <- hist(edad_madres, breaks = 5, plot=F)

resultado

$breaks
[1] 15 20 25 30 35 40 45

$counts
[1] 134 402 374 190 108  26

$density
[1] 0.021717990 0.065153971 0.060615883 0.030794165 0.017504052 0.004213938

$mids
[1] 17.5 22.5 27.5 32.5 37.5 42.5

$xname
[1] "edad_madres"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"

data.frame(Xi=resultado$mids,
           fi=resultado$counts,
           densidad= resultado$density)%>%
  mutate(hi= (fi/sum(resultado$counts)*100))%>%
  mutate(Fi= cumsum(fi))%>%
  mutate(HI= cumsum(fi/sum(resultado$counts)*100))

A data.frame: 6 × 6
Xi	fi	densidad	hi	Fi	HI
<dbl>	<int>	<dbl>	<dbl>	<int>	<dbl>
17.5	134	0.021717990	10.858995	134	10.85900
22.5	402	0.065153971	32.576985	536	43.43598
27.5	374	0.060615883	30.307942	910	73.74392
32.5	190	0.030794165	15.397083	1100	89.14100
37.5	108	0.017504052	8.752026	1208	97.89303
42.5	26	0.004213938	2.106969	1234	100.00000

Visualización Histogramas Conjuntos de Datos

hist(classdata$m1)

hist(babies$age)

hist(babies$height)

hist(babies$weight)

hist(babies$gestation,breaks =20)

hist(age_at_mar$age)

hist(arbuthnot$year, breaks = 50)

# frecuencia relativa
hist(gpa_iq$gpa, freq=FALSE)

hist(gpa_iq$gpa)

resultado2 <- hist(gpa_iq$gpa, breaks = 5, plot=F)

data.frame(Xi=resultado2$mids,
           fi=resultado2$counts,
           densidad= resultado2$density
           )%>%
  mutate(hi= (fi/sum(resultado2$counts)*100))%>%
  mutate(Fi= cumsum(fi))%>%
  mutate(HI= cumsum(fi/sum(resultado2$counts)*100))

A data.frame: 6 × 6
Xi	fi	densidad	hi	Fi	HI
<dbl>	<int>	<dbl>	<dbl>	<int>	<dbl>
1	2	0.01282051	2.564103	2	2.564103
3	6	0.03846154	7.692308	8	10.256410
5	8	0.05128205	10.256410	16	20.512821
7	30	0.19230769	38.461538	46	58.974359
9	28	0.17948718	35.897436	74	94.871795
11	4	0.02564103	5.128205	78	100.000000

Enlace Aplicación Pib PerCápita Países 2007

aplicación gapminder

Enlace códigos aplicaciones

código app gapminder

código app edades madres

Estadística I, Clase 7

Tablas de Frecuencias Acumuladas

Instalar paquetes requeridos

Cargar librerías

Crear muestra pseudo aleatoria

Crear tabla de frecuencia para 3 intervalos

Ejercicio Nacimientos Babies

Visualización Histogramas Conjuntos de Datos

Enlace Aplicación Pib PerCápita Países 2007

Enlace códigos aplicaciones