Estadística I, Clase 7

Tablas de Frecuencias Acumuladas

Instalar paquetes requeridos

install.packages("openintro")
Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)

also installing the dependencies ‘airports’, ‘cherryblossom’, ‘usdata’

Cargar librerías

library(openintro)
library(dplyr)
Loading required package: airports

Loading required package: cherryblossom

Loading required package: usdata


Attaching package: ‘dplyr’


The following objects are masked from ‘package:stats’:

    filter, lag


The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union

Crear muestra pseudo aleatoria

Vamos a generar una muestra simulando un grupo de 9 estudiantes que tienen edades entre 20 y 25 años

set.seed(1234)
# x= población de la cuál se obtendrá la muestra
# size= cantidad de elementos que tendrá la muestra
# replace= establece sin en la muestra se pueden repetir elementos contenidos en x

muestra = sample(x=20:25,size = 9, replace= TRUE)

muestra
  1. 23
  2. 21
  3. 25
  4. 24
  5. 23
  6. 20
  7. 24
  8. 25
  9. 23

Crear tabla de frecuencia para 3 intervalos

  1. las clases
  2. punto medio (Xi)
  3. frecuencia absoluta (fi)
  4. frecuencia relativa (hi)
  5. frecuencia absoluta acumulada (Fi)
  6. frecuencia acumulada relativa (Hi)

Ejercicio Nacimientos Babies

head(babies)
A tibble: 6 × 8
case bwt gestation parity age height weight smoke
<int> <int> <int> <int> <int> <int> <int> <int>
1 120 284 0 27 62 100 0
2 113 282 0 33 64 135 0
3 128 279 0 28 64 115 1
4 123 NA 0 36 69 190 0
5 108 282 0 23 67 125 1
6 136 286 0 25 62 93 0
edad_madres= babies$age[!is.na(babies$age)]
edad_madres
  1. 27
  2. 33
  3. 28
  4. 36
  5. 23
  6. 25
  7. 33
  8. 23
  9. 25
  10. 30
  11. 27
  12. 32
  13. 23
  14. 36
  15. 30
  16. 38
  17. 25
  18. 33
  19. 33
  20. 43
  21. 22
  22. 27
  23. 25
  24. 30
  25. 23
  26. 27
  27. 26
  28. 20
  29. 32
  30. 28
  31. 26
  32. 34
  33. 30
  34. 23
  35. 24
  36. 22
  37. 24
  38. 23
  39. 27
  40. 31
  41. 30
  42. 23
  43. 26
  44. 27
  45. 37
  46. 27
  47. 32
  48. 25
  49. 26
  50. 26
  51. 26
  52. 31
  53. 28
  54. 31
  55. 30
  56. 22
  57. 26
  58. 33
  59. 28
  60. 33
  61. 24
  62. 22
  63. 23
  64. 23
  65. 28
  66. 36
  67. 37
  68. 26
  69. 31
  70. 38
  71. 27
  72. 26
  73. 25
  74. 24
  75. 24
  76. 21
  77. 26
  78. 39
  79. 27
  80. 27
  81. 35
  82. 23
  83. 25
  84. 33
  85. 30
  86. 29
  87. 32
  88. 37
  89. 22
  90. 24
  91. 33
  92. 28
  93. 27
  94. 31
  95. 23
  96. 22
  97. 28
  98. 37
  99. 35
  100. 29
  101. 27
  102. 33
  103. 24
  104. 36
  105. 24
  106. 37
  107. 33
  108. 22
  109. 27
  110. 29
  111. 26
  112. 28
  113. 19
  114. 21
  115. 22
  116. 29
  117. 33
  118. 25
  119. 32
  120. 39
  121. 24
  122. 26
  123. 35
  124. 34
  125. 31
  126. 25
  127. 23
  128. 30
  129. 35
  130. 28
  131. 25
  132. 20
  133. 25
  134. 24
  135. 25
  136. 31
  137. 24
  138. 28
  139. 21
  140. 27
  141. 39
  142. 32
  143. 25
  144. 30
  145. 32
  146. 23
  147. 24
  148. 29
  149. 24
  150. 38
  151. 29
  152. 29
  153. 29
  154. 20
  155. 23
  156. 21
  157. 22
  158. 24
  159. 39
  160. 22
  161. 21
  162. 43
  163. 36
  164. 30
  165. 22
  166. 22
  167. 29
  168. 26
  169. 23
  170. 29
  171. 22
  172. 25
  173. 24
  174. 23
  175. 30
  176. 31
  177. 30
  178. 25
  179. 32
  180. 25
  181. 23
  182. 23
  183. 23
  184. 29
  185. 21
  186. 34
  187. 25
  188. 24
  189. 20
  190. 28
  191. 35
  192. 22
  193. 26
  194. 32
  195. 26
  196. 30
  197. 22
  198. 22
  199. 22
  200. 34
  201. 28
  202. 23
  203. 21
  204. 27
  205. 23
  206. 34
  207. 24
  208. 34
  209. 26
  210. 19
  211. 23
  212. 36
  213. 24
  214. 32
  215. 20
  216. 29
  217. 18
  218. 22
  219. 30
  220. 23
  221. 31
  222. 26
  223. 33
  224. 31
  225. 30
  226. 24
  227. 27
  228. 29
  229. 19
  230. 24
  231. 21
  232. 39
  233. 24
  234. 21
  235. 45
  236. 32
  237. 41
  238. 25
  239. 22
  240. 34
  241. 26
  242. 30
  243. 21
  244. 33
  245. 19
  246. 23
  247. 36
  248. 22
  249. 41
  250. 29
  251. 28
  252. 26
  253. 20
  254. 26
  255. 27
  256. 31
  257. 33
  258. 26
  259. 31
  260. 25
  261. 24
  262. 24
  263. 23
  264. 39
  265. 26
  266. 27
  267. 35
  268. 37
  269. 19
  270. 18
  271. 37
  272. 20
  273. 35
  274. 28
  275. 24
  276. 23
  277. 31
  278. 21
  279. 24
  280. 20
  281. 30
  282. 29
  283. 30
  284. 23
  285. 35
  286. 39
  287. 30
  288. 22
  289. 37
  290. 19
  291. 21
  292. 42
  293. 40
  294. 41
  295. 29
  296. 24
  297. 29
  298. 18
  299. 19
  300. 41
  301. 31
  302. 25
  303. 20
  304. 24
  305. 23
  306. 32
  307. 26
  308. 22
  309. 29
  310. 29
  311. 35
  312. 27
  313. 25
  314. 37
  315. 35
  316. 41
  317. 18
  318. 28
  319. 25
  320. 23
  321. 29
  322. 28
  323. 19
  324. 19
  325. 26
  326. 23
  327. 34
  328. 24
  329. 20
  330. 25
  331. 37
  332. 30
  333. 32
  334. 19
  335. 21
  336. 21
  337. 26
  338. 27
  339. 21
  340. 25
  341. 25
  342. 23
  343. 17
  344. 31
  345. 24
  346. 32
  347. 20
  348. 24
  349. 20
  350. 39
  351. 21
  352. 36
  353. 37
  354. 18
  355. 24
  356. 24
  357. 39
  358. 24
  359. 36
  360. 24
  361. 33
  362. 19
  363. 34
  364. 19
  365. 22
  366. 22
  367. 32
  368. 25
  369. 31
  370. 29
  371. 17
  372. 18
  373. 29
  374. 25
  375. 33
  376. 21
  377. 28
  378. 39
  379. 21
  380. 28
  381. 24
  382. 28
  383. 19
  384. 28
  385. 19
  386. 21
  387. 21
  388. 23
  389. 28
  390. 29
  391. 21
  392. 30
  393. 34
  394. 27
  395. 27
  396. 27
  397. 24
  398. 30
  399. 21
  400. 38
resultado <- hist(edad_madres, breaks = 5, plot=F)
resultado
$breaks
[1] 15 20 25 30 35 40 45

$counts
[1] 134 402 374 190 108  26

$density
[1] 0.021717990 0.065153971 0.060615883 0.030794165 0.017504052 0.004213938

$mids
[1] 17.5 22.5 27.5 32.5 37.5 42.5

$xname
[1] "edad_madres"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"
data.frame(Xi=resultado$mids,
           fi=resultado$counts,
           densidad= resultado$density)%>%
  mutate(hi= (fi/sum(resultado$counts)*100))%>%
  mutate(Fi= cumsum(fi))%>%
  mutate(HI= cumsum(fi/sum(resultado$counts)*100))
A data.frame: 6 × 6
Xi fi densidad hi Fi HI
<dbl> <int> <dbl> <dbl> <int> <dbl>
17.5 134 0.021717990 10.858995 134 10.85900
22.5 402 0.065153971 32.576985 536 43.43598
27.5 374 0.060615883 30.307942 910 73.74392
32.5 190 0.030794165 15.397083 1100 89.14100
37.5 108 0.017504052 8.752026 1208 97.89303
42.5 26 0.004213938 2.106969 1234 100.00000

Visualización Histogramas Conjuntos de Datos

hist(classdata$m1)
hist(babies$age)
hist(babies$height)
hist(babies$weight)
hist(babies$gestation,breaks =20)
hist(age_at_mar$age)
hist(arbuthnot$year, breaks = 50)
# frecuencia relativa
hist(gpa_iq$gpa, freq=FALSE)
hist(gpa_iq$gpa)
resultado2 <- hist(gpa_iq$gpa, breaks = 5, plot=F)
data.frame(Xi=resultado2$mids,
           fi=resultado2$counts,
           densidad= resultado2$density
           )%>%
  mutate(hi= (fi/sum(resultado2$counts)*100))%>%
  mutate(Fi= cumsum(fi))%>%
  mutate(HI= cumsum(fi/sum(resultado2$counts)*100))
A data.frame: 6 × 6
Xi fi densidad hi Fi HI
<dbl> <int> <dbl> <dbl> <int> <dbl>
1 2 0.01282051 2.564103 2 2.564103
3 6 0.03846154 7.692308 8 10.256410
5 8 0.05128205 10.256410 16 20.512821
7 30 0.19230769 38.461538 46 58.974359
9 28 0.17948718 35.897436 74 94.871795
11 4 0.02564103 5.128205 78 100.000000

Enlace Aplicación Pib PerCápita Países 2007

aplicación gapminder

Enlace códigos aplicaciones

código app gapminder

código app edades madres