1 00:00:00,000 --> 00:00:07,419 Vamos a hacer el estudio estadístico completo del problema del peso de las mochilas para un grupo de 28 alumnos. 2 00:00:07,860 --> 00:00:15,830 Para ello, lo primero que hacemos es empezar a colocar los datos que me han dado. 3 00:00:16,710 --> 00:00:24,989 El peso de las mochilas, que lo colocamos en intervalos, desde, por ejemplo, el primer intervalo es desde 2,8 kilos, 4 00:00:24,989 --> 00:00:29,730 que sí que puede pesar eso la mochila hasta 3,4 5 00:00:29,730 --> 00:00:33,909 pero ya este dato no lo voy a reflejar aquí 6 00:00:33,909 --> 00:00:37,109 o no lo voy a recontar aquí sino en la siguiente fila 7 00:00:37,109 --> 00:00:39,649 y luego las frecuencias que me han dado 8 00:00:39,649 --> 00:00:45,810 ahí hay chavales que tienen mochilas que pesan entre 2,8 y 3,4 kilos 9 00:00:45,810 --> 00:00:49,950 4 el siguiente, 8, 5 y así sucesivamente 10 00:00:49,950 --> 00:00:55,869 Si sumo todas las frecuencias absolutas, me da el número de chavales de la clase. 11 00:00:57,429 --> 00:01:00,829 Bien, pues vamos a empezar a elaborar lo primero en la tabla de frecuencias. 12 00:01:01,509 --> 00:01:07,250 La primera que vamos a hacer es la frecuencia absoluta acumulada. 13 00:01:07,870 --> 00:01:12,790 ¿Cómo se hace? Simplemente voy sumando todas las frecuencias anteriores. 14 00:01:12,790 --> 00:01:25,269 En la primera solo hay 6 alumnos, en la segunda ya hay 6 y 4, 10, en la siguiente habrá 10 y 8, 18 y así sucesivamente hasta que el total sean los 28 alumnos de la clase. 15 00:01:26,769 --> 00:01:37,689 En la siguiente columna voy a poner la frecuencia relativa, que es el cociente entre la frecuencia absoluta y el número de alumnos de la clase. 16 00:01:37,689 --> 00:01:42,230 Así que tranquilamente lo voy haciendo. 17 00:01:42,790 --> 00:01:52,090 6 entre 28, 2,1, 4 entre 28, 0,14 y así sucesivamente. 18 00:01:52,829 --> 00:01:56,109 La suma de todas las frecuencias me tiene que dar 1. 19 00:01:56,549 --> 00:02:00,189 En algunas ocasiones tendré que redondear los números para que sea así. 20 00:02:01,150 --> 00:02:06,150 Lo puedo expresar bien de esta forma con dos decimales o bien en porcentaje. 21 00:02:06,430 --> 00:02:11,150 En vez de 0,21 pondré el 21%, aquí en este caso el 14%, 22 00:02:11,150 --> 00:02:19,069 14%, con lo cual la columna de los porcentajes me dará el 100% de la clase. 23 00:02:19,069 --> 00:02:25,169 Otra de las columnas va a ser igual, pero sumando las frecuencias relativas. 24 00:02:25,169 --> 00:02:32,629 En este caso pondría el 0,21 y aquí ya sumaría con el siguiente, que serían 0,35 y así 25 00:02:32,629 --> 00:02:33,629 sucesivamente. 26 00:02:33,629 --> 00:02:43,810 Vamos a pasar las medidas estadísticas de centralización para ver si los datos están concentrados en el centro o donde están. 27 00:02:43,949 --> 00:02:46,270 Para ello lo primero que hacemos es la media aritmética. 28 00:02:46,810 --> 00:02:58,250 La media aritmética es el sumatorio, esto quiere decir que voy a sumar todos estos productos de los datos por su frecuencia partido en n. 29 00:02:58,250 --> 00:03:05,729 En este caso no tengo datos, tenía un intervalo, así que lo primero que tengo que hacer es sacar la marca de clase, que es xy. 30 00:03:06,389 --> 00:03:12,069 Para ello hago la media, sumo los dos extremos del intervalo y los divido entre 2. 31 00:03:12,729 --> 00:03:20,810 Así me daría el 3 con 1, en este caso 3 con 4 más 4 entre 2, el 3 con 7, y así iría sacando todas las marcas de clase. 32 00:03:21,770 --> 00:03:28,189 A continuación haría el producto de esa marca de clase por la frecuencia. 33 00:03:28,250 --> 00:03:38,370 3,1 por 6, porque había 6 alumnos que habían sacado esa marca, tanto 3,7 por 4, 14,8. 34 00:03:39,530 --> 00:03:46,770 Esta columna la sumaría entera, con lo cual ya tenía el numerador de mi fórmula. 35 00:03:47,710 --> 00:03:52,490 Sustituiría el valor y pondría debajo el 28, que es la muestra que hay. 36 00:03:52,490 --> 00:04:03,319 En este caso, si no me he equivocado, el resultado de la media es 4,32 porque lo vamos a utilizar a continuación. 37 00:04:04,960 --> 00:04:09,120 Otro dato, otra medida estadística de centralización es la moda. 38 00:04:10,199 --> 00:04:14,860 La moda es el dato o marca de clase con mayor frecuencia. 39 00:04:15,639 --> 00:04:21,860 Así que empezamos a mirar otra vez las frecuencias y vemos que el de mayor frecuencia es este intervalo, 40 00:04:21,860 --> 00:04:25,639 que va de 4 a 4,6 kilos el peso de la mochila. 41 00:04:26,699 --> 00:04:32,420 Así que vendríamos a la marca de clase y esa marca de clase sería el resultado, esa sería la moda. 42 00:04:35,199 --> 00:04:40,120 La mediana sería la siguiente medida estadística de centralización. 43 00:04:41,060 --> 00:04:45,379 Es el dato del medio, aunque si hubiera dos valores sería la media. 44 00:04:45,379 --> 00:04:55,199 cuál es el dato que está en el medio si hay 28 alumnos la mitad está en 14 45 00:04:55,199 --> 00:05:03,019 alumnos miraría a ver aquí hay 6 alumnos y 4 10 18 pues estaría por aquí porque 46 00:05:03,019 --> 00:05:08,540 la mitad de 28 son 14 pues estaría por aquí con lo cual vendría a la marca de 47 00:05:08,540 --> 00:05:20,980 clase y ahí entonces coincidiría exactamente moda y mediana sería el mismo número. Ahora vamos a ver 48 00:05:20,980 --> 00:05:26,360 las medidas de posición, para eso tengo que organizar los cuartiles. El primer cuartil es 49 00:05:26,360 --> 00:05:33,680 el 25% de la muestra de 28 que corresponde a 7 y tengo que encontrar la frecuencia absoluta que 50 00:05:33,680 --> 00:05:42,579 sea mayor o igual que 7. Pues mira, la primera ya tengo aquí el 10, esta es mayor que 7, con lo cual 51 00:05:42,579 --> 00:05:50,180 me voy a la marca de clase y veo que corresponde a 3,7. Así que como la marca de clase es 3,7, 52 00:05:50,379 --> 00:05:57,720 el primer cuartil es 3,7 y lo marcaría en la línea que va desde el peso de la menor mochila, 53 00:05:57,720 --> 00:06:05,519 2,8 kilos, hasta la de mayor, 6,4 kilos. El segundo cuartil corresponde al 50% de la muestra, 54 00:06:06,000 --> 00:06:13,959 que serían 14, y tendríamos que encontrar la frecuencia mayor o igual a 14, y así encontraríamos 55 00:06:13,959 --> 00:06:23,060 el segundo cuartil. El tercer cuartil sería el 75% de 28 de la muestra, que sería 21, 56 00:06:23,060 --> 00:06:30,379 y haríamos exactamente igual para encontrar el tercer cuartil dibujando las medidas de posición en la línea. 57 00:06:31,420 --> 00:06:39,240 Y fijaríamos luego la media para ver dónde están colocados o situados los datos. 58 00:06:40,839 --> 00:06:47,819 Y lo último que estudiaríamos serían las medias estadísticas de dispersión, a ver si los datos están concentrados o no. 59 00:06:47,819 --> 00:06:57,579 La primera es la desviación media, que es el sumatorio de las frecuencias por el valor absoluto de la diferencia entre el dato y la media. 60 00:06:58,139 --> 00:07:03,319 Así que lo primero que necesito es sacar el valor absoluto de la diferencia del dato y la media. 61 00:07:04,019 --> 00:07:07,639 Me vengo a la columna y lo coloco y empiezo a hacerlos. 62 00:07:08,480 --> 00:07:16,660 El dato, voy a la marca de clase en este caso, 3,1, y le resto la media, que son 4,32. 63 00:07:16,660 --> 00:07:23,980 saldría negativo pero como es valor absoluto pongo en positivo y sacaría todos mis datos una vez que 64 00:07:23,980 --> 00:07:30,279 lo tengo necesito multiplicar por la frecuencia así que el dato que me ha dado lo multiplicó por 65 00:07:30,279 --> 00:07:38,860 la frecuencia que es el número de alumnos que han sacado ese dato y así voy completando toda mi 66 00:07:38,860 --> 00:07:46,060 tabla una vez que la tenga sumo todos esos datos y me vengo a la fórmula para sustituirlos en el 67 00:07:46,060 --> 00:07:57,100 numerador, divido por el número de alumnos que hay, que eran 28, y ya tengo la desviación 68 00:07:57,100 --> 00:08:06,379 media. Luego, para calcular la varianza, que es la desviación típica al cuadrado, pues 69 00:08:06,379 --> 00:08:12,360 necesito el cuadrado de la diferencia entre el dato y la media, que es una cosa que todavía 70 00:08:12,360 --> 00:08:20,180 ya no tengo. Así que me la marco aquí y empiezo a hacerlo. La diferencia ya la tenía, me da igual 71 00:08:20,180 --> 00:08:25,639 que sea positiva o negativa porque la voy a elevar al cuadrado y va a caer siempre positiva. Así que 72 00:08:25,639 --> 00:08:33,639 esa diferencia la elevo al cuadrado. Así completaría toda la columna. Para que en la siguiente lo que 73 00:08:33,639 --> 00:08:41,139 haría sería multiplicar ese dato por la frecuencia que tenía, o sea por el número de alumnos que 74 00:08:41,139 --> 00:08:49,100 tenían ese dato y voy obteniéndolos todos. Para el final, sumarlos. Me vengo a la fórmula, 75 00:08:49,659 --> 00:08:53,440 sustituyo el numerador por esa suma que he encontrado y divido por el número de datos 76 00:08:53,440 --> 00:09:00,399 y ya tengo la varianza. Ya sólo me faltaría la desviación típica, que sería el hacer 77 00:09:00,399 --> 00:09:07,960 la raíz cuadrada de la varianza. Y ya tendría la desviación típica y habría visto si 78 00:09:07,960 --> 00:09:14,980 los datos están concentrados en torno a la media o no lo están. Bueno, mucho ánimo, 79 00:09:15,440 --> 00:09:19,419 hay mucha información en todo esto, así que poquito a poquito.