1 00:00:00,640 --> 00:00:05,259 Buenas tardes, esta es la clase de matemáticas del día 14 de mayo. 2 00:00:05,960 --> 00:00:12,740 Hoy empezamos un tema nuevo, estadística, y vamos a ver un poquito antes de empezarle 3 00:00:12,740 --> 00:00:14,800 qué cosas vamos a tratar en este tema. 4 00:00:15,660 --> 00:00:20,679 Pues lo primero, pues vamos a hablar de la necesidad de hacer estadísticas. 5 00:00:22,160 --> 00:00:28,359 Vamos a ver qué cosas hay que estudiar dentro de esas estadísticas y cómo organizarnos los datos, 6 00:00:28,359 --> 00:00:36,100 o sea, cómo definir la población de la muestra sobre la que vamos a hacer la estadística, las variables que vamos a estudiar en esa estadística. 7 00:00:37,479 --> 00:00:48,320 Cuando ya tengo definido todo eso, pues ya hago ese muestreo y recojo esos datos, por lo que tengo que ver es cómo hago el recuento de esos datos, 8 00:00:49,140 --> 00:00:55,340 cómo los puedo expresar mediante gráficas o mediante tabla de valores, que se llamarán tablas de frecuencias. 9 00:00:55,340 --> 00:01:00,640 después estudiaremos las medidas de centralización y posición de esos datos 10 00:01:00,640 --> 00:01:04,560 y por último lo que se llaman las medidas de dispersión 11 00:01:04,560 --> 00:01:06,959 bueno, veremos hasta donde podamos llegar 12 00:01:06,959 --> 00:01:10,120 a ver si por lo menos hasta las medidas de centralización 13 00:01:10,120 --> 00:01:12,980 nos da tiempo a ver puesto que nos queda la clase de hoy 14 00:01:12,980 --> 00:01:15,219 y la de jueves que viene 15 00:01:15,219 --> 00:01:18,219 bueno, pues visto esto, vamos a por ello 16 00:01:18,219 --> 00:01:26,239 y lo primero, pues eso, hacer un poco 17 00:01:26,239 --> 00:01:31,500 una composición de situación de qué es la estadística 18 00:01:31,500 --> 00:01:33,439 y cuándo la utilizamos y para qué. 19 00:01:34,200 --> 00:01:37,439 Bueno, pues la estadística es una parte de las matemáticas 20 00:01:37,439 --> 00:01:41,719 que nos ayuda a estudiar ciertos datos. 21 00:01:41,959 --> 00:01:44,700 Y esto es algo que llevamos haciendo desde pequeñitos 22 00:01:44,700 --> 00:01:48,400 sin darnos cuenta y toda la vida y toda la humanidad. 23 00:01:49,980 --> 00:01:52,599 Desde que yo empiezo desde pequeño a contar 24 00:01:52,599 --> 00:01:56,560 o a clasificar mis juguetes, ya estoy haciendo 25 00:01:56,560 --> 00:02:00,540 actividades estadísticas. Yo clasifico 26 00:02:00,540 --> 00:02:04,540 objetos, pienso en cómo voy en esa competición escolar 27 00:02:04,540 --> 00:02:08,280 en la tabla de clasificación, hago gráficos, 28 00:02:08,639 --> 00:02:12,520 pues todo eso es estadística. Vamos a ver cómo 29 00:02:12,520 --> 00:02:16,680 lo hacemos. Entonces, viendo los puntos 30 00:02:16,680 --> 00:02:20,300 que marcábamos al principio, lo primero que vamos a hablar es 31 00:02:20,300 --> 00:02:24,539 de por qué tenemos la necesidad de hacer estadísticas. 32 00:02:25,379 --> 00:02:34,439 Bueno, pues hacemos estadísticas para ver qué decisiones o qué opiniones 33 00:02:34,439 --> 00:02:38,180 o qué intereses tiene una cierta población. 34 00:02:39,379 --> 00:02:43,120 Entonces, cuando yo quiero hacer esas estadísticas, 35 00:02:43,599 --> 00:02:47,400 tengo que fijarme en a qué población van dirigidas. 36 00:02:47,400 --> 00:03:01,000 Y vamos a ver qué es eso del concepto de población. Pues la población es el conjunto de individuos que tendrán unas ciertas características en común sobre las que yo quiero hacer el estudio. 37 00:03:01,000 --> 00:03:22,620 Por ejemplo, pues yo quiero hacer el estudio de intención de voto en la Comunidad de Madrid. ¿Quién sería la población? Pues todos los habitantes que tengan más de 18 años, porque son los que tienen derecho a voto, que hay en la Comunidad de Madrid completa. 38 00:03:22,620 --> 00:03:24,860 Uy, pues es que eso tiene que ser mucha gente 39 00:03:24,860 --> 00:03:28,280 Lo mismo son dos millones y pico de personas o tres 40 00:03:28,280 --> 00:03:34,199 Entonces, ¿podría ir yo preguntando uno por uno a ver qué intención de voto tienen? 41 00:03:34,780 --> 00:03:39,360 Pues no, pues fijaos, si ya cuando hacemos las elecciones ya mucha gente no vota, no aparece 42 00:03:39,360 --> 00:03:41,659 Pues, ¿cómo iba a ser la estadística? 43 00:03:42,060 --> 00:03:44,780 Ya sería un poco a tiro pasado 44 00:03:44,780 --> 00:03:49,000 Si yo quiero hacer una estadística para imaginarme qué va a pasar 45 00:03:49,000 --> 00:03:53,979 Pues tendré que intentar hacerlo de otra manera 46 00:03:53,979 --> 00:03:57,919 Entonces lo que hago es coger lo que se llama una muestra 47 00:03:57,919 --> 00:03:59,199 ¿Qué es una muestra? 48 00:03:59,919 --> 00:04:03,300 Pues es un subconjunto de esa población que yo quiero estudiar 49 00:04:03,300 --> 00:04:04,180 ¿Vale? 50 00:04:04,860 --> 00:04:07,479 Pero no la puedo coger de cualquier manera esa muestra 51 00:04:07,479 --> 00:04:11,300 Tengo que cogerla de una forma que sea representativa 52 00:04:11,300 --> 00:04:14,180 De esa población que yo quería estudiar 53 00:04:14,180 --> 00:04:17,339 Por ejemplo, en el caso que estamos diciendo 54 00:04:17,339 --> 00:04:21,160 Pues si yo quiero hacer esa encuesta de intención de voto 55 00:04:21,160 --> 00:04:26,220 No podré coger la muestra solo en un barrio de Madrid 56 00:04:26,220 --> 00:04:28,560 O solo en un pueblo de la Comunidad de Madrid 57 00:04:28,560 --> 00:04:33,819 Tendré que ir preguntando a personas de todos los pueblos y de todos los barrios 58 00:04:33,819 --> 00:04:36,399 En vez de a todas, a unas poquitas 59 00:04:36,399 --> 00:04:40,319 Pues en proporción a la población que haya en cada una de esas zonas 60 00:04:40,319 --> 00:04:42,500 Porque si no, no será representativo 61 00:04:42,500 --> 00:04:44,980 Si yo llego y quiero hacer esa muestra de intención de voto 62 00:04:44,980 --> 00:04:46,980 Y solo pregunto en Carabanchel 63 00:04:46,980 --> 00:05:06,019 O solo pregunto en Vallecas, pues no será lo mismo que si pregunto en La Moraleja o si pregunto en el barrio Salamanca. No saldrán los mismos resultados, probablemente. O si pregunto en La Roza solo y no pregunto, vamos a poner, en Fuenlabrada. 64 00:05:06,019 --> 00:05:15,100 ¿Vale? Entonces, tiene que ser una muestra representativa de la población que está intentando representar para la redundancia. 65 00:05:16,500 --> 00:05:24,879 Después, pues, tengo que elegir qué atributos o variables quiero estudiar en esa estadística. 66 00:05:25,480 --> 00:05:28,500 Entonces, ¿qué son las variables o atributos? 67 00:05:28,500 --> 00:05:40,740 Por las propiedades que queremos estudiar en esa estadística, o sea, ¿sobre qué quiero preguntar? En nuestro ejemplo, pues esa intención de voto sería nuestra variable estadística. 68 00:05:40,740 --> 00:05:52,920 Y desde ese punto de vista tenemos dos tipos de variables, unas que se llaman cualitativas, que también se les llama atributos, ¿por qué? 69 00:05:53,399 --> 00:06:04,639 Porque los valores que doy yo a esas variables no son valores numéricos, no podemos expresarlos de manera numérica, 70 00:06:04,639 --> 00:06:23,279 Sino que van a expresar cualidades y los tendré que expresar con letras, ¿vale? Con palabras. Por ejemplo, pues yo quiero estudiar los colores que le gusta a cierta población, a cierta, digamos, rango de edad. 71 00:06:23,279 --> 00:06:31,399 quiero estudiar los coches que le gustan, quiero estudiar los bares a los que van, por así decirlo, 72 00:06:31,480 --> 00:06:39,139 pues no puedo dar valores numéricos a esas variables, por eso las llamo cualitativas o atributos, 73 00:06:39,279 --> 00:06:41,660 porque van a expresar normalmente cualidades. 74 00:06:42,660 --> 00:06:50,839 Ahora, llamaremos variables cuantitativas cuando sí pueda expresar los valores de esa variable con números, 75 00:06:50,839 --> 00:06:57,319 O sea, sí que los puede expresar con cantidades, porque se llama cuantitativa, porque expresa una cantidad. 76 00:06:58,439 --> 00:07:05,899 A su vez, estas variables cuantitativas se dividen en dos distintas. 77 00:07:06,540 --> 00:07:14,839 Las discretas, o sea, tengo variables cuantitativas discretas, cuando los valores numéricos que pueden tomar son números enteros, 78 00:07:14,839 --> 00:07:24,959 Pues 1, 2, 3, 4, 5. Por ejemplo, yo quisiese preguntar el número de hermanos que tienen los alumnos de mi clase. 79 00:07:25,519 --> 00:07:34,100 Pues me van a decir 0, 1, 2, 3. Nadie me va a decir, por ejemplo, 1,5 o 0,45. No tiene ningún sentido. 80 00:07:34,839 --> 00:07:42,139 Entonces, cuantitativa discreta, los valores numéricos que puedo dar son números enteros. 81 00:07:42,139 --> 00:07:46,199 Ahora, tengo otras que se llaman cuantitativas continuas 82 00:07:46,199 --> 00:07:51,800 Y esas serían para los casos en los que los números que puedo dar yo como resultado 83 00:07:51,800 --> 00:07:56,240 Pueden tener decimales, o sea, cuando dentro de un intervalo de números 84 00:07:56,240 --> 00:07:57,819 Puedo tomar cualquier valor 85 00:07:57,819 --> 00:08:02,600 Por ejemplo, si me están preguntando por mi peso, por mi estatura 86 00:08:02,600 --> 00:08:05,860 Pues yo peso 85 y medio 87 00:08:05,860 --> 00:08:08,180 Ah, pues yo 85, 700 88 00:08:08,180 --> 00:08:10,660 Pues yo 84, 200 89 00:08:10,660 --> 00:08:20,000 O sea, digamos que en las continuas pueden aparecer decimales, en las discretas no. Esa sería una forma de diferenciarlas. 90 00:08:21,079 --> 00:08:35,720 Bueno, visto eso, pues vamos a ver cómo yo dentro de esa estadística hago el recuento de los resultados o de las respuestas que me ha dado la gente 91 00:08:35,720 --> 00:08:41,019 y de qué forma luego podría representarlo para poder ver esos valores. 92 00:08:41,879 --> 00:08:44,600 Y vamos a ver que lo vamos a poder representar mediante tablas, 93 00:08:44,720 --> 00:08:49,059 que se llaman tablas de frecuencias, en las que yo veo cuál ha sido la respuesta 94 00:08:49,059 --> 00:08:53,059 y cuánta gente me ha dado esa respuesta, o lo puedo hacer con dibujitos, 95 00:08:53,580 --> 00:08:58,019 en las que veo un poco más gráficamente lo que ha ocurrido. 96 00:08:58,480 --> 00:09:02,679 Hay veces que para hacerme una visión rápida de lo que ha pasado, 97 00:09:02,679 --> 00:09:06,899 pues es más cómodo verlo con gráficas, cuando quiero una visión 98 00:09:06,899 --> 00:09:10,659 más, digamos, pormenorizada de las cosas, pues quiero saber 99 00:09:10,659 --> 00:09:15,019 los numeritos y ver todas las cuentas que se han hecho con ellos, por así decirlo 100 00:09:15,019 --> 00:09:20,779 bueno, pues yo ya he cogido 101 00:09:20,779 --> 00:09:24,879 los resultados de esa encuesta que he hecho y ahora 102 00:09:24,879 --> 00:09:26,919 tengo que ordenarlos, ¿vale? 103 00:09:28,759 --> 00:09:32,960 quiero trabajar mejor con ellos, no quiero tenerlos ahí todos revueltos y lo que hago es hacer 104 00:09:32,960 --> 00:09:37,279 una tabla, ¿vale? Como podría ser esta que hay aquí 105 00:09:37,279 --> 00:09:40,580 a la izquierda. He preguntado a la gente qué colores les gustan 106 00:09:40,580 --> 00:09:44,879 y he representado aquí con los distintos colores las respuestas que me han dado. 107 00:09:45,299 --> 00:09:49,200 Claro, así es un poco lioso de ver. Imaginamos en una intención de voto 108 00:09:49,200 --> 00:09:53,340 que decíamos, pues si yo empiezo a decir, PP, PSOE, 109 00:09:53,419 --> 00:09:57,299 PP, PSOE, Podemos, no sé qué, así todos revueltos 110 00:09:57,299 --> 00:10:00,840 y he preguntado a dos mil personas, pues me vuelvo loco. Al final no me entero de qué 111 00:10:00,840 --> 00:10:04,580 me están diciendo, si yo cojo y lo ordeno 112 00:10:04,580 --> 00:10:08,340 lo veré mejor, ¿qué haré? pues ordenar por columnas 113 00:10:08,340 --> 00:10:12,860 de la siguiente manera, en la primera columna 114 00:10:12,860 --> 00:10:16,779 pondré el valor de 115 00:10:16,779 --> 00:10:20,179 esa variable estadística que estaba estudiando 116 00:10:20,179 --> 00:10:24,539 en este caso los colores y digo 117 00:10:24,539 --> 00:10:29,039 ¿qué resultados posibles puede tener esa variable estadística del color? 118 00:10:29,039 --> 00:10:39,759 Pues puede ser rojo, verde, azul, amarillo o turquesa, ¿vale? O sea que ya he hecho una clasificación de las posibles respuestas. 119 00:10:40,419 --> 00:10:52,580 Ahora voy a ver cuántas personas me contestaron a cada una de esas respuestas y lo que hago es lo que se llama una segunda columna 120 00:10:52,580 --> 00:10:59,080 que sería la frecuencia absoluta, que es el número de veces que ha aparecido un dato concreto. 121 00:11:00,139 --> 00:11:05,200 Y fijaos, he puesto aquí un subíndice en la XI y en la FI y luego en esta otra eje, 122 00:11:05,659 --> 00:11:11,519 y ese subíndice es para saber en qué fila de esa tabla que estoy haciendo voy a estar. 123 00:11:12,000 --> 00:11:16,919 Si estoy en la fila 1, el X1, que era el rojo, ¿qué respuestas me han dado rojo? 124 00:11:16,919 --> 00:11:20,080 ¿Qué respuestas son las que van con esa fila 1? 125 00:11:20,080 --> 00:11:36,820 Pues digo, ah, pues rojo me contestaron 1, 2, 3, 4, 5 y 6. Pues la frecuencia absoluta del rojo es 6. La del verde, pues 1, 2, 3, 4, 5, 6, 7, 8 personas me contestó que el verde. Así sucesivamente. 126 00:11:37,740 --> 00:11:45,500 Si yo he hecho bien el recuento, la suma de esas frecuencias absolutas me tiene que dar el número total de datos. 127 00:11:45,500 --> 00:11:53,659 Este número total de datos, ya para lo sucesivo, le vamos a llamar n, ¿vale? 128 00:11:53,860 --> 00:12:02,360 O sea, que esa n, a ver, esa n va a ser como la suma de las fi. 129 00:12:02,360 --> 00:12:06,220 donde en matemáticas la suma se pone así 130 00:12:06,220 --> 00:12:11,019 con una E rara, ¿vale? Sumatorio de las frecuencias 131 00:12:11,019 --> 00:12:14,480 Bueno, pues ya he hecho 132 00:12:14,480 --> 00:12:18,679 la suma de las personas que me han respondido 133 00:12:18,679 --> 00:12:22,419 cada una de las posibles respuestas. ¿Qué sería la siguiente 134 00:12:22,419 --> 00:12:25,240 columna? Pues la frecuencia relativa 135 00:12:25,240 --> 00:12:29,960 La frecuencia relativa, que nosotros la vamos a 136 00:12:29,960 --> 00:12:33,559 nombrar de esta manera aquí en adelante como hi 137 00:12:33,559 --> 00:12:38,000 va a ser dividir 138 00:12:38,000 --> 00:12:41,899 la frecuencia absoluta entre el número total de datos 139 00:12:41,899 --> 00:12:45,360 esta es mi frecuencia relativa 140 00:12:45,360 --> 00:12:50,059 lo que quiero ver con esta frecuencia relativa es la proporción 141 00:12:50,059 --> 00:12:53,500 con respecto al total de personas 142 00:12:53,500 --> 00:12:57,899 de gente que me ha respondido una de las 143 00:12:57,899 --> 00:13:07,019 respuestas en concreto. Aquí en el rojo estaría diciendo que son 6 de 30. Diríamos que la 144 00:13:07,019 --> 00:13:15,899 frecuencia es 6 de 30, que eso me da 0,20. En el verde sería 8 de 30, que eso me da 145 00:13:15,899 --> 00:13:22,779 0,21. Cuando hago la tabla de frecuencias, puedo dejarlo puesto en forma de fracción. 146 00:13:22,779 --> 00:13:26,779 solo si quisiésemos ponerlo en forma de porcentaje 147 00:13:26,779 --> 00:13:30,480 es cuando hacemos la división, ¿por qué? porque si yo lo quiero poner 148 00:13:30,480 --> 00:13:34,159 en forma de porcentaje, lo vamos a poner aquí al final, sería 149 00:13:34,159 --> 00:13:38,580 coger este número decimal y multiplicarlo por 10 150 00:13:38,580 --> 00:13:42,399 o digo por 10, por 100, pero 20 por 100 151 00:13:42,399 --> 00:13:46,279 pues resulta que ha sido 152 00:13:46,279 --> 00:13:50,820 un 20% de la gente la que me ha respondido 153 00:13:50,820 --> 00:14:03,919 que le gustaba el color rojo. En la del verde, pues habrá sido un 21%, en el azul un 15%, un 33% y un 11%. 154 00:14:03,919 --> 00:14:12,179 Esa sería la única forma, o digamos, el único interés por el que yo querría ponerlo en forma decimal. 155 00:14:12,179 --> 00:14:22,259 Si no, con que lo pongáis en forma de fracción nos basta y nos sobra porque para ver la proporción sobre el total nos vale también como fracción. 156 00:14:22,259 --> 00:14:41,480 Bueno, y por último llamaremos frecuencia absoluta acumulada a el valor de la suma de las frecuencias que tengo absolutas del valor en el que estoy y lo que tengo por encima. 157 00:14:42,179 --> 00:15:00,179 ¿Vale? Y aquí lo que hago cuando hago la frecuencia absoluta acumulada, que aquí se les ha ido la pinza, esto está mal, esto está mal, todos estos valores, porque sería, ¿cuánta gente me ha respondido rojo? 158 00:15:00,179 --> 00:15:06,899 6 personas. Y ahora diríamos, ¿cuánta gente me ha respondido verde o lo que hay por encima del verde, que es el rojo? 159 00:15:07,340 --> 00:15:17,200 Pues diríamos 6 más 8, 14 personas. ¿Cuánta gente me ha respondido azul o los colores que están por encima del azul, verde o rojo? 160 00:15:17,440 --> 00:15:26,919 Pues 14 más 7, 21. O sea que lo que estoy haciendo es, fijaos, lo siguiente, aunque quedo aquí un poquito engorrinado, 161 00:15:26,919 --> 00:15:30,080 es el primer dato le pongo como está y a partir de ahí es 162 00:15:30,080 --> 00:15:34,080 sumar el siguiente y poner el resultado 163 00:15:34,080 --> 00:15:38,899 sumar el siguiente y poner el resultado de tal forma que cuando llega al final 164 00:15:38,899 --> 00:15:41,879 la frecuencia absoluta acumulada del último dato 165 00:15:41,879 --> 00:15:45,759 tiene que ser igual al número de datos, pues fijaos aquí diríamos 166 00:15:45,759 --> 00:15:51,080 21 más 5, 26, 26 más 4 167 00:15:51,080 --> 00:15:54,379 30, bueno luego cuando en alguno de los ejercicios que hagamos 168 00:15:54,379 --> 00:16:04,259 lo haremos un poco más ordenado. Y, de la misma forma, yo podría hacer otra columna en la que tuviese, además de esta h que ponemos aquí, 169 00:16:05,019 --> 00:16:14,440 la h mayúscula i, o sea, la frecuencia relativa acumulada, donde haría exactamente lo mismo, ir haciendo la suma de estas fracciones. 170 00:16:14,440 --> 00:16:27,519 ¿Vale? Bueno, las principales que vamos a utilizar nosotros son la frecuencia absoluta y la frecuencia relativa, en los cálculos que haremos más adelante. 171 00:16:27,759 --> 00:16:45,269 Bueno, pues ahora decimos, ¿y si en lugar de con tabla de frecuencias yo quiero expresar las cosas con dibujos? ¿Qué utilizo para hacer esos dibujos? Pues vamos a verlo de más fáciles a más difíciles. 172 00:16:45,269 --> 00:16:48,529 podríamos utilizar lo que se llama un diagrama de barras 173 00:16:48,529 --> 00:16:51,190 que ¿cuándo lo voy a utilizar? 174 00:16:51,470 --> 00:16:55,110 lo voy a utilizar para variables discretas 175 00:16:55,110 --> 00:16:57,570 o para variables cualitativas 176 00:16:57,570 --> 00:17:02,710 y consiste en poner barritas 177 00:17:02,710 --> 00:17:06,289 de altura a la frecuencia relativa 178 00:17:06,289 --> 00:17:10,789 o sea que la altura de esas barritas es 179 00:17:10,789 --> 00:17:13,329 lo que valiese la frecuencia relativa 180 00:17:13,329 --> 00:17:19,190 y en la base el valor de la variable que estaba estudiando. 181 00:17:19,950 --> 00:17:25,890 Entonces, yo aquí en este caso habría puesto rojo, verde, azul 182 00:17:25,890 --> 00:17:32,049 y aquí habría puesto la altura de esa barrita en 6 183 00:17:32,049 --> 00:17:35,950 porque hubo 6 personas que habían elegido el color rojo. 184 00:17:36,529 --> 00:17:42,230 La altura de la barrita verde, 8 porque hubo 8 personas que eligieron el color verde. 185 00:17:42,230 --> 00:17:46,029 así sucesivamente, ¿vale? Entonces, tengo 186 00:17:46,029 --> 00:17:49,029 de una forma rápida y más visual 187 00:17:49,029 --> 00:17:53,990 la imagen de esas respuestas. Bueno, 188 00:17:54,529 --> 00:17:58,150 tendríamos otra cosa que va a aparecer más adelante, pero la pongo aquí en el huequito 189 00:17:58,150 --> 00:18:02,049 para que ya no vaya sonando, que es también muy rápida de dibujar 190 00:18:02,049 --> 00:18:07,519 que se llama el polígono de frecuencias. 191 00:18:11,059 --> 00:18:15,079 ¿Qué me haría el polígono de frecuencias? Pues un poco lo mismo que 192 00:18:15,079 --> 00:18:18,720 las barritas, en definitiva, nada más que en vez de hacerme las barritas 193 00:18:18,720 --> 00:18:22,420 lo que me van a hacer es ponerme 194 00:18:22,420 --> 00:18:27,299 las respuestas que me ha dicho cada uno, o sea, con un puntito 195 00:18:27,299 --> 00:18:31,019 a la altura del valor 196 00:18:31,019 --> 00:18:34,660 de la respuesta y luego me cogen y me unen esos puntitos 197 00:18:34,660 --> 00:18:38,740 con rayitas 198 00:18:38,740 --> 00:18:42,279 y me queda una cosa así 199 00:18:42,279 --> 00:18:57,900 Entonces, esto sería el polígono de frecuencias. En lugar de hacer barritas, lo que hago es unir los puntos de las alturas a las que había llegado cada una de esas barritas. 200 00:18:57,900 --> 00:19:21,480 O, por último, la última forma de representar estas variables cuantitativas discretas o variables cualitativas también sería hacer un diagrama de sectores o de quesitos que llama alguna gente o de pasteles que llaman en otros sitios, en otros países. 201 00:19:21,480 --> 00:19:37,740 ¿En qué consiste este diagrama de sectores? Pues en coger un círculo y dibujar quesitos en proporción a los datos que quieren representar, utilizando la siguiente regla de tres. 202 00:19:37,740 --> 00:19:51,740 Y es decir, si el círculo entero son 360 grados, si nosotros girásemos, ¿a cuántos grados equivale cada uno de los colores que yo estoy estudiando? 203 00:19:52,400 --> 00:20:01,400 Pues lo que tengo que hacer es decir, bueno, pues si el círculo entero son 300 grados, 360 grados, perdón, 204 00:20:02,059 --> 00:20:06,980 y el azul, por ejemplo, porque viene el orden que me ponen aquí, 205 00:20:06,980 --> 00:20:12,000 fueron cuatro personas de entre 30 que había en total las que me la eligieron, 206 00:20:12,599 --> 00:20:15,140 pues ¿a cuántos grados correspondería? 207 00:20:15,980 --> 00:20:21,119 Pues lo que estoy haciendo es esto, la frecuencia dividida entre el número total de datos, 208 00:20:21,119 --> 00:20:40,779 O sea, que en realidad lo que me están diciendo aquí es la frecuencia relativa igual a los grados que tiene el sector partido del total de grados que tiene ese círculo. 209 00:20:40,779 --> 00:20:54,539 En realidad, los grados de mi sector, que es la variable que yo quiero estudiar, o sea, mi X saldrá de multiplicar ese 360 por mi frecuencia relativa. 210 00:20:54,539 --> 00:20:58,839 ya está, o si queréis hacer la cuenta 211 00:20:58,839 --> 00:21:01,819 pensarla de otra manera, digo pues 360 212 00:21:01,819 --> 00:21:06,460 entre el número total de datos que tuviese la encuesta 213 00:21:06,460 --> 00:21:11,099 de personas a las que se había encuestado multiplicado por la frecuencia 214 00:21:11,099 --> 00:21:13,559 absoluta, también me valdría 215 00:21:13,559 --> 00:21:18,839 así esta cuenta la tengo ya fija y solo tengo que ir multiplicando el resultado 216 00:21:18,839 --> 00:21:22,039 de esa cuenta por mi frecuencia absoluta 217 00:21:22,039 --> 00:21:26,980 sea como sea, me va dando cuántos grados tengo yo que coger 218 00:21:26,980 --> 00:21:31,160 de ese círculo o esa circunferencia, pues 48 grados 219 00:21:31,160 --> 00:21:35,359 cogería con mi transportador y mediría 48 grados 220 00:21:35,359 --> 00:21:38,920 donde acaba este sector, empieza al amarillo 221 00:21:38,920 --> 00:21:42,400 mediría 60 grados con mi transportador 222 00:21:42,400 --> 00:21:45,779 luego mediría los 84 del azul 223 00:21:45,779 --> 00:21:50,500 los 96 del verde y por último los 72 224 00:21:50,500 --> 00:21:55,019 del rojo así hasta que complete los 360 grados 225 00:21:55,019 --> 00:21:57,839 que tiene ese círculo 226 00:21:57,839 --> 00:22:03,140 sería como ir cortando una tarta en proporción 227 00:22:03,140 --> 00:22:06,319 a la gente que ha elegido 228 00:22:06,319 --> 00:22:08,160 cada uno de los colores 229 00:22:08,160 --> 00:22:15,220 vamos a seguir un poquito, luego en un ejercicio lo hacemos todo 230 00:22:15,220 --> 00:22:22,660 aquí tenéis ejercicios resueltos para que veáis como 231 00:22:22,660 --> 00:22:26,680 hacerlos, ¿vale? Tenéis 232 00:22:26,680 --> 00:22:30,539 también en el aula virtual una hojita de ejercicios 233 00:22:30,539 --> 00:22:33,960 que tienen luego toda la solución al final 234 00:22:33,960 --> 00:22:38,160 la que pone ejercicios de estadística, esa 235 00:22:38,160 --> 00:22:42,019 tiene, o actividades de estadística, tiene todos los ejercicios resueltos 236 00:22:42,019 --> 00:22:46,259 los que nosotros vamos a probar son los que están aquí en este tema, que también tenemos esa parte 237 00:22:46,259 --> 00:22:50,019 de ejercicios resueltos, tenemos una parte de ejercicios propuestos 238 00:22:50,019 --> 00:22:53,420 y que me dan las soluciones finales al final del tema 239 00:22:53,420 --> 00:22:56,200 tenemos como una especie de simulacro de examen 240 00:22:56,200 --> 00:22:58,380 bueno, como tenemos poquito tiempo 241 00:22:58,380 --> 00:23:00,279 os he querido ponerlo de otra manera 242 00:23:00,279 --> 00:23:03,480 en la que por vuestra cuenta también lo pudieseis estudiar 243 00:23:03,480 --> 00:23:07,240 bueno, hemos visto esas variables cuantitativas 244 00:23:07,240 --> 00:23:11,559 y esas variables, perdón, cuantitativas discretas 245 00:23:11,559 --> 00:23:13,279 y esas variables cualitativas 246 00:23:13,279 --> 00:23:16,579 nos quedaría ver qué pasa cuando yo quiera estudiar 247 00:23:16,579 --> 00:23:20,000 una variable cuantitativa continua 248 00:23:20,000 --> 00:23:22,619 acordaos que esa cuantitativa continua 249 00:23:22,619 --> 00:23:25,619 podría tomar todos los valores que hubiese entre medias 250 00:23:25,619 --> 00:23:28,859 de un intervalo, ¿cuándo vamos a estar en ese caso? 251 00:23:29,880 --> 00:23:31,220 pues hemos dicho antes que cuando 252 00:23:31,220 --> 00:23:34,700 puedan aparecer decimales en las soluciones 253 00:23:34,700 --> 00:23:37,380 numéricas de las respuestas 254 00:23:37,380 --> 00:23:40,940 o tenga tantísimos valores distintos 255 00:23:40,940 --> 00:23:42,900 que si los quiero mirar uno a uno 256 00:23:42,900 --> 00:23:45,019 me sale una tabla gigante 257 00:23:45,019 --> 00:24:05,220 Entonces, ¿qué hago en esos casos? Pues agrupar, agrupar por trocitos de intervalos de números, ¿vale? O sea, cuando el número de datos, como os digo aquí, distintos es tan grande que no le puedo controlar en una tabla, pues podemos hacer intervalos o clases que se llaman también. 258 00:24:05,220 --> 00:24:08,640 eso sí, cada intervalo tengo que asegurarme 259 00:24:08,640 --> 00:24:11,180 que sea igual de largo, o sea, que tenga la misma 260 00:24:11,180 --> 00:24:13,720 amplitud y que re 261 00:24:13,720 --> 00:24:16,799 que haya como mínimo cuatro intervalos en mi tabla 262 00:24:16,799 --> 00:24:20,140 porque si los agrupo todos en dos cacitas pues resulta 263 00:24:20,140 --> 00:24:23,119 que no me entero de nada de lo que me están queriendo 264 00:24:23,119 --> 00:24:25,500 decir en esa estadística, entonces por ejemplo 265 00:24:25,500 --> 00:24:28,380 imaginamos que me están hablando 266 00:24:28,380 --> 00:24:32,380 de las alturas de un grupo de personas 267 00:24:32,380 --> 00:24:35,200 ¿vale? yo podría agrupar 268 00:24:35,200 --> 00:24:43,119 llamarlos bajos, medios y altos y pensarlos como una variable cualitativa, pero claro, es un poco relativo. 269 00:24:43,779 --> 00:24:48,559 ¿Quiénes son los bajos, quiénes son los medios y quiénes son los altos? Se queda un poco ahí raro. 270 00:24:49,180 --> 00:24:55,539 Y si yo tengo que decidir con estaturas concretas quiénes son cada uno, pues ya cojo y los clasifico en mi tabla. 271 00:24:55,859 --> 00:25:08,079 Digo, voy a pensar, por ejemplo, haciendo cajitas que vayan de 10 en 10 centímetros y les clasifico así. 272 00:25:08,819 --> 00:25:14,299 O de 100 en 100 milímetros, o yo qué sé, dependiendo de cómo me hubiesen dado los valores. 273 00:25:15,980 --> 00:25:20,420 Y lo que haré luego es ir echando gente en esas cajitas que me han salido. 274 00:25:20,420 --> 00:25:27,079 Si he decidido que los bajos eran los que medían entre 1 metro y 1,20, 275 00:25:27,259 --> 00:25:31,440 pues toda la gente que mida entre 1 metro y 1,20 la contaría dentro de esa cajita. 276 00:25:31,960 --> 00:25:36,019 Si los medianos eran los de entre 1,20 y 1,40, 277 00:25:36,019 --> 00:25:39,259 pues todos los que midan entre 1,20 y 1,40 los metería en esa cajita 278 00:25:39,259 --> 00:25:42,279 y si los altos hemos dicho que eran entre 1,40 y 1,60 279 00:25:42,279 --> 00:25:46,799 pues todos los que midan entre 1,40 y 1,60 los metería en esa cajita 280 00:25:46,799 --> 00:25:52,220 cuando yo tengo todas esas cajitas ya llenas con las personas que corresponde a cada una 281 00:25:52,220 --> 00:25:55,220 tengo que elegir un representante de cada cajita 282 00:25:55,220 --> 00:25:56,960 que será con quien haga las cuentas 283 00:25:56,960 --> 00:26:01,079 que es a quien se le llamará marca de clase 284 00:26:01,079 --> 00:26:04,599 es como si fuese el presidente de la comunidad de esa cajita 285 00:26:04,599 --> 00:26:07,799 ¿Quién se va a coger normalmente como representante? 286 00:26:08,180 --> 00:26:11,119 Pues justo al valor intermedio de cada una de las cajas 287 00:26:11,119 --> 00:26:15,240 Si la primera iba de 1 metro a 1,20 288 00:26:15,240 --> 00:26:18,160 Pues yo cojo a 1,10 289 00:26:18,160 --> 00:26:20,980 La segunda caja que iba de 1,20 a 1,40 290 00:26:20,980 --> 00:26:23,599 Pues cogeré como representante al 1,30 291 00:26:23,599 --> 00:26:25,859 Y la que iba de 1,40 a 1,60 292 00:26:25,859 --> 00:26:28,660 Cogeré como representante al 1,50 293 00:26:28,660 --> 00:26:29,799 Que está justo entre media 294 00:26:29,799 --> 00:26:32,200 Y he hecho una agrupación 295 00:26:32,200 --> 00:26:36,339 en tres intervalos de toda la gente y los voy contando 296 00:26:36,339 --> 00:26:38,839 ¿vale? luego lo veremos en ejercicio 297 00:26:38,839 --> 00:26:43,019 ahí tenéis los ejemplos para verlos, lo que quería ver ahora es 298 00:26:43,019 --> 00:26:47,440 cómo representaríamos luego esta variable 299 00:26:47,440 --> 00:26:51,500 cuantitativa continua si la gente la ha ido metiendo en cajas 300 00:26:51,500 --> 00:26:54,900 ya no puedo utilizar diagrama de barras como hacíamos antes 301 00:26:54,900 --> 00:26:59,160 porque no tengo valores puntuales para ir contando cuánto salen de valor 302 00:26:59,160 --> 00:27:03,000 cada valor, sino que me están saliendo grupos de personas que son distintas 303 00:27:03,000 --> 00:27:06,400 pero que yo los he clasificado dentro de la misma caja 304 00:27:06,400 --> 00:27:10,839 pues lo que haré es lo que se llama un histograma, es decir, bueno 305 00:27:10,839 --> 00:27:15,259 pues en el eje X, donde antes poníamos esos valores puntuales 306 00:27:15,259 --> 00:27:19,079 o esas cualidades, ahora lo que pongo es los intervalos que yo me he creado 307 00:27:19,079 --> 00:27:22,700 ¿vale? fijaos, estamos haciendo 308 00:27:22,700 --> 00:27:27,180 este de aquí arriba, que me han dicho, clasifico a la gente del 0 al 200 309 00:27:27,180 --> 00:27:31,779 de 200 a 400, de 400 a 600, 600 a 800, 800 a 1000 310 00:27:31,779 --> 00:27:35,460 pues la base de cada barrita de las que aparecen aquí ahora 311 00:27:35,460 --> 00:27:40,339 son esos 200 centímetros 312 00:27:40,339 --> 00:27:44,359 por así decirlo, 0, empieza en 0 la barrita 313 00:27:44,359 --> 00:27:48,460 y acaba en 200, pero la segunda empezaba en 200 y se acababa en 400 314 00:27:48,460 --> 00:27:52,079 la tercera empezaba en 400 y acababa en 600, o sea que 315 00:27:52,079 --> 00:27:56,599 unas barritas van pegadas a otras, es como el diagrama de barras 316 00:27:56,599 --> 00:28:00,420 anterior pero ahora las barritas van pegadas, no hay hueco entre ellas 317 00:28:00,420 --> 00:28:04,579 y tengo que ir 318 00:28:04,579 --> 00:28:08,680 poniendo en vez de esos valores de los intervalos lo que voy poniendo es el valor de su representante 319 00:28:08,680 --> 00:28:12,740 pues el representante de esta era el 100, el representante de esta 320 00:28:12,740 --> 00:28:16,839 era el 300, el representante de esta era el 500, el de esta 321 00:28:16,839 --> 00:28:20,200 el 700, el de esta el 900 322 00:28:20,200 --> 00:28:25,200 que acordaos que era justo el que estaba en el medio del intervalo 323 00:28:25,200 --> 00:28:45,279 Lo que hago es contar cuánta gente ha caído en cada caja, el recuento me lo están diciendo aquí, esta sería la frecuencia absoluta de la gente que ha ido cayendo en cada cajita y luego esas barras ahora más gordas las pongo de la altura de esas frecuencias absolutas. 324 00:28:45,279 --> 00:28:48,079 Igual que hacíamos en el diagrama de barras. 325 00:28:49,200 --> 00:28:52,319 Diferencia, que ahora las barritas van pegadas unas a otras. 326 00:28:53,099 --> 00:29:03,019 Si yo quisiese hacer el polígono de frecuencias de esta variable cuantitativa continua, pues nada, no pasa nada. 327 00:29:03,240 --> 00:29:04,299 Hago la misma historia. 328 00:29:06,220 --> 00:29:08,400 Llego, ahí va, ¿por qué no me deja el borrar? 329 00:29:08,400 --> 00:29:26,880 Pues llego y una vez que ya tenga hechas las barras del histograma, pues cojo y uno esos puntos medios que correspondían a su representante de clase mediante semirrectas y me saldrá mi polígono de frecuencias que decíamos antes. 330 00:29:26,880 --> 00:29:41,200 O sea, igual que antes con el diagrama de barras, pero ahora la diferencia es que las barras son gordas y el ancho de la barra me define la longitud que yo le haya dado al intervalo. 331 00:29:41,200 --> 00:29:44,019 aquí lo tenemos lo que estábamos diciendo antes 332 00:29:44,019 --> 00:29:46,420 me vale como polígono de frecuencias 333 00:29:46,420 --> 00:29:48,400 el punto alto de las barritas 334 00:29:48,400 --> 00:29:49,559 en el diagrama de barras 335 00:29:49,559 --> 00:29:52,240 o juntar lo más alto 336 00:29:52,240 --> 00:29:53,859 de esos puntos medios 337 00:29:53,859 --> 00:29:56,039 cuando estoy en el histograma 338 00:29:56,039 --> 00:30:01,170 bueno, pues aquí otra vez ejercicios resueltos 339 00:30:01,170 --> 00:30:02,910 que podéis ver los gráficos 340 00:30:02,910 --> 00:30:04,369 que he ido haciendo de cada uno 341 00:30:04,369 --> 00:30:06,690 y 342 00:30:06,690 --> 00:30:09,309 vamos a ver 343 00:30:09,309 --> 00:30:11,190 que serían las medidas 344 00:30:11,190 --> 00:30:12,910 de centralización por lo menos 345 00:30:12,910 --> 00:30:18,029 cómo se calculan para el próximo día poder hacer ejercicios enteros 346 00:30:18,029 --> 00:30:24,029 con toda esta parte de tabla de frecuencias, representaciones 347 00:30:24,029 --> 00:30:27,910 y medidas de centralización que es como mínimo lo que vamos a ver. 348 00:30:28,349 --> 00:30:30,609 No me va a dar tiempo a que veamos más. 349 00:30:32,170 --> 00:30:35,029 Los que venís de nivel 1, pues esto lo visteis el año pasado 350 00:30:35,029 --> 00:30:41,509 y los que sois de nivel 1 pendiente y estáis viendo las clases de nivel 1 351 00:30:41,509 --> 00:30:45,230 pues esto lo hemos visto también hasta este punto en nivel 1 352 00:30:45,230 --> 00:30:49,430 ¿vale? con otros apuntes pero también igual 353 00:30:49,430 --> 00:30:53,150 bueno, ¿quienes serían las medidas de 354 00:30:53,150 --> 00:30:57,250 centralización y posición? pues hemos dicho que eran la media 355 00:30:57,250 --> 00:31:00,230 la mediana, la moda, los cuartiles 356 00:31:00,230 --> 00:31:05,150 cuando hacíamos la introducción, vamos a ver que es cada una 357 00:31:05,150 --> 00:31:08,910 de esas cosas, pues la media 358 00:31:08,910 --> 00:31:11,750 pues todos sabemos calcular la media de las notas 359 00:31:11,750 --> 00:31:13,150 que es sumar todas 360 00:31:13,150 --> 00:31:15,289 las notas que he sacado y dividirlo 361 00:31:15,289 --> 00:31:16,369 entre el número de asignaturas 362 00:31:16,369 --> 00:31:19,390 pues para calcular la media 363 00:31:19,390 --> 00:31:21,130 si son pocas datos 364 00:31:21,130 --> 00:31:23,549 lo que hacemos es sumarlos y dividirlos entre el número total 365 00:31:23,549 --> 00:31:25,150 de datos, pero y amigo 366 00:31:25,150 --> 00:31:26,930 y si tengo mogollón de datos 367 00:31:26,930 --> 00:31:29,089 porque me ha salido una tabla de frecuencias enorme 368 00:31:29,089 --> 00:31:31,190 por ejemplo aquí dice, personas que hayan 369 00:31:31,190 --> 00:31:33,269 sacado un 5, 4, personas que 370 00:31:33,269 --> 00:31:34,490 sacaron un 10, 6 371 00:31:34,490 --> 00:31:37,529 me saldría un montón de números 372 00:31:37,529 --> 00:31:38,309 para sumar 373 00:31:38,309 --> 00:31:40,369 que me es más fácil 374 00:31:40,369 --> 00:31:42,650 pues decir, bueno, pues 375 00:31:42,650 --> 00:31:44,569 la forma de 376 00:31:44,569 --> 00:31:46,410 contar yo la suma de 377 00:31:46,410 --> 00:31:48,329 toda esa gente que sacaron 5 378 00:31:48,329 --> 00:31:50,509 es multiplicar 5 379 00:31:50,509 --> 00:31:52,470 por 4, todos esos que sacaron 380 00:31:52,470 --> 00:31:53,930 10, pues 10 por 6 381 00:31:53,930 --> 00:31:56,309 la que me hago en mi tabla de frecuencias 382 00:31:56,309 --> 00:31:58,730 una columna en la que multiplique 383 00:31:58,730 --> 00:32:00,210 la variable 384 00:32:00,210 --> 00:32:02,529 por la frecuencia absoluta 385 00:32:02,529 --> 00:32:03,769 que ha tenido esa variable 386 00:32:03,769 --> 00:32:05,789 si yo ahora cojo 387 00:32:05,789 --> 00:32:08,190 y sumo 388 00:32:08,190 --> 00:32:12,230 todos los datos que tengo en esta nueva 389 00:32:12,230 --> 00:32:16,170 columna que me he creado, me estaría dando 390 00:32:16,170 --> 00:32:20,470 la suma de todas las 391 00:32:20,470 --> 00:32:24,730 respuestas, si a esa suma le divido 392 00:32:24,730 --> 00:32:28,569 entre el número total de datos, que era la n 393 00:32:28,569 --> 00:32:32,569 que es 36, ya tengo mi media aritmética 394 00:32:33,170 --> 00:32:36,730 o sea que la media aritmética 395 00:32:36,730 --> 00:32:48,410 es multiplicar cada resultado de la variable por su frecuencia absoluta, sumar todos esos resultados 396 00:32:48,410 --> 00:32:55,809 y dividir por el número total de datos. Acordaos que suma era esa E rara, o sea que la formulita 397 00:32:55,809 --> 00:33:01,730 que me tengo que aprender de mi media aritmética es esa. La media aritmética la representamos 398 00:33:01,730 --> 00:33:11,920 una X con una barrita encima. Otro parámetro de centralización es la moda. Todos sabemos 399 00:33:11,920 --> 00:33:18,140 de nuestro día a día que decimos que algo está de moda cuando se repite mucho. Entonces 400 00:33:18,140 --> 00:33:25,039 vamos a definir la moda como el valor más repetido. ¿Y cómo veo yo quién es el valor 401 00:33:25,039 --> 00:33:28,619 más repetido? Pues muy simple, buscando 402 00:33:28,619 --> 00:33:33,200 aquel que tenga la frecuencia absoluta 403 00:33:33,200 --> 00:33:37,259 más alta, por ejemplo, aquí decimos que el 5 404 00:33:37,259 --> 00:33:41,079 se ha repetido 8 veces y que el 20 se ha repetido 8 veces 405 00:33:41,079 --> 00:33:45,500 pues la moda serían ese 5 y ese 20 406 00:33:45,500 --> 00:33:48,779 porque son los que se me han repetido más veces 407 00:33:48,779 --> 00:33:53,140 ¿vale? Sin más, aquí en este 408 00:33:53,140 --> 00:34:02,200 segundo ejemplo, los más repetidos han sido el 100, perdón, el más repetido ha sido 409 00:34:02,200 --> 00:34:10,610 el 600 que se ha repetido nueve veces, por la moda va a ser 600. Pues entonces, lo que 410 00:34:10,610 --> 00:34:16,530 me dice la definición, la moda es el valor de la variable que más se ha repetido, o 411 00:34:16,530 --> 00:34:21,050 El que tiene la frecuencia absoluta más grande, más alta. 412 00:34:22,650 --> 00:34:26,659 Ay, perdón, se me escapó. 413 00:34:31,449 --> 00:34:35,329 Y ahora vamos a ver la última, vamos a ver solo la mediana. 414 00:34:35,469 --> 00:34:39,090 Los cuartiles no, con que tengamos la mediana controlada nos vale, 415 00:34:39,289 --> 00:34:42,889 porque si no, no nos va a dar tiempo luego el próximo día hacer ejercicios con todo. 416 00:34:44,190 --> 00:34:47,769 Aunque os voy a explicar lo que son los cuartiles, luego se los voy a pedir hasta la mediana. 417 00:34:48,610 --> 00:34:50,210 ¿Qué sería la mediana? 418 00:34:51,110 --> 00:35:02,070 Pues el valor que ocupa la posición central cuando yo tengo todos los datos ordenados de menor a mayor juntitos. 419 00:35:02,070 --> 00:35:10,889 O sea, si yo pienso en una carretera, la mediana es el muro en una autopista, es el muro que divide dos carriles para un lado y dos carriles para otro. 420 00:35:11,369 --> 00:35:18,329 O en una carretera normal sería la raya continua o discontinua que tengo en el medio que me divide para un lado los mismos metros de carretera que para otro. 421 00:35:18,329 --> 00:35:35,429 Eso es la mediana. Entonces, cuando yo tengo mis datos ordenados, 1, 2, 3, 4, 5, y sé cuántas veces ha repetido cada uno por su frecuencia absoluta, ¿cómo podré calcular mi mediana? 422 00:35:35,429 --> 00:35:41,909 viendo dónde estaría ese dato intermedio que estamos diciendo. 423 00:35:41,909 --> 00:35:43,789 Aquí en total, ¿cuántos datos tendría? 424 00:35:43,889 --> 00:35:52,230 10, 20, 37, 49, 59, 66 datos. 425 00:35:53,130 --> 00:35:57,389 Bueno, pues entonces, si tengo 66 datos, 426 00:35:58,170 --> 00:36:00,630 ¿cuál será el que está justo en el medio? 427 00:36:00,630 --> 00:36:06,210 pues el dato que esté en la posición 33 428 00:36:06,210 --> 00:36:07,610 ¿vale? 429 00:36:09,409 --> 00:36:12,349 o entre la 33 y la 34 430 00:36:12,349 --> 00:36:13,590 si es que hubiese 431 00:36:13,590 --> 00:36:16,809 cuando tenemos un número impar de datos 432 00:36:16,809 --> 00:36:18,489 justo busco el del medio 433 00:36:18,489 --> 00:36:20,750 cuando tengo un número par de datos como este caso 434 00:36:20,750 --> 00:36:25,030 lo que hago es la media de los dos datos que están en el medio 435 00:36:25,030 --> 00:36:27,610 estaría buscando como posición 436 00:36:27,610 --> 00:36:31,130 ese 33 más 34 437 00:36:31,130 --> 00:36:34,690 dividido entre 2, el dato 35 y medio 438 00:36:34,690 --> 00:36:39,389 ¿qué hago ahora para encontrarlo? bueno, pues si yo miro en la frecuencia absoluta acumulada 439 00:36:39,389 --> 00:36:43,269 digo, hasta aquí tengo 10 datos, hasta aquí 20 440 00:36:43,269 --> 00:36:47,190 y luego hasta aquí tenía 37, ¿dónde va a estar ese dato 441 00:36:47,190 --> 00:36:51,070 33 y medio? pues en este bloque, que era 442 00:36:51,070 --> 00:36:54,949 el que correspondía al 3 443 00:36:54,949 --> 00:36:59,849 que es contar y buscar 444 00:36:59,849 --> 00:37:02,909 qué dato está colocado en la mitad 445 00:37:02,909 --> 00:37:07,369 de esa tabla, si hablamos de cuartiles 446 00:37:07,369 --> 00:37:11,750 la historia es la misma, los cuartiles es que yo divido 447 00:37:11,750 --> 00:37:14,110 mis datos como en cuatro cajas 448 00:37:14,110 --> 00:37:19,769 cuartil 1 sería la primera pared de la primera caja 449 00:37:19,769 --> 00:37:24,050 cuartil 2 la segunda pared de la primera caja 450 00:37:24,050 --> 00:37:26,929 y cuartil 3, la pared primera de la tercera caja. 451 00:37:27,510 --> 00:37:32,510 Entonces, ¿qué tengo que hacer para localizar quién es cada uno de esos cuartiles? 452 00:37:33,130 --> 00:37:39,030 Pues ver quién es el dato que está al final de la cuarta parte de todos mis datos, 453 00:37:39,630 --> 00:37:45,469 el que está justo en la mitad y el que está en la tercera cuarta parte de mis datos. 454 00:37:45,469 --> 00:37:53,730 O sea que el cuartil 2, como es justo la mitad de mis datos, va a coincidir con la mediana 455 00:37:53,730 --> 00:37:57,309 siempre y el cuartil 1 sería donde 456 00:37:57,309 --> 00:38:01,429 estarían el 25% de los datos y cuartil 3 457 00:38:01,429 --> 00:38:05,769 donde estaría el 75% de los datos, pues puedo 458 00:38:05,769 --> 00:38:09,570 utilizar esa columna que hicimos desde 459 00:38:09,570 --> 00:38:13,769 las frecuencias absolutas acumuladas pero puesta en forma de porcentaje 460 00:38:13,769 --> 00:38:20,349 ¿vale? viendo que proporción 461 00:38:20,349 --> 00:38:24,070 de datos cae en cada fila, esto como os decía que es 462 00:38:24,070 --> 00:38:29,889 un poco más rollo, pues no os lo podréis pedir, solo que tengáis idea de esto. 463 00:38:31,929 --> 00:38:36,050 ¿Cuándo habéis visto que esto lo hayáis utilizado en vuestra vida diaria? 464 00:38:36,289 --> 00:38:42,090 Pues a lo mejor alguna vez habéis ido al médico, si tenéis niños, y os han dicho 465 00:38:42,090 --> 00:38:49,030 vamos a medirle al niño o a pesarle. Y os dicen, está en el percentil 60, está en 466 00:38:49,030 --> 00:38:55,829 el percentil 80. ¿Qué quiere decir que esté en el percentil 60, percentil 80? Pues que 467 00:38:55,829 --> 00:39:02,469 han hecho una clasificación de las estaturas o de los pesos de los niños de su misma edad 468 00:39:02,469 --> 00:39:13,730 y han visto que el 60% de los niños pesa menos, por ejemplo, de 8 kilos. El 80% de 469 00:39:13,730 --> 00:39:18,949 los niños pesa menos de 10 kilos. Entonces dicen, tu hijo está en el percentil 60 porque 470 00:39:18,949 --> 00:39:27,070 está en la caja de los niños que pesan menos de esos 6 kilos. O sea que han hecho cajitas 471 00:39:27,070 --> 00:39:35,409 como aquí en los cuartiles, pero en verde de 25 en 25, digamos, 25 en 25%, o a lo mejor 472 00:39:35,409 --> 00:39:43,590 las han hecho de 10% en 10%, o de 20% en 20%, y luego me están diciendo cuál es 473 00:39:43,590 --> 00:39:47,289 la frontera de la cajita que están queriendo utilizar 474 00:39:47,289 --> 00:39:51,110 esto a lo mejor queda un poco raro pero es que así explicado tan deprisa 475 00:39:51,110 --> 00:39:54,550 no se me ocurre mejor manera de decirlo 476 00:39:54,550 --> 00:39:58,110 porque ya viendo la hora tenemos que cortar 477 00:39:58,110 --> 00:40:03,550 bueno, esto de diagrama de caja y bigotes olvidados de ello 478 00:40:03,550 --> 00:40:07,349 vamos a ver el próximo día ejercicios de lo que hemos hecho 479 00:40:07,349 --> 00:40:11,469 de la forma de agrupar 480 00:40:11,469 --> 00:40:15,269 los datos, las medidas de dispersión ya no las vamos a ver 481 00:40:15,269 --> 00:40:19,590 porque no nos daría tiempo a hacer ejemplos y las fórmulas son más complicadas 482 00:40:19,590 --> 00:40:23,690 entonces, si podéis, echar un ojo 483 00:40:23,690 --> 00:40:27,510 a esta parte que hemos visto, para si os podéis conectar y preguntarme 484 00:40:27,510 --> 00:40:31,269 alguna duda, pues lo hagáis, o de los temas anteriores 485 00:40:31,269 --> 00:40:34,590 si no, lo que haremos será ejercicios enteros 486 00:40:34,590 --> 00:40:39,570 de principio a fin, haciendo tablas de frecuencias, diagramas 487 00:40:39,570 --> 00:40:44,510 medidas de centralización y todo para que veáis 488 00:40:44,510 --> 00:40:47,230 que es lo que os puedo pedir en estos ejercicios 489 00:40:47,230 --> 00:40:49,789 bueno pues lo dejamos aquí 490 00:40:49,789 --> 00:40:52,570 el próximo jueves rematamos 491 00:40:52,570 --> 00:40:55,769 el tema, el trimestre y el curso 492 00:40:55,769 --> 00:40:57,030 buena tarde