1 00:00:00,660 --> 00:00:05,219 Buenas tardes, esta es la clase de matemáticas del día 21 de mayo. 2 00:00:06,059 --> 00:00:09,279 Es nuestra última clase del trimestre y del curso. 3 00:00:10,519 --> 00:00:16,640 Lo primero, deciros, pues, qué es lo que va a entrar en el examen de la próxima semana, 4 00:00:17,500 --> 00:00:19,120 para que todos lo tengáis bien claro. 5 00:00:19,899 --> 00:00:24,480 Entonces, lo primero que entraba en el examen eran los sistemas de ecuaciones, 6 00:00:25,239 --> 00:00:27,559 que eran el final del tema 4. 7 00:00:27,559 --> 00:00:30,359 el tema de funciones entero 8 00:00:30,359 --> 00:00:33,619 y este tema de estadística que estamos viendo 9 00:00:33,619 --> 00:00:35,840 solo las medidas de centralización 10 00:00:35,840 --> 00:00:39,640 que es lo que terminamos de ver el otro día 11 00:00:39,640 --> 00:00:42,179 o sea, esas gráficas 12 00:00:42,179 --> 00:00:45,780 de diagrama de barras, polígono de frecuencias 13 00:00:45,780 --> 00:00:48,359 sectores, tal, tal, las tablas de frecuencias 14 00:00:48,359 --> 00:00:52,100 y luego, pues esa media, mediana, moda y cuartiles 15 00:00:52,100 --> 00:00:54,299 que vimos en la última clase 16 00:00:54,299 --> 00:00:57,280 lo que vamos a hacer hoy es hacer 17 00:00:57,280 --> 00:01:01,159 un ejercicio completo con todo lo que me podrían pedir 18 00:01:01,159 --> 00:01:04,900 de una variable aleatoria discreta 19 00:01:04,900 --> 00:01:08,900 y de una continua. Esas variables 20 00:01:08,900 --> 00:01:12,519 cuantitativas que se representaban con números 21 00:01:12,519 --> 00:01:17,200 pero que se trataban de distintas maneras, eran discretas 22 00:01:17,200 --> 00:01:20,620 o eran continuas. Entonces, vamos a ir a hacer ese ejercicio 23 00:01:20,620 --> 00:01:25,260 esos dos ejercicios para repasar todo lo que nos podrían pedir 24 00:01:25,260 --> 00:01:34,239 y que hemos hecho en este tema. Bueno, pues imaginaos que nos dan esa tabla de datos 25 00:01:34,239 --> 00:01:43,640 y me dice que primero los agrupe en 10 grupos. En 10 grupos, si os fijáis, resulta que sería 26 00:01:43,640 --> 00:01:51,120 coger todas las opciones que tienen, o sea, que sería como tratarlo como variable cuantitativa discreta. 27 00:01:51,120 --> 00:01:59,680 y luego me dice que los agrupe en cinco grupos y eso sería tratarlos como variable cuantitativa continua 28 00:01:59,680 --> 00:02:05,920 porque tendríamos que hacer intervalos. Entonces dijimos que una variable era cuantitativa discreta 29 00:02:05,920 --> 00:02:14,919 si podía tomar valores puntuales, es el caso, y cuantitativa continua cuando tenía que tomar valores en intervalos 30 00:02:14,919 --> 00:02:20,479 intervalos porque tenía decimales, tal o cual, pero vimos una salvedad, que era que 31 00:02:20,479 --> 00:02:26,560 cuando en una cuantitativa discreta había muchísimos datos, para que la tabla no se 32 00:02:26,560 --> 00:02:31,719 hiciese muy larga, podíamos agruparlos y tratarla como continua. Entonces, es lo que 33 00:02:31,719 --> 00:02:37,400 vamos a ver aquí nosotros. La diferencia a tratarlos de una manera, a tratarlos de 34 00:02:37,400 --> 00:02:54,819 Entonces, vamos a hacer las tablas de frecuencias, los diagramas de representación de cada una de esas tablas en función de tratarlos como intervalos o tratarlos como valores puntuales y luego calcularemos esas medias, medianas y modas de cada uno. 35 00:02:54,819 --> 00:03:22,680 Vamos a poner primero agrupados en 10 grupos, que sería tratarlos como variable cuantitativa discreta. 36 00:03:22,680 --> 00:03:48,330 Entonces, lo que nosotros haríamos en nuestra tabla de frecuencias, vamos a poner aquí, tabla de frecuencias, es poner el valor de la variable, los distintos resultados que me salen, 37 00:03:48,330 --> 00:03:58,270 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10 38 00:03:58,270 --> 00:04:02,710 Me han dicho que lo trate como 10 datos 39 00:04:02,710 --> 00:04:06,599 ¿Qué haríamos a continuación? 40 00:04:06,599 --> 00:04:10,960 Pues calcular las frecuencias absolutas 41 00:04:10,960 --> 00:04:17,259 Y las frecuencias absolutas era el número de veces que aparecía cada uno de los datos 42 00:04:17,259 --> 00:04:40,560 Pues vamos en orden y marcando los que vamos cogiendo. El 1 aparece una vez, dos veces, tres veces, cuatro, cinco, seis, siete, ocho, nueve, diez, diez veces aparece el 1. 43 00:04:40,560 --> 00:05:12,240 El 2, ¿cuántas veces aparece? 10 veces. El 2 aparecería 1, 2, 3, 4, 5, 6, pues la frecuencia absoluta del 2 es 6. 44 00:05:12,240 --> 00:05:16,800 El 3, fijaos que por filas es un poco más lioso 45 00:05:16,800 --> 00:05:20,860 Si yo lo miro por columnas me va a ser más fácil ir controlando los números 46 00:05:20,860 --> 00:05:24,779 Pues el 3 una vez, dos veces 47 00:05:24,779 --> 00:05:27,120 3, 4 48 00:05:27,120 --> 00:05:32,319 4 veces es las veces que aparece el 3 49 00:05:32,319 --> 00:05:34,860 Luego su frecuencia absoluta 50 00:05:34,860 --> 00:05:38,519 El 4, pues 1 51 00:05:38,519 --> 00:05:51,189 Uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve. 52 00:05:51,949 --> 00:05:54,850 Nueve veces me aparece el cuatro. 53 00:05:55,610 --> 00:06:05,610 El cinco, pues una y dos veces. 54 00:06:05,610 --> 00:06:39,750 El 6, 1, 2, 3, 4, 5 veces, el 7, 1, 2, 3, 4, 5, 6, el 8, 1, 2, 3, 4, 5 veces. 55 00:06:39,769 --> 00:07:15,220 2, 3, 3 veces, el 9, 1, 2, 3, 4, 5, 6, 7, y el 10, pues 1 y 2 veces, suma de todas las 56 00:07:15,220 --> 00:07:34,639 ¿Cuántas frecuencias? ¿Cuánto me sale? Si yo sumo todas esas frecuencias absolutas, tengo 10, 16, 20, 29, 31, 36, 42, 45, 52 y 54. 57 00:07:35,220 --> 00:07:42,819 Si yo miro el total de datos que tenía, a ver, si miramos cuántos datos teníamos, 58 00:07:42,819 --> 00:07:54,639 teníamos 1, 2, 3 y 4 filas, que tenían 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 y 12, 59 00:07:55,079 --> 00:08:04,319 por 12 por 4, 48, 49, 50, 51, 52, 53, 54, o sea que mi n, mi número de datos, 60 00:08:04,319 --> 00:08:09,199 era 54 y era la suma de las frecuencias más o menos 54. 61 00:08:09,459 --> 00:08:12,959 Con eso me doy cuenta de que tengo bien hecho el recuento. 62 00:08:14,300 --> 00:08:21,980 Bueno, decíamos frecuencia relativa, que era la proporción que había 63 00:08:21,980 --> 00:08:27,959 entre las veces que aparecía un dato y el total de datos, 64 00:08:27,959 --> 00:08:56,019 Si era ponerlo en forma de fracción, pues 10 partido de 54, 6 partido de 54, 4 partido de 54, 9 partido de 54, 2, 5, 54 agos, 6, 54 agos, 3, 54 agos, 7, 54 agos y 2, 54 agos. 65 00:08:56,019 --> 00:09:00,679 Era dividir la frecuencia absoluta entre el número total de datos 66 00:09:00,679 --> 00:09:03,759 Decíamos, frecuencia absoluta acumulada 67 00:09:03,759 --> 00:09:08,960 Era sumar las frecuencias que había en una línea y por encima de ellas 68 00:09:08,960 --> 00:09:14,559 Primero era 10 y a partir de ahí era sumar con la siguiente fila y ponerlo 69 00:09:14,559 --> 00:09:16,860 Pues 10 más 6, 16 70 00:09:16,860 --> 00:09:19,580 16 más 4, 20 71 00:09:19,580 --> 00:09:21,720 20 más 9, 29 72 00:09:21,720 --> 00:09:24,279 29 más 2, 31 73 00:09:24,279 --> 00:09:37,159 31 más 5, 36. 36 y 6, 42. 42 y 3, 45. 45 y 7, 52. 52 y 2, 54. 74 00:09:37,720 --> 00:09:44,320 Y la frecuencia relativa acumulada era coger esa frecuencia absoluta acumulada 75 00:09:44,320 --> 00:09:47,179 y irla dividiendo otra vez entre el número total de datos. 76 00:09:47,179 --> 00:10:13,620 54, 16, 54, 20, 54, 29, 54, 31 entre 54, 36 entre 54, 42 entre 54, 45 entre 54, 52 entre 54, 77 00:10:13,620 --> 00:10:16,559 y 54 entre 54 78 00:10:16,559 --> 00:10:20,080 y si me pedían el porcentaje 79 00:10:20,080 --> 00:10:23,220 ¿vale? era coger 80 00:10:23,220 --> 00:10:25,480 desde la frecuencia relativa 81 00:10:25,480 --> 00:10:28,039 ir haciendo la regla de 3 82 00:10:28,039 --> 00:10:31,559 de qué proporción hay entre 83 00:10:31,559 --> 00:10:34,720 los datos que me han salido y el total 84 00:10:34,720 --> 00:10:37,039 o sea que hacemos este primero y ya está 85 00:10:37,039 --> 00:10:41,200 digamos si 54 es un 100% 86 00:10:41,200 --> 00:10:43,480 pues los 10 que aparecían 87 00:10:43,480 --> 00:10:48,320 con valor 1, ¿cuánto eran en porcentaje? 88 00:10:48,460 --> 00:10:52,679 Pues acordaos, el producto en cruz es 10 por 100 89 00:10:52,679 --> 00:10:57,509 entre 54, 1000 90 00:10:57,509 --> 00:11:01,889 entre 54, lo que sea, ¿vale? 91 00:11:01,889 --> 00:11:05,049 Y eso lo haríamos con cada uno de 92 00:11:05,049 --> 00:11:08,610 los valores de la frecuencia relativa. 93 00:11:09,769 --> 00:11:12,210 Bueno, una vez que tenía yo mi tabla de valores, 94 00:11:12,210 --> 00:11:16,110 ¿Qué hacíamos para hacer la representación gráfica? 95 00:11:16,149 --> 00:11:19,009 Si era una variable discreta, como es este caso 96 00:11:19,009 --> 00:11:21,690 Podíamos hacer diagrama de barras 97 00:11:21,690 --> 00:11:33,389 Podíamos hacer polígono de frecuencias 98 00:11:33,389 --> 00:11:40,929 Y podíamos hacer diagrama de sectores 99 00:11:40,929 --> 00:11:54,960 ¿Cuál era cada uno? 100 00:11:56,299 --> 00:11:58,980 Diagrama de barras era 101 00:11:58,980 --> 00:12:17,679 que poníamos en el eje X la variable, en este caso, 1, 2, 3, 4, 5, 6, 7, 8, 9 y el 10. 102 00:12:18,740 --> 00:12:26,059 Y en el eje Y poníamos las frecuencias absolutas, o sea, las veces que haya aparecido cada uno de ellos. 103 00:12:26,059 --> 00:12:45,100 Pues otra vez marcamos de uno a diez, si queréis, pues uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve y el último el diez. 104 00:12:45,100 --> 00:12:48,620 este era un 9, perdón 105 00:12:48,620 --> 00:12:52,860 pues era coger y hacer una barrita 106 00:12:52,860 --> 00:12:56,980 de altura, lo que me dijese la frecuencia 107 00:12:56,980 --> 00:13:00,659 encima de cada uno de los datos, pues el 1 que tenía 108 00:13:00,659 --> 00:13:03,440 frecuencia 10, pues hacíamos una barrita 109 00:13:03,440 --> 00:13:09,039 y en hacer las rectas, una tableta esta es un poco chusurrío 110 00:13:09,039 --> 00:13:11,860 pero bueno, en el 2 111 00:13:11,860 --> 00:13:22,929 es un poco complicado hacer líneas rectas 112 00:13:22,929 --> 00:13:25,289 con el lápiz este 113 00:13:25,289 --> 00:13:30,409 este 10, este altura 6 114 00:13:30,409 --> 00:13:33,590 el 3 tenía altura 4 115 00:13:33,590 --> 00:13:37,470 el 4 tenía altura 9 116 00:13:37,470 --> 00:13:42,190 el 5 tenía altura 2 solo 117 00:13:42,190 --> 00:13:45,110 el 6 tenía altura 5 118 00:13:45,110 --> 00:13:48,450 bueno, el 7 altura 6 119 00:13:48,450 --> 00:13:53,149 el 8 altura 3 120 00:13:53,149 --> 00:13:56,610 y el 9 altura 7 121 00:13:56,610 --> 00:14:00,919 y el 10 altura 2 122 00:14:00,919 --> 00:14:03,840 bueno, pues acordaos que era hacer 123 00:14:03,840 --> 00:14:07,240 barritas de altura, lo que me dijese la frecuencia 124 00:14:07,240 --> 00:14:10,580 y sobre el punto 125 00:14:10,580 --> 00:14:12,519 que me marcaba la x 126 00:14:12,519 --> 00:14:30,080 ¿Qué era el polígono de frecuencias? Pues el polígono de frecuencias dijimos que era hacer lo mismo que hemos hecho, pero quedándome solo con los puntitos más altos, sin hacer la barrita. 127 00:14:30,080 --> 00:14:40,879 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10. 128 00:14:41,620 --> 00:14:55,179 Aquí tengo 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10. 129 00:14:55,179 --> 00:14:57,799 aquí ponemos la frecuencia 130 00:14:57,799 --> 00:15:01,399 y aquí el valor de la variable 131 00:15:01,399 --> 00:15:05,620 pero ahora solo marcamos el puntito más alto 132 00:15:05,620 --> 00:15:09,539 entonces el 1 que tenía de frecuencia 10 133 00:15:09,539 --> 00:15:14,000 marcó un puntito ahí, el 2 tenía frecuencia 6 134 00:15:14,000 --> 00:15:17,059 marcamos un puntito ahí, el 3 135 00:15:17,059 --> 00:15:21,840 frecuencia 4, pues un puntito 4, como si estuviésemos poniendo 136 00:15:21,840 --> 00:15:25,639 las coordenadas 3, 4, 2, 6, 1, 9, 1, 10 137 00:15:25,639 --> 00:15:28,679 el 4 tenía frecuencia 9 138 00:15:28,679 --> 00:15:33,220 el 5 frecuencia 2 139 00:15:33,220 --> 00:15:38,500 el 6 frecuencia 5 140 00:15:38,500 --> 00:15:43,669 el 7 frecuencia 6 141 00:15:43,669 --> 00:15:49,059 así sucesivamente y lo que hacíamos luego era 142 00:15:49,059 --> 00:15:53,820 unir esos puntos, teníamos que ir uniendo 143 00:15:53,820 --> 00:16:03,659 los valores que nos salían 144 00:16:03,659 --> 00:16:11,769 y nos salía ese polígono de frecuencias 145 00:16:11,769 --> 00:16:15,070 que era como coger la parte más alta 146 00:16:15,070 --> 00:16:18,929 de las rayas estas también, que lo vimos de las dos maneras 147 00:16:18,929 --> 00:16:22,850 ¿vale? cualquiera de las dos formas 148 00:16:22,850 --> 00:16:25,110 me vale para hacerlo 149 00:16:25,110 --> 00:16:31,009 bueno, y el diagrama de sectores 150 00:16:31,009 --> 00:16:33,690 vamos a hacer un poco así churrerillo 151 00:16:33,690 --> 00:16:35,850 pero recordándolo solo era 152 00:16:35,850 --> 00:16:40,629 me cogíamos un círculo que tenía 360 grados 153 00:16:40,629 --> 00:16:44,789 y ahora tenía que ir pintando sectores, o sea, quesitos 154 00:16:44,789 --> 00:16:49,710 que tuviesen, fuesen en proporción 155 00:16:49,710 --> 00:16:54,990 a los datos que aparecían en cada una de las frecuencias 156 00:16:54,990 --> 00:17:00,049 y si 360 grados eran los 54 datos, pues los 10 datos 157 00:17:00,049 --> 00:17:04,789 del valor 1, ¿cuánto va a ser? Pues la misma regla de 3 que hacíamos antes 158 00:17:04,789 --> 00:17:08,410 para los porcentajes, luego si hubiésemos hecho la columna de los porcentajes 159 00:17:08,410 --> 00:17:12,150 podríamos escoger de ahí los ángulos de los sectores, entonces digamos 160 00:17:12,150 --> 00:17:16,730 que ese primero tendría 360 por 10 161 00:17:16,730 --> 00:17:20,269 entre 54, pues los ángulos que sea 162 00:17:20,269 --> 00:17:24,630 x grados, y poníamos pues ese trocito 163 00:17:24,630 --> 00:17:28,009 y vamos haciendo así para todos los demás, bueno 164 00:17:28,009 --> 00:17:33,009 ya teníamos nuestros diagramas de representación 165 00:17:33,009 --> 00:17:40,049 de esta variable cuantitativa discreta y tenemos su tabla de frecuencias. 166 00:17:40,049 --> 00:17:45,230 Ahora me piden los parámetros de centralización y en esos parámetros de centralización 167 00:17:45,230 --> 00:17:53,650 nosotros decíamos que la media aritmética era hacer la suma de xy por fi 168 00:17:53,650 --> 00:17:56,170 y dividirlo entre el número total de datos. 169 00:17:57,109 --> 00:18:02,109 Entonces, ¿qué nos interesaba hacer para hacer esa cuenta más rápida? 170 00:18:03,009 --> 00:18:20,789 Pues hacerme esa columna en mi tabla, que la hacemos aquí al lado izquierdo, y veo cuánto va a valer el resultado de la multiplicación de cada dato por las veces que ha aparecido. 171 00:18:20,789 --> 00:18:25,549 pues 10 por 1 me daría 10, 2 por 6 172 00:18:25,549 --> 00:18:29,390 12, 3 por 4, también 12, 4 por 9 173 00:18:29,390 --> 00:18:32,609 36, 5 por 2, 10 174 00:18:32,609 --> 00:18:37,529 6 por 5, 30, 7 por 6, 42 175 00:18:37,529 --> 00:18:41,369 8 por 3, 24, 9 por 7 176 00:18:41,369 --> 00:18:45,410 63, 10 por 2, 20 177 00:18:45,410 --> 00:18:49,150 y sumamos todo, 10 más 12, 22 178 00:18:49,150 --> 00:19:10,930 más 12, 34, perdón, más 36, 70, más 10, 80, más 30, 110, 152, 176, 239 y 259. 179 00:19:10,930 --> 00:19:15,069 Pues la media de todos esos datos es 180 00:19:15,069 --> 00:19:20,049 259 dividido entre 54 181 00:19:20,049 --> 00:19:22,950 A ver que cojo una calculadora un segundito 182 00:19:22,950 --> 00:19:26,130 Y ponemos bien las cuentas 183 00:19:26,130 --> 00:19:37,759 Pues 259 184 00:19:37,759 --> 00:19:40,779 Dividido entre ese 54 185 00:19:40,779 --> 00:19:44,579 Me sale que la media es 186 00:19:44,579 --> 00:19:50,059 de 4,79,6 187 00:19:50,059 --> 00:19:53,059 Podríamos redondear a 4,75 188 00:19:53,059 --> 00:19:56,460 ¿Vale? Esa sería mi media aritmética 189 00:19:56,460 --> 00:20:01,019 Dijimos luego, bueno, hay más parámetros de centralización 190 00:20:01,019 --> 00:20:03,680 Por ejemplo, la moda 191 00:20:03,680 --> 00:20:05,660 ¿Qué era la moda? 192 00:20:05,660 --> 00:20:10,619 La moda, que era lo que más se repetía 193 00:20:10,619 --> 00:20:14,539 Y podía ser más de un valor 194 00:20:14,539 --> 00:20:18,759 pero en nuestro caso lo que más se repite es 195 00:20:18,759 --> 00:20:21,619 el dato que tiene la frecuencia absoluta más alta 196 00:20:21,619 --> 00:20:24,380 pues es el 1 que tenía de frecuencia 10 197 00:20:24,380 --> 00:20:27,640 pues la moda en nuestro caso es 1 198 00:20:27,640 --> 00:20:28,900 ¿vale? 199 00:20:29,359 --> 00:20:31,380 luego teníamos la mediana 200 00:20:31,380 --> 00:20:37,180 que la mediana era el dato que se encontraba en el centro de la distribución 201 00:20:37,180 --> 00:20:40,799 como nosotros hemos hecho aquí 202 00:20:40,799 --> 00:20:46,799 un recuento de 54 datos 203 00:20:46,799 --> 00:20:50,000 pues si yo quiero ver la posición 204 00:20:50,000 --> 00:20:54,740 de la que tengo que sacar la mediana, lo que hago es decir 205 00:20:54,740 --> 00:20:59,910 la posición sería buscar el dato 206 00:20:59,910 --> 00:21:03,869 que está en el centro, que es el 54 entre 2 207 00:21:03,869 --> 00:21:07,710 pues sería el 27. ¿Quién es el dato 27? 208 00:21:08,710 --> 00:21:10,109 Pues nada, vamos a buscar 209 00:21:10,109 --> 00:21:16,700 27 sería la mitad 210 00:21:16,700 --> 00:21:20,099 pero como estamos en una distribución par 211 00:21:20,099 --> 00:21:24,039 va a haber 27 hacia abajo 212 00:21:24,039 --> 00:21:27,440 y 27 hacia arriba en esta distribución 213 00:21:27,440 --> 00:21:31,500 yo lo que quiero es ver quién está en la posición 27 214 00:21:31,500 --> 00:21:33,559 y quién está en la 28 215 00:21:33,559 --> 00:21:40,670 y hacer la posición intermedia 216 00:21:40,670 --> 00:22:02,390 Bueno, posición 27, que es lo que a mí me interesa, vamos a ver, 10 y 6, 16 y 4, 20, es lo mismo que estaría haciendo en la frecuencia acumulada, pues, ¿dónde estaría ese dato 27? 217 00:22:02,390 --> 00:22:05,950 aquí en este bloque, el 27 y el 28 218 00:22:05,950 --> 00:22:08,150 que son los que decíamos aquí que me hacen falta a mí 219 00:22:08,150 --> 00:22:11,230 pues tanto el 27 como el 28 220 00:22:11,230 --> 00:22:14,009 corresponden con un 4 221 00:22:14,009 --> 00:22:18,049 ¿vale? pues la mediana 222 00:22:18,049 --> 00:22:20,849 saldría a decir, pues en esa posición 27 223 00:22:20,849 --> 00:22:23,569 hay un 4 y en esa 28 224 00:22:23,569 --> 00:22:27,029 hay un 4, pues tengo que calcular su media 225 00:22:27,029 --> 00:22:28,890 la media de esos dos es 226 00:22:28,890 --> 00:22:31,630 4 más 4 dividido entre 2 227 00:22:31,630 --> 00:22:35,710 que vuelve a ser 4, pues la mediana es 228 00:22:35,710 --> 00:22:38,349 un 4, ¿vale? 229 00:22:39,490 --> 00:22:43,930 Entonces tengo media, moda y mediana, me faltan los cuartiles 230 00:22:43,930 --> 00:22:46,509 los cuartiles que eran 3 231 00:22:46,509 --> 00:22:51,809 cuartil 1, cuartil 2 232 00:22:51,809 --> 00:22:54,950 y cuartil 3, lo que me daban era 233 00:22:54,950 --> 00:22:59,890 el dato que me dejaba el 25% de los datos por debajo 234 00:22:59,890 --> 00:23:04,670 el dato que me da bajaba el 50% de los datos por debajo y el que me dejaba el 75% 235 00:23:04,670 --> 00:23:09,269 dijimos que el del 50% era igual que el de la mediana 236 00:23:09,269 --> 00:23:13,130 entonces el del 50% es el 4 237 00:23:13,130 --> 00:23:16,309 y ahora el que me deja el 25% 238 00:23:16,309 --> 00:23:21,309 pues es como decir que qué dato es el que ocupa la posición 239 00:23:21,309 --> 00:23:26,140 en verde 54 entre 2 240 00:23:26,140 --> 00:23:29,339 54 entre 4, la posición 241 00:23:29,339 --> 00:23:39,000 1, 14 entre 4 sería 3,5 242 00:23:39,000 --> 00:23:42,200 el dato que está en la posición 13,5 243 00:23:42,200 --> 00:23:45,119 bueno, pues la posición 13,5 244 00:23:45,119 --> 00:23:46,119 si hago lo de antes 245 00:23:46,119 --> 00:23:48,240 10 más 6, 16 246 00:23:48,240 --> 00:23:52,119 ¿quién sería el que está en la posición 13,5? 247 00:23:52,240 --> 00:23:53,119 pues uno de esos dos 248 00:23:53,119 --> 00:23:56,099 pues el cuartil 1 es un 2 249 00:23:56,099 --> 00:24:02,599 2, y el cuartil 3 250 00:24:02,599 --> 00:24:05,700 pues sería el que ocupe la posición 251 00:24:05,700 --> 00:24:13,259 un cuarto pero por el final, o sea que es lo mismo 252 00:24:13,259 --> 00:24:19,809 que hacer la posición tres cuartos 253 00:24:19,809 --> 00:24:23,630 ¿cuántos son los tres cuartos de 54? 254 00:24:25,089 --> 00:24:27,690 pues sería lo mismo que hacer 3 por 4, 12 255 00:24:27,690 --> 00:24:31,670 3 por 5, 15 y 1, 16 dividido entre 4 256 00:24:31,670 --> 00:24:36,210 o sea, que sería 4, 40,5 257 00:24:36,210 --> 00:24:39,769 ¿Quién es el dato que está en la posición 40,5? 258 00:24:40,329 --> 00:24:43,890 Pues hacemos en la frecuencia absoluta acumulada 259 00:24:43,890 --> 00:24:47,710 ese recuento, y el 40,5, pues si 260 00:24:47,710 --> 00:24:51,809 hasta aquí hay 36 datos, y luego hasta aquí 42 ya 261 00:24:51,809 --> 00:24:55,849 pues sería un 7, pues mi cuartil 262 00:24:55,849 --> 00:24:59,829 3 sería entonces el 7 263 00:24:59,829 --> 00:25:02,930 ¿vale? esto es lo mismo que si hubiésemos hecho 264 00:25:02,930 --> 00:25:06,950 cuatro cajitas y dijésemos 265 00:25:06,950 --> 00:25:11,910 vamos a ver quién es esa pared, esa pared y esa pared 266 00:25:11,910 --> 00:25:16,450 cuartil 1, cuartil 2, cuartil 3 267 00:25:16,450 --> 00:25:22,170 aquí tengo el 25%, aquí tengo el 50% 268 00:25:22,170 --> 00:25:25,809 y aquí tengo el 75% 269 00:25:25,809 --> 00:25:47,630 Si hubiésemos hecho nuestra columna de los porcentajes aquí, la podríamos haber utilizado sumando estos porcentajes finales o haciendo la columna de porcentajes pero desde la relativa acumulada. 270 00:25:47,630 --> 00:25:50,109 es otra forma de verlo 271 00:25:50,109 --> 00:25:52,269 bueno, lo que nos interesa 272 00:25:52,269 --> 00:25:54,190 principalmente es esa 273 00:25:54,190 --> 00:25:56,390 media, mediana y moda 274 00:25:56,390 --> 00:25:58,309 los cuartiles solo era una más 275 00:25:58,309 --> 00:26:00,309 podríamos haber hablado de percentiles 276 00:26:00,309 --> 00:26:01,869 y tal, pero ya es que no nos ha dado tiempo 277 00:26:01,869 --> 00:26:03,009 hemos acabado el curso 278 00:26:03,009 --> 00:26:08,619 ahora, ¿qué pasaría 279 00:26:08,619 --> 00:26:12,529 si lo hacemos de la otra 280 00:26:12,529 --> 00:26:12,829 manera? 281 00:26:13,690 --> 00:26:16,089 si queremos coger 282 00:26:16,089 --> 00:26:17,490 y agruparlos 283 00:26:17,490 --> 00:26:20,269 en cinco intervalos, como me dicen aquí 284 00:26:20,269 --> 00:26:22,450 ¿qué tendría que hacer? 285 00:26:25,839 --> 00:26:28,440 a ver, le vamos a hacer otra cosita 286 00:26:28,440 --> 00:26:39,970 vamos a volver a llevarle datos 287 00:26:39,970 --> 00:26:44,049 para poderlos volver a reagrupar 288 00:26:44,049 --> 00:26:46,210 y contar otra vez de nuevo 289 00:26:46,210 --> 00:26:48,589 con estas nuevas condiciones 290 00:26:48,589 --> 00:27:06,700 ahora me dicen, agrupa en 5 grupos 291 00:27:06,700 --> 00:27:09,720 o sea, trátalo como variable 292 00:27:09,720 --> 00:27:11,079 continua 293 00:27:11,079 --> 00:27:12,920 variable 294 00:27:12,920 --> 00:27:15,519 cuantitativa 295 00:27:15,519 --> 00:27:20,640 continua 296 00:27:20,640 --> 00:27:23,579 vale 297 00:27:23,579 --> 00:27:26,339 entonces, ahora dijimos que 298 00:27:26,339 --> 00:27:28,519 lo que hacíamos era 299 00:27:28,519 --> 00:27:30,660 unos intervalos 300 00:27:30,660 --> 00:27:34,420 que tenían que ser de la misma longitud 301 00:27:34,420 --> 00:27:35,200 todos 302 00:27:35,200 --> 00:27:38,259 y como a mí me dice que haga 303 00:27:38,259 --> 00:27:39,940 cinco 304 00:27:39,940 --> 00:27:42,059 cajitas, que lo agrupe en cinco 305 00:27:42,059 --> 00:27:43,740 pues que voy a hacer, según los datos que tengo 306 00:27:43,740 --> 00:27:45,380 mi primer intervalo va a ser 307 00:27:45,380 --> 00:27:50,380 El 1, 2. El segundo va a ser el 2, 3. 308 00:27:52,970 --> 00:28:07,299 Ay, perdón. A probar qué pasa con el puntiario. 309 00:28:10,279 --> 00:28:11,420 1, 2. Bueno. 310 00:28:13,059 --> 00:28:14,839 Perdonad que no quiero escribir esto. 311 00:28:16,180 --> 00:28:17,359 Vamos a ver si le da la gana. 312 00:28:22,829 --> 00:28:24,309 El intervalo 1, 2. 313 00:28:25,470 --> 00:28:27,849 Luego tendré el 2, 4. 314 00:28:30,130 --> 00:28:31,150 ¿Por qué no me sale? 315 00:28:35,400 --> 00:28:37,519 Tendré el 4, 6. 316 00:28:37,519 --> 00:28:42,500 el 6, 8 y el 8, 10 317 00:28:42,500 --> 00:28:48,019 1, 2, 3, 4 y 5 318 00:28:48,019 --> 00:28:49,259 intervalos como me decían 319 00:28:49,259 --> 00:28:52,059 y decíamos, de esos intervalos 320 00:28:52,059 --> 00:28:53,740 tenemos que buscar un representante 321 00:28:53,740 --> 00:28:56,259 que es lo que llamábamos marca de clase 322 00:28:56,259 --> 00:29:00,980 marca de clase 323 00:29:00,980 --> 00:29:03,700 y que la vamos a tratar 324 00:29:03,700 --> 00:29:06,099 como si fuese la x y luego en las cuentas 325 00:29:06,099 --> 00:29:10,779 y que era el punto intermedio 326 00:29:10,779 --> 00:29:14,240 o sea que el punto intermedio 327 00:29:14,240 --> 00:29:15,720 en el 328 00:29:15,720 --> 00:29:20,720 0, 2, perdón 329 00:29:20,720 --> 00:29:23,740 sería el 1, el 3 330 00:29:23,740 --> 00:29:26,880 el 5, el 7 331 00:29:26,880 --> 00:29:29,740 y el 9, serían los puntos intermedios 332 00:29:29,740 --> 00:29:32,420 de esas cajitas que nosotros hemos generado 333 00:29:32,420 --> 00:29:34,900 ahora lo que hago cuando calculo 334 00:29:34,900 --> 00:29:45,019 La frecuencia absoluta es ver cuántos caen dentro de cada una de esas cajitas que nosotros hemos generado. 335 00:29:47,690 --> 00:29:53,170 Y digo, entre 0 y el 2, ¿cuántos caen? 336 00:29:53,170 --> 00:30:12,910 Pues van a ser los unos de antes. Uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, me he saltado uno porque eran diez, a ver, por columnas, y diez. 337 00:30:12,910 --> 00:30:17,430 Entonces, la frecuencia de los números que caen en ese primer intervalo es 10 338 00:30:17,430 --> 00:30:21,650 Ahora, entre 2 y 4, pues van a ser los 12 y los 13 339 00:30:21,650 --> 00:30:28,849 Pues acordaos que si el paréntesis me dejaba escapar el número y el corchete me lo recogía 340 00:30:28,849 --> 00:30:32,769 Pues los 12 no los puedo contar aquí, los tengo que contar aquí 341 00:30:32,769 --> 00:30:35,890 Los 4 no los puedo contar así, aquí los tengo que contar aquí 342 00:30:35,890 --> 00:30:41,369 Entonces, este segundo intervalo serían los 12 y los 13 que pueda encontrarme 343 00:30:41,369 --> 00:30:56,369 Pues uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, ocho, nueve, diez. 344 00:30:59,000 --> 00:30:59,519 Pues diez. 345 00:31:00,140 --> 00:31:03,200 Entre cuatro y seis, pues van a ser los cuatro y los cinco. 346 00:31:03,200 --> 00:31:21,920 Pues 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 y 11. 347 00:31:23,200 --> 00:31:24,940 Frecuencia 11. 348 00:31:25,740 --> 00:31:29,079 En el intervalo 6-8, con los 6 y los 7. 349 00:31:29,079 --> 00:31:44,180 6 y 7, pues 1, 2, 3, 4, 5, 5, 6, 7, 8, 9, 10 y otra vez 350 00:31:44,180 --> 00:31:51,039 Y en el último ya serían los 8, 9 y 10 351 00:31:51,039 --> 00:32:06,200 Entonces, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 y 12. 352 00:32:07,099 --> 00:32:10,700 ¿Por qué? Porque ahora aquí el intervalo está cerrado. 353 00:32:11,319 --> 00:32:13,579 Aquí habríamos contado también los ceros, pero no había. 354 00:32:14,299 --> 00:32:18,519 Entonces, ya tengo mi tabla de frecuencias hecha. 355 00:32:18,519 --> 00:32:21,799 si quiero hacerle frecuencia relativa tal y cual eso sería igual 356 00:32:21,799 --> 00:32:24,299 no nos vamos a perder tiempo en eso 357 00:32:24,299 --> 00:32:28,660 ¿qué representación teníamos para las variables 358 00:32:28,660 --> 00:32:30,880 cuantitativas continuas? 359 00:32:31,019 --> 00:32:32,180 pues teníamos lo que se llamaba 360 00:32:32,180 --> 00:32:36,930 en vez de tabla de 361 00:32:36,930 --> 00:32:40,430 diagrama de barras teníamos lo que se llamaba 362 00:32:40,430 --> 00:32:46,190 el histograma y el histograma era 363 00:32:46,190 --> 00:32:49,869 que en el eje x 364 00:32:49,869 --> 00:32:52,190 poníamos los intervalos 365 00:32:52,190 --> 00:33:01,650 Lo decíamos de 0 a 2, de 2 a 4, de 4 a 6, de 6 a 8 y de 8 a 10. 366 00:33:02,410 --> 00:33:06,250 Y en el eje Y poníamos las frecuencias igual que antes. 367 00:33:07,430 --> 00:33:16,569 Entonces, fijaos, como salen 10, 10, 11 y 11, vamos a suponer que el 10 está ahí, el 11 estuviese aquí y el 12 ahí para verlas mejor. 368 00:33:16,569 --> 00:33:24,349 Y lo que hacíamos era dibujar como rectángulos de anchura al intervalo y de altura a la frecuencia. 369 00:33:24,589 --> 00:33:48,599 Entonces, la primera sería esta cajita, la segunda hasta el 4, la tercera iría hasta el 11, la cuarta también y la quinta va hasta el 12. 370 00:33:48,599 --> 00:33:54,700 este era mi histograma 371 00:33:54,700 --> 00:33:58,079 estas barritas que eran 372 00:33:58,079 --> 00:34:02,660 gordas, pejadas unas a otras, no había huecos 373 00:34:02,660 --> 00:34:06,220 porque ahora tengo que representar 374 00:34:06,220 --> 00:34:10,699 esos intervalos, el polígono 375 00:34:10,699 --> 00:34:14,219 de frecuencias, pues era igual que antes 376 00:34:14,219 --> 00:34:17,940 era coger la punta más alta, pero encima 377 00:34:17,940 --> 00:34:31,320 de quien era la marca de clase, S1, S3, S5, S7 y S9, ir poniendo solo un puntito en la parte más alta 378 00:34:31,320 --> 00:34:41,360 y luego unir esos puntitos. Eso era el polígono de frecuencias. 379 00:34:41,360 --> 00:34:46,429 ¿vale? y ahora decíamos 380 00:34:46,429 --> 00:34:50,829 si yo quiero calcular los parámetros de centralización 381 00:34:50,829 --> 00:34:54,369 necesito otra vez hacer esa x y por f y 382 00:34:54,369 --> 00:34:56,809 para hacer la media aritmética 383 00:34:56,809 --> 00:34:59,489 si yo tenía intervalos 384 00:34:59,489 --> 00:35:01,730 ¿cómo iba a cogerlo con cada uno de los valores? 385 00:35:01,909 --> 00:35:05,110 lo que hacíamos era coger la marca de clase, el representante 386 00:35:05,110 --> 00:35:08,670 entonces 1 por 10, 10, 3 por 10 387 00:35:08,670 --> 00:35:11,190 30, 5 por 11 388 00:35:11,190 --> 00:35:14,030 55, 7 por 11 389 00:35:14,030 --> 00:35:16,769 77, 9 por 2 390 00:35:16,769 --> 00:35:19,750 pues 108 391 00:35:19,750 --> 00:35:25,420 ¿vale? pues esas eran 392 00:35:25,420 --> 00:35:31,460 las columnas que me hacían falta 393 00:35:31,460 --> 00:35:33,699 en mi tabla de frecuencia para poder calcular 394 00:35:33,699 --> 00:35:36,280 mis parámetros de centralización 395 00:35:36,280 --> 00:35:38,880 pues media aritmética 396 00:35:38,880 --> 00:35:42,480 pues como antes la suma de x y 397 00:35:42,480 --> 00:35:45,239 por f y entre n 398 00:35:45,239 --> 00:36:16,510 La suma ahora de xy por fi, ¿cuánto va a ser? Pues 10 y 30, 40 y 55, 95. 95 y 77, pues 165, 170 y 2. 172, 272, 280. Pues 280 dividido entre 54. 399 00:36:17,190 --> 00:36:35,099 En este caso, el 280 entre 54 nos va a dar 5,18. 400 00:36:39,360 --> 00:36:46,519 Fijaos que antes la media aritmética me daba 4,79. 401 00:36:47,260 --> 00:36:53,320 O sea que el haber tratado como variable continua y haber agrupado los datos en cajas 402 00:36:53,320 --> 00:36:56,420 ha hecho que la media cambie 403 00:36:56,420 --> 00:37:01,199 ¿vale? porque ahora he cogido unos representantes 404 00:37:01,199 --> 00:37:05,420 que no coincidían con los datos verdaderos, ¿quién sería la moda? 405 00:37:06,079 --> 00:37:09,139 ¿quién es el que más se repite? pues ahora hay dos que se repiten 406 00:37:09,139 --> 00:37:13,219 11, ay perdón, hay uno de 12, perdón, perdón 407 00:37:13,219 --> 00:37:17,320 pues la moda sería el 9, mientras que antes 408 00:37:17,320 --> 00:37:21,199 la moda era el 1, o sea, hemos pasado de que la moda era el 409 00:37:21,199 --> 00:37:33,920 Este valor que estaba al principio, en este caso en la primera caja, y resulta que luego al juntar los 8, 9 y 10, pues han pasado al recuento de esos 1 en el principio, ¿vale? 410 00:37:33,920 --> 00:37:39,000 la mediana, pues otra vez los 54 datos 411 00:37:39,000 --> 00:37:41,820 que dijimos que las posiciones que teníamos que mirar 412 00:37:41,820 --> 00:37:45,079 la 27 y la 28, pues ahora si miro esas posiciones 413 00:37:45,079 --> 00:37:48,300 27 y 28, digo 10, 20, 31 414 00:37:48,300 --> 00:37:50,320 por la posición 27 y 28 415 00:37:50,320 --> 00:37:52,420 me van a dar un 5 416 00:37:52,420 --> 00:37:55,599 y antes la mediana la teníamos 417 00:37:55,599 --> 00:38:07,070 a ver que ha pasado, la mediana la teníamos 418 00:38:07,070 --> 00:38:11,900 en el 4, o sea que todo se ha movido 419 00:38:11,900 --> 00:38:15,500 si mirásemos los cuartiles nos pasaría lo mismo 420 00:38:15,500 --> 00:38:17,940 como los cuartiles hemos dicho que solo los veíamos un poco 421 00:38:17,940 --> 00:38:21,159 pues como curiosidad, viendo que era otra forma de hacer el reparto 422 00:38:21,159 --> 00:38:23,760 pues los dejamos sin calcular 423 00:38:23,760 --> 00:38:26,440 las que me interesan, como digo, es media 424 00:38:26,440 --> 00:38:28,760 moda y mediana 425 00:38:28,760 --> 00:38:33,639 frecuencias y tabla de datos y representaciones 426 00:38:33,639 --> 00:38:35,599 para variable cuantitativa continua 427 00:38:35,599 --> 00:38:39,059 frecuencias, tabla de datos y representaciones 428 00:38:39,059 --> 00:38:41,579 para cuantitativa discreta, que es lo que hemos 429 00:38:41,579 --> 00:38:45,139 vistos aquí. Con esto habíamos repasado un poco 430 00:38:45,139 --> 00:38:49,920 todo lo que vimos el otro día, en datos 431 00:38:49,920 --> 00:38:53,739 que correspondían a la misma distribución, pero que los hemos agrupado 432 00:38:53,739 --> 00:38:56,900 de formas distintas. Bueno, pues con esto 433 00:38:56,900 --> 00:39:01,760 terminamos el tema, lo que entra en el examen y el curso. 434 00:39:02,800 --> 00:39:05,679 Nos vemos ya la próxima semana en los exámenes. 435 00:39:06,260 --> 00:39:07,219 Hasta luego, buena tarde.