1 00:00:00,430 --> 00:00:19,429 Pues continuamos con la segunda sesión dedicada a la estadística. El otro día vimos lo que es la introducción a la materia y nos metimos en cómo se trabaja con las tablas de frecuencia absolutas y relativas y vimos los parámetros estadísticos de centralización. 2 00:00:19,429 --> 00:00:26,170 La media, la moda, la mediana y también vemos los percentiles y los cuartiles, ¿vale? 3 00:00:26,570 --> 00:00:31,789 Nos quedaba por ver los parámetros estadísticos de dispersión, ¿vale? 4 00:00:31,969 --> 00:00:33,170 Eso es lo que vamos a ver hoy. 5 00:00:34,390 --> 00:00:41,189 Lo veremos rápidamente y nos pondremos a hacer un ejercicio lo más completo posible. 6 00:00:42,030 --> 00:00:48,710 Es decir, en el examen, si yo pusiera todo, pues todo eso vendría en el ejercicio que vamos a hacer. 7 00:00:48,710 --> 00:00:51,530 no quiere decir que os pregunte todo 8 00:00:51,530 --> 00:00:56,549 pero que más o menos engloba un resumen muy amplio 9 00:00:56,549 --> 00:00:58,929 de lo que hemos visto en este tema 10 00:00:58,929 --> 00:01:03,109 entonces, las medidas de dispersión 11 00:01:03,109 --> 00:01:04,870 lo que vienen a decir es 12 00:01:04,870 --> 00:01:07,609 los datos, cómo se alejan 13 00:01:07,609 --> 00:01:09,810 de un dato central 14 00:01:09,810 --> 00:01:13,750 y en un rango cercano al dato que esté más 15 00:01:13,750 --> 00:01:15,230 en la media 16 00:01:15,230 --> 00:01:18,549 cuánto podremos encontrar 17 00:01:18,549 --> 00:01:20,069 ahí de datos, porque 18 00:01:20,069 --> 00:01:22,769 aquí viene un par de ejemplos 19 00:01:22,769 --> 00:01:23,469 que son bastante 20 00:01:23,469 --> 00:01:25,870 claros para explicarlo, y dice 21 00:01:25,870 --> 00:01:28,170 la estadística es una ciencia según la cual 22 00:01:28,170 --> 00:01:30,209 si yo me como un pollo y tú 23 00:01:30,209 --> 00:01:31,569 no te comes ninguno 24 00:01:31,569 --> 00:01:34,049 nos hemos comido como promedio 25 00:01:34,049 --> 00:01:35,370 medio pollo cada uno 26 00:01:35,370 --> 00:01:37,510 eso es así, pasos a la media 27 00:01:37,510 --> 00:01:39,750 pero luego podemos encontrarnos 28 00:01:39,750 --> 00:01:41,450 al mirar casos 29 00:01:41,450 --> 00:01:44,349 aquí donde dice medir la dispersión 30 00:01:44,349 --> 00:01:45,189 nos dice 31 00:01:45,189 --> 00:01:47,609 Ese es el objetivo de estas medidas 32 00:01:47,609 --> 00:01:49,430 Por ejemplo, los datos 33 00:01:49,430 --> 00:01:51,109 Un dato es 20 y 20 34 00:01:51,109 --> 00:01:53,609 Pues si yo calculo la media 35 00:01:53,609 --> 00:01:54,150 Es 20 36 00:01:54,150 --> 00:01:56,590 Y además los datos justo coinciden 37 00:01:56,590 --> 00:01:58,989 Está todo muy centrado 38 00:01:58,989 --> 00:02:01,750 Pero si yo tengo 15, 20, 20 y 25 39 00:02:01,750 --> 00:02:02,590 La media 40 00:02:02,590 --> 00:02:04,489 Sigue siendo 20 41 00:02:04,489 --> 00:02:07,590 La moda, de hecho sigue siendo 20 42 00:02:07,590 --> 00:02:09,129 Que es lo que más se repite en los dos casos 43 00:02:09,129 --> 00:02:11,169 Y la mediana, si la calculáis 44 00:02:11,169 --> 00:02:12,069 Es 20 también 45 00:02:12,069 --> 00:02:14,330 luego aparentemente los datos 46 00:02:14,330 --> 00:02:16,750 es lo mismo, misma media, misma moda 47 00:02:16,750 --> 00:02:18,969 misma mediana, pero sobre esos datos 48 00:02:18,969 --> 00:02:20,449 centrales, sobre ese 20 49 00:02:20,449 --> 00:02:22,909 ¿vale? resulta que en el segundo 50 00:02:22,909 --> 00:02:24,930 caso tenemos datos que se alejan 51 00:02:24,930 --> 00:02:26,050 el 15 y el 25 52 00:02:26,050 --> 00:02:29,370 lo que pasa es que el que se pasa por exceso 53 00:02:29,370 --> 00:02:30,909 compensa con el de defecto 54 00:02:31,789 --> 00:02:32,650 ¿vale? 55 00:02:32,669 --> 00:02:34,590 entonces las medidas de centralización compensan 56 00:02:34,590 --> 00:02:36,969 ¿vale? y con la de dispersión 57 00:02:36,969 --> 00:02:38,330 lo que se va a ver es los datos 58 00:02:38,330 --> 00:02:40,490 en qué medidas se alejan o se 59 00:02:40,490 --> 00:02:41,949 dispersan ¿vale? 60 00:02:42,069 --> 00:02:44,750 por eso aquí nos dice 61 00:02:44,750 --> 00:02:46,710 que para muestras 62 00:02:46,710 --> 00:02:48,949 con una sola moda 63 00:02:48,949 --> 00:02:51,030 y que son más o menos casi simétricas 64 00:02:51,030 --> 00:02:53,030 alrededor de la media podemos considerar 65 00:02:53,030 --> 00:02:55,389 un intervalo que contenga la mayoría de los datos 66 00:02:55,389 --> 00:02:57,229 aquí ya viene un poco 67 00:02:57,229 --> 00:02:58,550 de estadística, si dice por ejemplo 68 00:02:58,550 --> 00:03:01,169 para una muestra con media 100 y desviación típica 69 00:03:01,169 --> 00:03:03,129 10, que ahora os explicaré 70 00:03:03,129 --> 00:03:04,250 qué es la desviación típica 71 00:03:04,250 --> 00:03:07,509 quiere decir que 100 más 10 o 100 menos 10 72 00:03:07,509 --> 00:03:08,830 puedo desviar 10 unidades 73 00:03:08,830 --> 00:03:10,849 pues en el rango 90-110 74 00:03:10,849 --> 00:03:12,990 voy a encontrar muchos datos. Aquí me dice 75 00:03:12,990 --> 00:03:14,830 que voy a encontrar el 68% 76 00:03:14,830 --> 00:03:16,909 de los datos. Si la desviación 77 00:03:16,909 --> 00:03:18,409 fuera 20, es decir, 78 00:03:18,889 --> 00:03:21,270 en este caso he ido 80, 120, voy a tener el 95% 79 00:03:21,270 --> 00:03:21,870 de los datos. 80 00:03:23,050 --> 00:03:24,449 Se van a ir alejando, pero 81 00:03:24,449 --> 00:03:26,830 una gran mayoría están cerca de 82 00:03:26,830 --> 00:03:28,210 ese valor, digamos, central. 83 00:03:28,810 --> 00:03:30,550 Para eso nos va a servir estudiar 84 00:03:30,550 --> 00:03:32,830 las medidas de dispersión. 85 00:03:32,830 --> 00:03:34,129 ¿Vale? Y nosotros 86 00:03:34,129 --> 00:03:36,370 vamos a ver tres. 87 00:03:36,909 --> 00:03:38,789 Vamos a ver el rango, que el otro día lo cité. 88 00:03:39,849 --> 00:03:40,810 La variaz 89 00:03:40,810 --> 00:03:53,430 Y la desviación típica. No vamos a entrar mucho en profundidad, ¿vale? El significado del rango es muy fácil. El rango es el intervalo que está definido entre el menor y el mayor de los datos que encontremos. Es decir, coger y restarlos. 90 00:03:53,430 --> 00:04:13,909 Si en las notas de tu curso la nota más alta que has sacado es un 9 y la más baja es un 6, el rango será 9 menos 6, 3. Es decir, es la resta del valor más grande que encontramos con el más pequeño. Ese es el rango. 91 00:04:13,909 --> 00:04:23,990 Es decir, para saber, nunca mejor dicho, en qué rango de datos nos estamos manejando, en qué intervalo vamos a encontrar los datos. Fuera de ese rango, ¿vale? No va a haber. 92 00:04:24,790 --> 00:04:33,910 Varianza. Dice, la varianza es la media aritmética de los cuadrados de las diferencias de los datos con la media. Una frase que es difícil de entender. 93 00:04:33,910 --> 00:04:36,730 tenemos aquí una fórmula 94 00:04:36,730 --> 00:04:38,750 primero viene este simbolito 95 00:04:38,750 --> 00:04:41,009 que es como una O pero arriba tiene como un rabillo 96 00:04:41,009 --> 00:04:44,509 es una letra griega 97 00:04:44,509 --> 00:04:47,250 que va a ser lo que significa 98 00:04:47,250 --> 00:04:48,730 si está elevado al cuadrado la varianza 99 00:04:48,730 --> 00:04:50,790 o también podemos verlo V igual 100 00:04:50,790 --> 00:04:53,709 V sería la varianza en vez de este simbolito 101 00:04:53,709 --> 00:04:55,569 y nos viene una fórmula 102 00:04:55,569 --> 00:04:57,370 podemos coger esta primera 103 00:04:57,370 --> 00:04:59,250 o podemos coger la segunda que es equivalente 104 00:04:59,790 --> 00:05:00,970 si yo cojo la primera 105 00:05:00,970 --> 00:05:02,670 este simbolito que es 106 00:05:02,670 --> 00:05:05,230 el de sumatorio, que es la suma 107 00:05:05,230 --> 00:05:07,189 ¿la suma de qué? de las multiplicaciones 108 00:05:07,189 --> 00:05:09,430 de f es la frecuencia 109 00:05:09,430 --> 00:05:10,430 absoluta, es decir 110 00:05:10,430 --> 00:05:12,670 de cada dato, ¿vale? 111 00:05:13,269 --> 00:05:15,149 ¿cuántas veces aparece multiplicado por 112 00:05:15,149 --> 00:05:17,269 el dato menos la media? 113 00:05:17,430 --> 00:05:18,329 claro, si el dato es 114 00:05:18,329 --> 00:05:20,569 imaginar, 5 personas 115 00:05:20,569 --> 00:05:21,930 han sacado un 8, ¿no? 116 00:05:23,310 --> 00:05:25,269 pero la media de los exámenes es un 7 117 00:05:25,269 --> 00:05:27,569 pues, ¿número de 118 00:05:27,569 --> 00:05:29,029 frecuencia? 5 personas 119 00:05:29,029 --> 00:05:31,189 por, nota, un 8 120 00:05:31,189 --> 00:05:31,949 menos la media 121 00:05:31,949 --> 00:05:34,430 La media puede ser un 6 122 00:05:34,430 --> 00:05:36,370 Todo ello elevado al cuadrado 123 00:05:36,370 --> 00:05:41,209 Sumar todo eso y luego dividirlo entre el número total de datos 124 00:05:41,209 --> 00:05:42,750 Podría hacerlo de esta forma 125 00:05:42,750 --> 00:05:45,509 O podría hacerlo sacando la media aquí 126 00:05:45,509 --> 00:05:46,769 Al final 127 00:05:46,769 --> 00:05:48,509 Nosotros vamos a usar 128 00:05:48,509 --> 00:05:50,709 Para los ejercicios esta formulita 129 00:05:50,709 --> 00:05:51,850 Mejor, ¿vale? 130 00:05:53,110 --> 00:05:54,110 ¿Vale? La segunda 131 00:05:54,110 --> 00:05:56,709 Esta de aquí, ¿vale? 132 00:05:57,310 --> 00:05:58,870 Porque para hacer las tablas 133 00:05:58,870 --> 00:06:00,709 De frecuencias 134 00:06:00,709 --> 00:06:02,810 de frecuencias, podemos añadir fácilmente 135 00:06:02,810 --> 00:06:04,670 una nueva columna para poder 136 00:06:04,670 --> 00:06:05,769 calcular estos productos. 137 00:06:06,470 --> 00:06:06,490 ¿Vale? 138 00:06:08,430 --> 00:06:08,910 ¿Perdona? 139 00:06:10,170 --> 00:06:12,589 Sí, me da igual poner f sub i 140 00:06:12,589 --> 00:06:14,709 por x sub i al cuadrado que ponerlo al revés. 141 00:06:14,829 --> 00:06:15,850 Es lo mismo, ¿vale? 142 00:06:16,310 --> 00:06:18,930 Y la desviación típica va a ser la raíz cuadrada 143 00:06:18,930 --> 00:06:20,389 de la varianza. 144 00:06:20,569 --> 00:06:22,050 Es decir, una vez que yo he calculado la varianza, 145 00:06:22,930 --> 00:06:23,949 pues hago la raíz cuadrada. 146 00:06:24,509 --> 00:06:26,870 Si la varianza 147 00:06:26,870 --> 00:06:28,649 me da 16, 148 00:06:28,649 --> 00:06:30,310 pues la desviación típica va a ser 149 00:06:30,310 --> 00:06:35,629 4. Bien. 150 00:06:35,990 --> 00:06:36,810 Estas fórmulas 151 00:06:36,810 --> 00:06:39,810 os las daría 152 00:06:39,810 --> 00:06:40,810 si aparecen en el examen. 153 00:06:42,410 --> 00:06:43,370 Con todo esto, 154 00:06:43,649 --> 00:06:44,910 nos vamos a ir a un ejercicio 155 00:06:44,910 --> 00:06:47,490 porque vamos a entender mejor un poco 156 00:06:47,490 --> 00:06:49,790 todo cómo se calcula. Repasamos 157 00:06:49,790 --> 00:06:51,149 lo que ya vimos el otro día 158 00:06:51,149 --> 00:06:52,730 y añadimos 159 00:06:52,730 --> 00:06:55,649 cómo calcular, en este caso, 160 00:06:56,310 --> 00:06:57,610 la varianza 161 00:06:57,610 --> 00:06:58,889 y la desviación típica. 162 00:06:59,569 --> 00:07:01,629 ¿Sí? Pues nos vamos a ir 163 00:07:01,629 --> 00:07:02,709 al papel. 164 00:07:03,290 --> 00:07:22,170 Aquí. Y nos encontramos con este ejercicio. ¿Qué nos dice? En la vuelta de vacaciones, en un curso de segundo de la ESO, la profesora de matemáticas ha hecho una encuesta y ha preguntado a cada uno de los alumnos por el número de libros que ha leído durante el verano. 165 00:07:22,170 --> 00:07:30,189 Al día siguiente, la profesora les ha traído el siguiente diagrama de barras basado en la encuesta del día anterior 166 00:07:30,189 --> 00:07:34,569 A partir de ese diagrama, tenemos unas preguntas 167 00:07:34,569 --> 00:07:40,170 En el examen os puedo poner una gráfica en la cual están los datos 168 00:07:40,170 --> 00:07:45,750 Obvio, os puedo poner todos los datos y tendréis que hacer el conteo para saber las frecuencias 169 00:07:45,750 --> 00:07:48,089 Luego, lo primero es entender la gráfica 170 00:07:48,089 --> 00:08:05,569 Se ve aquí un poquito borroso, ¿vale? Pero en el eje horizontal, en el de las X, tenemos el número de libros leídos, es decir, se ha leído cero libros, uno, dos, tres, cuatro o cinco libros, y en el eje vertical, en el de las X, tenemos las frecuencias absolutas. 171 00:08:05,569 --> 00:08:27,310 O lo que es lo mismo, ¿cuánta gente ha leído cero libros? Ningún libro, una persona. Un libro lo han leído cuatro personas. Dos libros lo han leído seis. Tres libros lo han leído cinco. Cuatro libros, cuatro. Y cinco libros lo han leído dos personas. Ahí tenemos los datos. 172 00:08:28,209 --> 00:08:34,070 A partir de ahí me va a pedir, primero, que haga una tabla con las frecuencias absolutas y relativas, que esas las vimos el otro día. 173 00:08:34,929 --> 00:08:43,070 Una vez que yo tengo la frecuencia absoluta y relativa, me sirve de ayuda para poder calcular los parámetros estadísticos de centralización. 174 00:08:44,330 --> 00:08:46,490 Es decir, la media, la moda y la mediana. 175 00:08:47,850 --> 00:08:56,889 También os podría pedir aquí el cuartil 3 o el percentil 10, con los datos que tendríamos calculados. 176 00:08:57,309 --> 00:09:08,110 Y luego añadiríamos calcular los parámetros estadísticos de dispersión, rango, desviación típica y varianza, que es lo que hemos comentado antes, esas fórmulas, ¿vale? 177 00:09:08,490 --> 00:09:16,789 Y yo os daría cuál es la varianza, os diría esta es la varianza, ¿vale? Y la desviación típica es la raíz cuadrada de la varianza. 178 00:09:16,789 --> 00:09:24,470 En las fórmulas que comentabais antes me da igual encontrarme primero el x al cuadrado por la frecuencia 179 00:09:24,470 --> 00:09:28,929 Que al revés, primero la f de la frecuencia por el x al cuadrado 180 00:09:28,929 --> 00:09:30,909 No cambia nada 181 00:09:30,909 --> 00:09:34,169 Y tendríamos que completar una tabla así, ¿vale? 182 00:09:35,789 --> 00:09:39,110 En primer lugar tendríamos que poner los datos que me encuentre en este caso 183 00:09:39,110 --> 00:09:44,269 Cero libros, un libro, dos libros, tres libros, cuatro libros y cinco libros, ¿no? 184 00:09:44,269 --> 00:09:48,389 después tendría que completar las frecuencias absolutas 185 00:09:48,389 --> 00:09:49,690 las frecuencias absolutas es 186 00:09:49,690 --> 00:09:52,409 cuántas veces aparece cero libros 187 00:09:52,409 --> 00:09:54,009 o dicho de otra forma, cuántas personas 188 00:09:54,009 --> 00:09:55,490 no ha salido ningún libro 189 00:09:55,490 --> 00:09:57,750 debo de mirar 190 00:09:57,750 --> 00:10:00,470 lo que es la gráfica que tenemos 191 00:10:00,470 --> 00:10:02,250 ¿vale? no sé si la puedo poner aquí al lado 192 00:10:02,250 --> 00:10:03,009 y si puede ver 193 00:10:03,009 --> 00:10:06,570 teníamos que ningún libro 194 00:10:06,570 --> 00:10:09,990 era una persona 195 00:10:09,990 --> 00:10:12,409 pues la frecuencia absoluta de cero libros es uno 196 00:10:12,409 --> 00:10:31,429 Un libro, cuatro personas. Dos libros, seis personas. Tres libros, cinco personas. Cuatro libros, cuatro personas. Y cinco libros, dos personas. 197 00:10:33,850 --> 00:10:38,149 De esta forma ya he recogido todos los datos de la gráfica, ¿vale? 198 00:10:38,750 --> 00:10:43,649 Y aquí puedo ver cuál es el número total de datos, el n, que llamábamos el otro día. 199 00:10:43,730 --> 00:10:47,230 El número total de datos es la suma de las frecuencias absolutas, ¿vale? 200 00:10:47,970 --> 00:10:54,090 1 y 4, 5, y 6, 11, y 5, 16, y 4, 20, y 2, 22. 201 00:10:54,649 --> 00:10:57,750 Luego, total, son 22 alumnos. 202 00:10:58,669 --> 00:11:00,649 Este es el número de datos. 203 00:11:00,649 --> 00:11:03,070 con esto 204 00:11:03,070 --> 00:11:05,149 yo puedo rellenar ahora mismo ya 205 00:11:05,149 --> 00:11:07,529 las cuatro primeras columnas sin ninguna dificultad 206 00:11:07,529 --> 00:11:09,210 me olvido de estas dos 207 00:11:09,210 --> 00:11:10,669 que son las nuevas dos, ¿vale? 208 00:11:11,769 --> 00:11:12,610 la frecuencia 209 00:11:12,610 --> 00:11:15,049 absoluta acumulada 210 00:11:15,049 --> 00:11:16,590 que es la F mayúscula 211 00:11:16,590 --> 00:11:19,570 es el ir sumando las frecuencias 212 00:11:19,570 --> 00:11:20,389 absolutas 213 00:11:20,389 --> 00:11:21,629 yo lo 214 00:11:21,629 --> 00:11:24,309 nazco de uno 215 00:11:24,309 --> 00:11:26,830 un dato y cuatro datos 216 00:11:26,830 --> 00:11:28,269 cinco 217 00:11:28,269 --> 00:11:30,549 cinco y seis 218 00:11:30,549 --> 00:11:32,809 11, 11 y 5 219 00:11:32,809 --> 00:11:35,110 16, 16 y 4 220 00:11:35,110 --> 00:11:37,350 20, 20 y 2 221 00:11:37,350 --> 00:11:38,929 22 222 00:11:38,929 --> 00:11:42,429 Siempre es igual, siempre sumando 223 00:11:42,429 --> 00:11:43,309 con el siguiente 224 00:11:43,309 --> 00:11:46,769 Sí, tiene que coincidir con el número total de datos 225 00:11:46,769 --> 00:11:48,610 Ahora voy a ir 226 00:11:48,610 --> 00:11:51,190 a las frecuencias relativas 227 00:11:51,190 --> 00:11:52,789 Las frecuencias relativas son 228 00:11:52,789 --> 00:11:54,929 las que, si yo quiero pensar 229 00:11:54,929 --> 00:11:56,029 en una posición 230 00:11:56,029 --> 00:11:58,669 ¿Vale? Cuando digo la que está en el centro 231 00:11:58,669 --> 00:12:05,950 el 50%, o un percentil, si os digo el percentil 10, yo buscaré ese 0,1, o lo que es lo mismo, 232 00:12:06,070 --> 00:12:11,990 el 10%, y lo voy a buscar aquí. Por un lado está la frecuencia relativa y luego la acumulada, 233 00:12:11,990 --> 00:12:24,590 ¿vale? La relativa es número de datos 1 entre 22, ¿no? 1 entre 22. De momento lo 234 00:12:24,590 --> 00:12:26,370 dejo así en forma de fracción, luego hacemos así 235 00:12:26,370 --> 00:12:28,049 la división, ¿vale? 236 00:12:28,509 --> 00:12:30,730 1 entre 22, este otro 237 00:12:30,730 --> 00:12:31,350 es 4 238 00:12:31,350 --> 00:12:34,169 entre 22 239 00:12:34,169 --> 00:12:35,750 6 240 00:12:35,750 --> 00:12:37,850 entre 22 241 00:12:37,850 --> 00:12:40,529 5, perdón 242 00:12:40,529 --> 00:12:41,950 5 entre 22 243 00:12:41,950 --> 00:12:44,169 4 entre 22 244 00:12:44,169 --> 00:12:45,950 y 2 entre 245 00:12:45,950 --> 00:12:48,710 22, es decir, la frecuencia 246 00:12:48,710 --> 00:12:50,190 entre el número 247 00:12:50,190 --> 00:12:52,470 total de datos 248 00:12:52,470 --> 00:12:53,090 ¿sí? 249 00:12:54,590 --> 00:13:18,450 Puedo hacer las divisiones, pues mirad, 1 entre 22, redondeando aproximadamente me da 0,045, 4 entre 22, 0,18, 6 entre 22, 0,27, 250 00:13:18,450 --> 00:13:23,129 5 entre 22 251 00:13:23,129 --> 00:13:24,549 0,23 252 00:13:24,549 --> 00:13:28,289 4 entre 22 253 00:13:28,289 --> 00:13:30,309 ya tenemos que era 0,18 254 00:13:30,309 --> 00:13:32,610 y 2 entre 22 255 00:13:32,610 --> 00:13:35,149 pues será 0,09 256 00:13:35,149 --> 00:13:37,450 si yo sumo todo esto 257 00:13:37,450 --> 00:13:39,330 me tiene que dar 1 258 00:13:39,330 --> 00:13:41,289 o puede que me dé 0,99 259 00:13:41,289 --> 00:13:43,250 por el tema de los decimales 260 00:13:43,250 --> 00:13:44,149 que hemos ido quitando 261 00:13:44,149 --> 00:13:46,690 de hecho si lo sumo 262 00:13:46,690 --> 00:13:49,690 0,045 263 00:13:49,690 --> 00:13:52,049 Más 0,18 264 00:13:52,049 --> 00:13:54,570 Más 0,27 265 00:13:54,570 --> 00:13:57,110 Más 0,23 266 00:13:57,110 --> 00:14:00,330 Más 0,18 267 00:14:00,330 --> 00:14:02,250 Más 0,09 268 00:14:02,250 --> 00:14:04,990 En este caso 269 00:14:04,990 --> 00:14:07,450 0,995 270 00:14:07,450 --> 00:14:07,929 ¿Vale? 271 00:14:09,350 --> 00:14:12,370 0,995 272 00:14:12,370 --> 00:14:12,929 Es decir, sí 273 00:14:12,929 --> 00:14:14,690 Esto se aproxima a 1 274 00:14:14,690 --> 00:14:17,269 Si os da 1,4 275 00:14:17,269 --> 00:14:19,289 Pues habéis redondeado 276 00:14:19,289 --> 00:14:21,230 un poquito mal, o habéis cogido 277 00:14:21,230 --> 00:14:23,509 un poquito mal los decimales. Lo normal es que os dé 278 00:14:23,509 --> 00:14:25,549 0,98, 0,99, 279 00:14:25,850 --> 00:14:27,409 1,01, ¿vale? 280 00:14:27,450 --> 00:14:29,169 Dependiendo cómo se 281 00:14:29,169 --> 00:14:31,090 corten los decimales o se redondeen. 282 00:14:31,870 --> 00:14:33,309 Vale. Frecuencia 283 00:14:33,309 --> 00:14:35,190 relativa. La acumulada, ¿qué es? 284 00:14:35,250 --> 00:14:35,730 Ir sumando. 285 00:14:37,049 --> 00:14:39,289 Si yo ya he hecho la división, puedo sumar 286 00:14:39,289 --> 00:14:39,929 la parte decimal. 287 00:14:41,389 --> 00:14:43,210 Puedo trabajar con las fracciones y luego hacer 288 00:14:43,210 --> 00:14:44,629 la división, también podría hacerlo. 289 00:14:45,509 --> 00:14:47,450 Ya que tengo hechas las divisiones, pues sumo directamente. 290 00:14:48,269 --> 00:14:48,470 ¿Vale? 291 00:14:49,289 --> 00:15:12,090 Igual que con la acumulada, en la relativa yo parto de 0,045 y ahora sumo a la siguiente, a 0,045 le sumamos el 0,18, ¿no? 0,045 más 0,18 y da 0,225. 292 00:15:12,090 --> 00:15:15,169 ¿Pero en los calculadores? 293 00:15:15,169 --> 00:15:20,169 Ahora le sumamos 0,27 294 00:15:20,169 --> 00:15:22,990 Más 0,27 295 00:15:22,990 --> 00:15:26,929 Era 0,495 296 00:15:26,929 --> 00:15:29,769 Le sumamos el siguiente que es 0,23 297 00:15:29,769 --> 00:15:31,149 0,23 298 00:15:31,149 --> 00:15:35,190 Por 0,725 299 00:15:35,190 --> 00:15:38,250 Le sumamos 0,18 300 00:15:38,250 --> 00:15:42,350 Por 0,905 301 00:15:42,350 --> 00:15:45,110 Y le sumamos el 0,09 302 00:15:45,110 --> 00:15:49,269 y me da 0,995 303 00:15:49,269 --> 00:15:50,690 que era lo que esperábamos 304 00:15:50,690 --> 00:15:51,690 ese casi y1 305 00:15:51,690 --> 00:15:52,169 ¿vale? 306 00:15:52,889 --> 00:15:53,490 ¿sí? 307 00:15:54,049 --> 00:15:54,289 bien 308 00:15:54,289 --> 00:15:55,250 esto 309 00:15:55,250 --> 00:15:57,009 lo puedo dejar así 310 00:15:57,009 --> 00:15:57,830 no tengo que hacer más 311 00:15:57,830 --> 00:16:00,009 pero si yo quiero pensar en posiciones 312 00:16:00,009 --> 00:16:00,769 que muchas veces 313 00:16:00,769 --> 00:16:02,750 trabajamos mejor pensando 314 00:16:02,750 --> 00:16:04,350 en porcentaje 315 00:16:04,350 --> 00:16:05,049 ¿vale? 316 00:16:05,470 --> 00:16:06,649 es multiplicar por 100 317 00:16:06,649 --> 00:16:08,750 si yo multiplico por 100 318 00:16:08,750 --> 00:16:10,289 esto es el 319 00:16:10,289 --> 00:16:13,230 4,5% 320 00:16:13,230 --> 00:16:32,649 Este otro es el 22,5% de los datos, el 49,5%, el 72,5%, el 90,5% y bueno, el 99,5% de los datos o lo aproximamos al 100%, ¿vale? 321 00:16:34,490 --> 00:16:36,669 Esto me va a servir para buscar también posiciones. 322 00:16:36,669 --> 00:16:39,870 ¿Con todo esto? 323 00:16:40,549 --> 00:16:40,629 ¿Sí? 324 00:16:40,909 --> 00:16:42,490 ¿Con todo esto pongamos el recetaje? 325 00:16:42,850 --> 00:16:43,950 No es necesario 326 00:16:43,950 --> 00:16:48,950 Porque vosotros mentalmente ya podéis saber que esto es el 4,5 327 00:16:48,950 --> 00:16:51,269 Por eso lo he puesto con otro color también, ¿vale? 328 00:16:51,309 --> 00:16:52,470 Pero que no sería necesario 329 00:16:52,470 --> 00:16:54,730 Ahora vamos a las preguntas que me hacen 330 00:16:54,730 --> 00:16:56,210 Calcula la media 331 00:16:56,210 --> 00:16:59,009 La moda y la mediana 332 00:16:59,009 --> 00:17:01,029 Paso a paso 333 00:17:01,029 --> 00:17:02,049 La media 334 00:17:02,049 --> 00:17:03,710 La media es 335 00:17:03,710 --> 00:17:06,430 sumar 336 00:17:06,430 --> 00:17:07,890 ¿el qué? 337 00:17:08,890 --> 00:17:11,400 ¿qué tengo que hacer? 338 00:17:12,640 --> 00:17:13,759 me falta hacer algo 339 00:17:13,759 --> 00:17:16,500 ¿para la media me falta algo? 340 00:17:21,059 --> 00:17:23,359 la media es la suma de todos mis datos 341 00:17:23,359 --> 00:17:23,559 ¿no? 342 00:17:24,940 --> 00:17:27,200 y dividido entre el número total de datos 343 00:17:27,200 --> 00:17:31,240 ¿qué me faltaría? 344 00:17:31,240 --> 00:17:31,259 ¿qué me faltaría? 345 00:17:31,920 --> 00:17:33,059 me faltaría rellenar 346 00:17:33,059 --> 00:17:35,240 esta columna 347 00:17:35,839 --> 00:17:37,160 esta de aquí 348 00:17:37,160 --> 00:17:57,400 Si recordáis. ¿Lo recordáis? La media es cero libros una vez, pues un cero. Un libro cuatro personas, pues es uno, uno, uno y uno y todo sumarlo. Es lo mismo sumar cuatro veces uno que hacer uno por cuatro. 349 00:17:57,400 --> 00:17:59,720 El 2 han sido 6 personas 350 00:17:59,720 --> 00:18:02,960 Luego yo tengo 2, 2, 2, 2, 2, 2 351 00:18:02,960 --> 00:18:04,339 ¿Vale? 352 00:18:04,440 --> 00:18:06,420 La fórmula de la media 353 00:18:06,420 --> 00:18:10,019 La media 354 00:18:10,019 --> 00:18:11,420 La fórmula era 355 00:18:11,420 --> 00:18:13,680 La suma del producto 356 00:18:13,680 --> 00:18:15,539 De cada dato por su frecuencia 357 00:18:15,539 --> 00:18:18,519 Absoluta, dividido entre el número total de datos 358 00:18:18,519 --> 00:18:20,660 Luego aún me falta calcular este producto 359 00:18:20,660 --> 00:18:21,279 ¿Vale? 360 00:18:22,420 --> 00:18:23,380 Y para eso tengo 361 00:18:23,380 --> 00:18:25,119 Esta columna 362 00:18:25,119 --> 00:18:26,279 ¿Sí? 363 00:18:27,400 --> 00:18:30,299 Esta columna es multiplicar 364 00:18:30,299 --> 00:18:33,960 0 por 1, 1 por 4, 2 por 6, 3 por 5, 4 por 4, 5 por 2 365 00:18:33,960 --> 00:18:36,099 Multiplico 0 por 1 366 00:18:36,099 --> 00:18:38,259 0 367 00:18:38,259 --> 00:18:40,539 1 por 4 368 00:18:40,539 --> 00:18:42,019 4 369 00:18:42,019 --> 00:18:43,440 2 por 6 370 00:18:43,440 --> 00:18:44,940 12 371 00:18:44,940 --> 00:18:46,079 3 por 5 372 00:18:46,079 --> 00:18:47,700 15 373 00:18:47,700 --> 00:18:48,700 4 por 4 374 00:18:48,700 --> 00:18:50,660 16 375 00:18:50,660 --> 00:18:52,680 Y 5 por 2 376 00:18:52,680 --> 00:18:54,099 10 377 00:18:54,099 --> 00:18:55,000 ¿Y ahora qué hago? 378 00:18:55,880 --> 00:18:56,859 Sumo todo esto 379 00:18:56,859 --> 00:18:58,859 yo al sumar todo 380 00:18:58,859 --> 00:19:00,359 aquí me voy a encontrar ya 381 00:19:00,359 --> 00:19:03,079 aquí voy a tener que 382 00:19:03,079 --> 00:19:04,039 el sumatorio 383 00:19:04,039 --> 00:19:06,420 de las x y 384 00:19:06,420 --> 00:19:08,119 por x y 385 00:19:08,119 --> 00:19:10,279 0 386 00:19:10,279 --> 00:19:13,079 más 4, 4 y 12, 16 387 00:19:13,079 --> 00:19:14,859 y 15, 31 388 00:19:14,859 --> 00:19:17,000 31 y 16 389 00:19:17,000 --> 00:19:18,680 47 y 10 390 00:19:18,680 --> 00:19:20,140 57 391 00:19:20,140 --> 00:19:24,309 57 es la suma de 392 00:19:24,309 --> 00:19:25,650 estos productos, es decir 393 00:19:25,650 --> 00:19:28,029 mi media 394 00:19:28,029 --> 00:19:29,930 que es 395 00:19:29,930 --> 00:19:32,950 57 partido 396 00:19:32,950 --> 00:19:33,809 del número de datos 397 00:19:33,809 --> 00:19:36,329 ¿qué número de datos era? 22 398 00:19:36,329 --> 00:19:38,690 pues 57 399 00:19:38,690 --> 00:19:40,930 partido de 22 es la media 400 00:19:40,930 --> 00:19:42,750 y esa división 401 00:19:42,750 --> 00:19:44,789 57 entre 22 402 00:19:44,789 --> 00:19:47,089 me da 2,59 403 00:19:47,089 --> 00:19:51,250 2,59 404 00:19:51,250 --> 00:19:55,009 en el examen no haría falta que me pongáis 405 00:19:55,009 --> 00:19:55,609 esta fórmula 406 00:19:55,609 --> 00:19:58,609 si lo que sabemos es interpretar esto. 407 00:19:59,190 --> 00:20:00,589 Si no es interpretarlo, lo pongo directamente. 408 00:20:01,230 --> 00:20:01,390 ¿Vale? 409 00:20:02,730 --> 00:20:07,170 Luego, para la media, yo necesito sumar todos estos productos 410 00:20:07,170 --> 00:20:09,390 y dividirlos entre el número total de datos. 411 00:20:10,130 --> 00:20:13,789 Es decir, estos dos números tengo que dividirlos. 412 00:20:14,329 --> 00:20:14,410 ¿Vale? 413 00:20:14,890 --> 00:20:17,430 Con eso tengo la media. 414 00:20:18,450 --> 00:20:21,109 La moda es el dato que más se repite. 415 00:20:21,109 --> 00:20:40,690 Y el dato que más se repite es el que tiene mayor frecuencia absoluta. ¿Cuál tiene mayor frecuencia absoluta? El 6. El 6 es la mayor frecuencia absoluta. Luego, la moda es el dato que corresponde a esta frecuencia. Es el 2. 416 00:20:40,690 --> 00:20:43,890 Cuando yo me fijo digo, oye, la moda está aquí 417 00:20:43,890 --> 00:20:46,410 Aquí está la moda 418 00:20:46,410 --> 00:20:48,210 ¿Vale? 419 00:20:48,710 --> 00:20:49,950 Pues la moda 420 00:20:49,950 --> 00:20:54,170 La moda es ¿Quién? 421 00:20:55,029 --> 00:20:56,250 El 2, que está 422 00:20:56,250 --> 00:20:59,410 6 veces 423 00:20:59,410 --> 00:21:00,289 ¿Vale? 424 00:21:01,349 --> 00:21:03,329 Es el que tiene mayor frecuencia 425 00:21:03,329 --> 00:21:05,170 Absoluta 426 00:21:05,170 --> 00:21:07,450 ¿Sí? 427 00:21:10,940 --> 00:21:11,579 Vale 428 00:21:11,579 --> 00:21:13,200 Ahora me voy a ir 429 00:21:13,200 --> 00:21:14,960 a calcular 430 00:21:14,960 --> 00:21:16,539 la mediana 431 00:21:16,539 --> 00:21:17,619 ¿vale? 432 00:21:18,859 --> 00:21:21,380 y la mediana, es cierto que hubo en este ejercicio 433 00:21:21,380 --> 00:21:23,579 como se han perdido por ahí decimales 434 00:21:23,579 --> 00:21:24,480 bueno 435 00:21:24,480 --> 00:21:27,380 podríamos encontrarnos con que la mediana 436 00:21:27,380 --> 00:21:28,680 está entre dos datos, yo no le saben 437 00:21:28,680 --> 00:21:31,259 o lo pondré, o intentaré ponerlo para que 438 00:21:31,259 --> 00:21:33,279 que bueno, pues no quede entre dos datos 439 00:21:33,279 --> 00:21:35,200 pero me voy a fijar aquí 440 00:21:35,200 --> 00:21:37,579 en la frecuencia relativa acumulada 441 00:21:37,579 --> 00:21:39,220 la mediana 442 00:21:39,220 --> 00:21:40,839 es el dato que está en el 50% 443 00:21:40,839 --> 00:21:41,900 ¿vale? 444 00:21:43,200 --> 00:21:45,900 Pues yo tengo que ver cuándo paso del 50%. 445 00:21:45,900 --> 00:21:47,599 ¿Cuándo paso del 50%? 446 00:21:47,859 --> 00:21:51,559 Mirad, aquí llego al 4,5, al 22, al 49. 447 00:21:52,240 --> 00:21:53,400 Aquí todavía no llega al 50. 448 00:21:53,539 --> 00:21:56,319 En el siguiente intervalo paso del 50. 449 00:21:56,460 --> 00:21:59,160 Luego, aquí estaría la mediana. 450 00:21:59,559 --> 00:21:59,660 ¿Vale? 451 00:22:00,380 --> 00:22:00,640 Aquí. 452 00:22:01,240 --> 00:22:05,019 Me fijo y aquí estaría, que se corresponde con el 3. 453 00:22:05,720 --> 00:22:06,039 ¿Vale? 454 00:22:06,039 --> 00:22:12,740 La mediana es 3. 455 00:22:13,420 --> 00:22:13,519 ¿Vale? 456 00:22:14,579 --> 00:22:19,519 El dato, el dato que se corresponde con este intervalo. 457 00:22:19,880 --> 00:22:21,819 Un pequeño inciso, ¿vale? 458 00:22:23,200 --> 00:22:27,880 Si alguien se fija muy al detalle, y me fijo en las frecuencias absolutas, 459 00:22:28,000 --> 00:22:30,420 yo aquí he llegado hasta el 11, la mitad de 22 es 11. 460 00:22:31,579 --> 00:22:33,960 Realmente la mediana estaría entre el dato 11 y el 12, 461 00:22:35,119 --> 00:22:36,500 porque yo aquí he perdido decimales. 462 00:22:36,660 --> 00:22:41,480 Como he perdido decimales, claro, aquí me debería de haber salido 0,5, exacto. 463 00:22:41,480 --> 00:23:00,180 En ese caso, la mediana estaría entre los dos y tendría que hacer la media de 2 y 3 y la mediana sería 2 y medio. Si aquí me hubiera dado 50% exacto, ¿vale? Cualquiera de las dos interpretaciones la voy a dar por válida en el caso de que justo nos encontramos ahí, ¿vale? 464 00:23:00,180 --> 00:23:03,559 Porque si yo miro la frecuencia relativa no llego al 50%. 465 00:23:03,559 --> 00:23:07,160 En cambio, si yo me fijo en la acumulada, digo, oye, entre la posición 11 y 12, 466 00:23:08,420 --> 00:23:11,880 luego estoy entre el 2 y el 3, la mediana realmente sería 2,5. 467 00:23:12,880 --> 00:23:14,740 De hecho, sería más preciso decir 2,5. 468 00:23:15,900 --> 00:23:20,640 Más preciso porque aquí no se ha perdido información y en la relativa acumulada sí. 469 00:23:21,740 --> 00:23:21,920 ¿Vale? 470 00:23:23,180 --> 00:23:24,380 Pero es aquí donde yo me fijo. 471 00:23:25,000 --> 00:23:29,279 De hecho, si yo os hubiera preguntado cuál es el percentil 20, 472 00:23:30,180 --> 00:23:33,140 El percentil 20, yo tengo que ver cuándo paso del 20%. 473 00:23:33,140 --> 00:23:37,980 El 20%, pues me fijo. 474 00:23:38,559 --> 00:23:40,420 El 4 no llega todavía. 475 00:23:40,619 --> 00:23:42,099 22, ya me he pasado del 20. 476 00:23:42,220 --> 00:23:43,960 Pues aquí está, en este dato. 477 00:23:44,700 --> 00:23:47,059 Pues el percentil 20, ¿quién sería? 478 00:23:47,880 --> 00:23:49,279 Un 1, ¿vale? 479 00:23:49,940 --> 00:23:53,220 Os pregunto el tercer cuartil, el Q3. 480 00:23:53,220 --> 00:23:55,380 Ese es el 75%. 481 00:23:55,380 --> 00:24:00,160 Los cuartiles son 25%, 50%, 75%. 482 00:24:00,160 --> 00:24:04,700 Pues busca el 75. Con el 72 no ha llegado, pues el siguiente al 90. 483 00:24:05,660 --> 00:24:13,559 Luego el tercer cuartil sería 4. ¿Vale? ¿Sí? Vale. 484 00:24:13,960 --> 00:24:16,460 Con eso tenemos media moda y mediana, que es lo que vimos el otro día. 485 00:24:16,460 --> 00:24:21,259 Ahora, ¿qué tenemos nuevo? Rango, desviación típica y varianza. 486 00:24:22,380 --> 00:24:25,160 El rango es la diferencia entre el dato mayor y el menor. 487 00:24:25,160 --> 00:24:55,240 Es decir, entre el mayor número de libros leídos y el menor número de libros leídos, que es lo que consiste este ejercicio. En nuestro caso, ¿el mayor dato cuál es? 5. ¿Y el menor dato es? 0. Pues el rango, ¿el rango quién es? 5 menos 0, 5. Ese es el rango. El rango es 5, ¿vale? Mayor menos menor. Esta es la parte fácil. 488 00:24:55,240 --> 00:24:57,599 Ahora vamos a ir a 489 00:24:57,599 --> 00:24:59,859 La desviación típica de la varianza 490 00:24:59,859 --> 00:25:02,619 Que es esta fórmula 491 00:25:02,619 --> 00:25:05,200 Puede parecer un poco rollo 492 00:25:05,200 --> 00:25:06,539 Pero, mirad 493 00:25:06,539 --> 00:25:08,759 Yo conozco quién es N 494 00:25:08,759 --> 00:25:09,900 El número total de datos 495 00:25:09,900 --> 00:25:12,440 A ver, aquí, que no se ve bien 496 00:25:12,440 --> 00:25:14,839 Conozco quién es el número total de datos 497 00:25:14,839 --> 00:25:16,519 Sí, es 498 00:25:16,519 --> 00:25:19,180 22 datos, vale, pues este lo conozco 499 00:25:19,180 --> 00:25:20,900 Conozco quién es la media 500 00:25:20,900 --> 00:25:22,559 Esta X con la rayita es la media 501 00:25:22,559 --> 00:25:24,220 Sí, la media la he calculado y es 502 00:25:24,220 --> 00:25:26,079 2,59, ¿no? 503 00:25:26,759 --> 00:25:28,099 Pues me dice que 2,59 504 00:25:28,099 --> 00:25:29,619 al cuadrado. 505 00:25:31,000 --> 00:25:32,000 Y luego va a ser sustituir. 506 00:25:32,619 --> 00:25:34,859 Pero, ¿qué me queda? A mí me falta 507 00:25:34,859 --> 00:25:36,000 este sumatorio. 508 00:25:36,920 --> 00:25:38,160 Este sumatorio de 509 00:25:38,160 --> 00:25:40,180 x sub i al cuadrado por f sub i. 510 00:25:40,180 --> 00:25:42,339 Es decir, sumatorio de los datos al cuadrado 511 00:25:42,339 --> 00:25:43,839 por su frecuencia. 512 00:25:45,039 --> 00:25:45,200 Vale. 513 00:25:46,240 --> 00:25:48,279 Mirad, yo aquí tengo otra columna 514 00:25:48,279 --> 00:25:50,599 donde está el x al cuadrado por la frecuencia. 515 00:25:51,779 --> 00:25:52,740 Que es lo que me viene. 516 00:25:52,740 --> 00:25:55,539 El sumatorio va a ser la suma de toda esta columna 517 00:25:55,539 --> 00:25:58,480 Luego lo que a mí me aparezca 518 00:25:58,480 --> 00:26:01,779 Aquí abajo cuando suma de todo esto de aquí 519 00:26:01,779 --> 00:26:03,559 Lo que me salga de esta casilla 520 00:26:03,559 --> 00:26:06,539 Es lo que yo debo de poner aquí 521 00:26:06,539 --> 00:26:08,480 ¿Vale? 522 00:26:09,759 --> 00:26:12,000 Luego voy a encontrarme una recta 523 00:26:12,000 --> 00:26:14,000 Pero una división y una recta 524 00:26:14,000 --> 00:26:15,339 Pero yo tengo que calcular primero 525 00:26:15,339 --> 00:26:16,420 ¿Quién va aquí? 526 00:26:17,140 --> 00:26:18,819 Para ello debo de completar esta columna 527 00:26:18,819 --> 00:26:19,480 ¿Vale? 528 00:26:20,420 --> 00:26:21,339 Como yo ya tengo 529 00:26:21,339 --> 00:26:24,140 x por f 530 00:26:24,140 --> 00:26:26,200 y ya tengo x cuadrado por f 531 00:26:26,200 --> 00:26:27,019 ¿qué tengo que hacer? 532 00:26:27,640 --> 00:26:29,180 cada dato multiplicarlo 533 00:26:29,180 --> 00:26:31,359 ¿lo tengo que multiplicar por qué? 534 00:26:32,440 --> 00:26:33,339 pues por el x y 535 00:26:33,339 --> 00:26:35,180 me falta, porque solo tengo uno 536 00:26:35,180 --> 00:26:37,920 va al cuadrado, es multiplicado otra vez por x 537 00:26:37,920 --> 00:26:39,859 lo voy a multiplicar 538 00:26:39,859 --> 00:26:40,660 por esta columna 539 00:26:40,660 --> 00:26:42,960 0 por 0 540 00:26:42,960 --> 00:26:44,539 0 541 00:26:44,539 --> 00:26:46,720 1 por 4 542 00:26:46,720 --> 00:26:48,160 4 543 00:26:48,160 --> 00:26:50,279 2 por 12 544 00:26:50,279 --> 00:26:52,920 24 545 00:26:52,920 --> 00:26:54,839 3 por 15 546 00:26:54,839 --> 00:26:57,319 45 547 00:26:57,319 --> 00:26:59,420 4 por 16 548 00:26:59,420 --> 00:27:03,859 64 549 00:27:03,859 --> 00:27:05,920 y 5 por 10 550 00:27:05,920 --> 00:27:08,579 50 551 00:27:08,579 --> 00:27:11,279 ahora, tan solo 552 00:27:11,279 --> 00:27:13,339 tenemos que sumar 553 00:27:13,339 --> 00:27:15,680 tenemos que sumar 0 554 00:27:15,680 --> 00:27:16,759 más 4 555 00:27:16,759 --> 00:27:18,440 más 24 556 00:27:18,440 --> 00:27:20,440 más 45 557 00:27:20,440 --> 00:27:22,259 más 64 558 00:27:22,259 --> 00:27:24,960 y más 50, que me da 559 00:27:24,960 --> 00:27:26,400 187 560 00:27:26,400 --> 00:27:29,140 187 561 00:27:29,140 --> 00:27:31,059 este dato 562 00:27:31,059 --> 00:27:32,460 este 187 563 00:27:32,460 --> 00:27:34,619 es el que va a venir aquí arriba 564 00:27:34,619 --> 00:27:37,359 es decir, yo le voy a calcular 565 00:27:37,359 --> 00:27:38,599 la varianza 566 00:27:38,599 --> 00:27:41,339 y la varianza 567 00:27:41,339 --> 00:27:42,759 voy a copiar la fórmula aquí, ¿vale? 568 00:27:43,140 --> 00:27:45,460 que es el sumatorio de x u y 569 00:27:45,460 --> 00:27:46,839 al cuadrado 570 00:27:46,839 --> 00:27:49,420 por la frecuencia absoluta 571 00:27:49,420 --> 00:27:51,420 dividido entre el número de datos 572 00:27:51,420 --> 00:27:52,900 menos la media al cuadrado 573 00:27:52,900 --> 00:27:56,559 vale, aquí arriba 574 00:27:56,559 --> 00:27:57,579 este sumatorio 575 00:27:57,579 --> 00:28:00,640 es el dato que hemos calculado 576 00:28:00,640 --> 00:28:02,019 es 187 577 00:28:02,019 --> 00:28:04,099 pues sustituyo, digo, esto es igual a 578 00:28:04,099 --> 00:28:06,740 aquí arriba va 187 579 00:28:06,740 --> 00:28:09,220 partido entre el número de datos 580 00:28:09,220 --> 00:28:10,339 ¿cuántos datos tengo? 581 00:28:11,140 --> 00:28:11,779 22 582 00:28:11,779 --> 00:28:13,759 pues entre 22 583 00:28:13,759 --> 00:28:16,259 y menos 584 00:28:16,259 --> 00:28:18,220 lo que valga la 585 00:28:18,220 --> 00:28:21,160 media al cuadrado 586 00:28:21,160 --> 00:28:21,980 ¿quiere la media? 587 00:28:23,180 --> 00:28:38,119 Lo he calculado. 2,59. Vale, pues 2,59, todo ello al cuadrado. Y hay que hacer estas cuentas. Por supuesto que habría calculadoras en el examen. 588 00:28:38,119 --> 00:28:40,859 Y esto sería igual 589 00:28:40,859 --> 00:28:43,579 Hago primero la división 590 00:28:43,579 --> 00:28:46,559 La de 187 entre 22 591 00:28:46,559 --> 00:28:51,740 187 entre 22 592 00:28:51,740 --> 00:28:53,579 Y da 8,5 593 00:28:53,579 --> 00:28:56,519 Menos 594 00:28:56,519 --> 00:28:59,799 Y ahora cojo 2,59 595 00:28:59,799 --> 00:29:02,180 Por 2,59 596 00:29:02,180 --> 00:29:03,779 Va al cuadrado 597 00:29:03,779 --> 00:29:05,240 Y esto es 598 00:29:05,240 --> 00:29:09,980 6,7081 599 00:29:09,980 --> 00:29:13,950 y nos queda una resta 600 00:29:13,950 --> 00:29:16,630 esta resta 601 00:29:16,630 --> 00:29:18,089 8 menos 602 00:29:18,089 --> 00:29:21,410 6,7081 603 00:29:21,410 --> 00:29:22,630 es 604 00:29:22,630 --> 00:29:26,250 1,2919 605 00:29:26,250 --> 00:29:27,670 bueno, pues este numerito 606 00:29:27,670 --> 00:29:29,450 este de aquí 607 00:29:29,450 --> 00:29:31,150 es la varianza 608 00:29:31,150 --> 00:29:31,890 ¿vale? 609 00:29:33,210 --> 00:29:33,569 y 610 00:29:33,569 --> 00:29:36,190 la 611 00:29:36,190 --> 00:29:39,869 la desviación típica es la raíz cuadrada de la varianza 612 00:29:39,869 --> 00:29:41,309 luego 613 00:29:41,309 --> 00:29:43,289 la desviación típica es 614 00:29:43,289 --> 00:29:44,829 la raíz cuadrada de la varianza 615 00:29:44,829 --> 00:29:46,329 fórmula que se verga 616 00:29:46,329 --> 00:29:48,609 ¿y qué sería la raíz cuadrada de qué? 617 00:29:49,549 --> 00:29:52,150 de 1,29 618 00:29:52,150 --> 00:29:54,190 19 619 00:29:54,190 --> 00:29:58,640 y eso es 620 00:29:58,640 --> 00:29:59,940 raíz cuadrada de 621 00:29:59,940 --> 00:30:02,160 1,29 622 00:30:02,160 --> 00:30:02,779 19 623 00:30:02,779 --> 00:30:05,859 1,14 aproximadamente 624 00:30:05,859 --> 00:30:08,059 pues 1,14 625 00:30:08,059 --> 00:30:19,960 Pues esta sería la deducción típica. Esto sería un ejercicio, si yo os preguntara todo, que no quiere decir que en el examen os lo pregunte todo, porque os lleva mucho tiempo hacerlo. 626 00:30:21,579 --> 00:30:32,759 ¿Vale? Entonces, sería un ejercicio con todo lo más completo. ¿Sí? Incluso hemos comentado cómo se calculaban los percentiles y los cuartiles que no lo pedía el ejercicio. 627 00:30:32,759 --> 00:30:35,539 ¿Vale? Entonces, por resumir 628 00:30:35,539 --> 00:30:36,839 Lo primero que hace falta es 629 00:30:36,839 --> 00:30:38,519 Recopilar los datos 630 00:30:38,519 --> 00:30:40,160 Puede que yo tenga el conteo 631 00:30:40,160 --> 00:30:41,759 Y tenga que contarlo 632 00:30:41,759 --> 00:30:43,319 O puede que me den una gráfica 633 00:30:43,319 --> 00:30:45,900 Y con la gráfica yo interpreto 634 00:30:45,900 --> 00:30:47,119 Y saco aquí cuáles son los datos 635 00:30:47,119 --> 00:30:50,559 ¿Vale? Tendré mis datos y mi frecuencia absoluta 636 00:30:50,559 --> 00:30:51,880 ¿Sí? 637 00:30:52,660 --> 00:30:53,000 Sí 638 00:30:53,000 --> 00:30:55,859 A partir de aquí es completar frecuencia absoluta con la acumulada 639 00:30:55,859 --> 00:30:56,579 Que es ir sumando 640 00:30:56,579 --> 00:30:59,140 La relativa es dividir entre el número de datos 641 00:30:59,140 --> 00:31:02,440 Y la acumulada pues igual, cojo el primer dato y ya voy sumando 642 00:31:02,440 --> 00:31:05,900 siempre comprobar que me tiene que dar 643 00:31:05,900 --> 00:31:07,299 pues eso, o 1 644 00:31:07,299 --> 00:31:09,420 o 100% 645 00:31:09,420 --> 00:31:11,880 0,99 646 00:31:11,880 --> 00:31:13,720 es decir, lo más próximo 647 00:31:13,720 --> 00:31:15,799 si yo le hago 0,99 648 00:31:15,799 --> 00:31:17,779 pues parece que la cosa 649 00:31:17,779 --> 00:31:19,400 va más o menos bien calculada 650 00:31:19,400 --> 00:31:21,700 si os sale una cosa muy lejana 651 00:31:21,700 --> 00:31:23,680 os podéis haber equivocado 652 00:31:23,680 --> 00:31:24,079 ¿vale? 653 00:31:24,940 --> 00:31:27,940 para calcular la moda 654 00:31:27,940 --> 00:31:29,940 es el que tiene mayor frecuencia absoluta 655 00:31:29,940 --> 00:31:32,119 para calcular 656 00:31:32,119 --> 00:31:34,400 la media, yo tengo que 657 00:31:34,400 --> 00:31:36,680 multiplicar el dato por su frecuencia 658 00:31:36,680 --> 00:31:38,740 absoluta, el x sub i por f sub i 659 00:31:38,740 --> 00:31:40,519 de todos ellos, ¿vale? 660 00:31:40,940 --> 00:31:42,519 Lo multiplico y aquí abajo tengo 661 00:31:42,519 --> 00:31:44,740 la suma. Y lo que hago después 662 00:31:44,740 --> 00:31:46,579 esta suma la divido entre el número total 663 00:31:46,579 --> 00:31:48,160 de datos, la media. 664 00:31:49,440 --> 00:31:50,259 La mediana 665 00:31:50,259 --> 00:31:52,500 es el segundo cuartil, es lo que ocupa 666 00:31:52,500 --> 00:31:54,440 el 50%, está en el 50% 667 00:31:54,440 --> 00:31:56,559 de los datos. Me fijo 668 00:31:56,559 --> 00:31:58,859 en las frecuencias relativas acumuladas 669 00:31:58,859 --> 00:32:00,519 y busco intervalos que 670 00:32:00,519 --> 00:32:02,960 pase del 50%, ese es el que lo contiene 671 00:32:02,960 --> 00:32:04,920 si me diera justo el 50% 672 00:32:04,920 --> 00:32:06,680 pues entre ese intervalo y el siguiente 673 00:32:06,680 --> 00:32:08,259 debo de hacer la media entre los datos 674 00:32:08,259 --> 00:32:09,160 ¿vale? 675 00:32:10,240 --> 00:32:12,319 ya hemos comentado el caso peculiar 676 00:32:12,319 --> 00:32:13,859 que se nos daba aquí, ¿vale? 677 00:32:16,180 --> 00:32:16,579 ¿percentiles? 678 00:32:16,720 --> 00:32:19,220 pues igual, es buscar el porcentaje que 679 00:32:19,220 --> 00:32:20,680 que se pida 680 00:32:20,680 --> 00:32:21,019 ¿vale? 681 00:32:22,160 --> 00:32:24,420 y luego la parte, bueno, el rango, la diferencia 682 00:32:24,420 --> 00:32:26,039 entre el mayor y el menor de los datos 683 00:32:26,039 --> 00:32:28,759 y luego ya la desviación típica y varianza 684 00:32:28,759 --> 00:32:30,420 necesito hacer esta columna extra 685 00:32:30,420 --> 00:32:35,400 Y el valor que me da, sustituyo en la fórmula 686 00:32:35,400 --> 00:32:38,200 Dividirlo entre el número de datos, entre la n 687 00:32:38,200 --> 00:32:41,279 Y restarle la media que ya he calculado elevada al cuadrado 688 00:32:41,279 --> 00:32:47,480 Y la desviación típica sería la raíz cuadrada de la varianza 689 00:32:47,480 --> 00:32:51,140 Esto como ejercicio más completo 690 00:32:51,140 --> 00:32:55,079 En los apuntes tenéis un montón de ejercicios 691 00:32:55,079 --> 00:32:57,640 Con los que podéis practicar 692 00:32:57,640 --> 00:32:59,339 ¿Vale? Vienen ejercicios 693 00:32:59,339 --> 00:33:01,640 Mirad, por ejemplo 694 00:33:01,640 --> 00:33:08,279 Ahí va para abajo 695 00:33:08,279 --> 00:33:09,559 Pero aquí vienen algunos resueltos 696 00:33:09,559 --> 00:33:11,079 Incluso con pocos datos 697 00:33:11,079 --> 00:33:12,839 Calcula la media y la desviación típica 698 00:33:12,839 --> 00:33:13,839 Esto sin tabla 699 00:33:13,839 --> 00:33:16,519 ¿Vale? Otros con tablas 700 00:33:16,519 --> 00:33:19,359 Recordad que si hablamos de intervalos 701 00:33:19,359 --> 00:33:22,640 Yo tengo que poner cuál va a ser la marca de clase 702 00:33:22,640 --> 00:33:24,480 Que va a ser el punto medio del intervalo 703 00:33:24,480 --> 00:33:25,539 Como comentamos el otro día 704 00:33:25,539 --> 00:33:26,779 Yo en el examen 705 00:33:26,779 --> 00:33:29,500 No lo voy a complicar con intervalos 706 00:33:29,500 --> 00:33:32,119 ¿Vale? O lo daré ya directamente con datos 707 00:33:32,119 --> 00:33:35,740 Y por aquí, más abajo 708 00:33:35,740 --> 00:33:37,400 Esperar, pues viene el ejercicio 709 00:33:37,400 --> 00:33:37,980 Por ejemplo 710 00:33:37,980 --> 00:33:40,619 Pues aquí tienes un montón de datos 711 00:33:40,619 --> 00:33:43,299 Y te dice, calcula el rango y la desviación media 712 00:33:43,299 --> 00:33:44,339 De los datos 713 00:33:44,339 --> 00:33:51,059 Aquí tienes el datos, hace el recuento 714 00:33:51,059 --> 00:33:52,279 Y hace un diagrama de barras 715 00:33:52,279 --> 00:33:53,619 Pero con todo eso podéis calcular 716 00:33:53,619 --> 00:33:57,059 Mirad, datos, dice, calcula la media y la desviación típica 717 00:33:57,059 --> 00:33:57,640 De los datos 718 00:33:57,640 --> 00:34:00,900 Se puede calcular un poco todo 719 00:34:00,900 --> 00:34:03,099 Cogéis cualquiera de estos y podéis calcular 720 00:34:03,099 --> 00:34:05,660 Todo lo que hemos visto anteriormente 721 00:34:05,660 --> 00:34:06,059 ¿Vale? 722 00:34:06,819 --> 00:34:07,839 Incluso viene por aquí 723 00:34:07,839 --> 00:34:10,460 Fijaos este 724 00:34:10,460 --> 00:34:12,920 Y se calcula la media de los datos 725 00:34:12,920 --> 00:34:13,880 Dados por la tabla 726 00:34:13,880 --> 00:34:17,199 Una vez que tenéis el X y la F 727 00:34:17,199 --> 00:34:19,800 O sea, el dato X y la frecuencia absoluta 728 00:34:19,800 --> 00:34:21,599 Ya podéis calcular todo 729 00:34:21,599 --> 00:34:23,239 No solo la media 730 00:34:23,239 --> 00:34:24,260 Todo 731 00:34:24,260 --> 00:34:25,260 Porque al fin y al cabo 732 00:34:25,260 --> 00:34:27,940 Esto es coger 733 00:34:27,940 --> 00:34:30,179 Y tener a mano 734 00:34:30,179 --> 00:34:33,440 bueno, hacerse una tabla 735 00:34:33,440 --> 00:34:34,480 como la de antes 736 00:34:34,480 --> 00:34:38,539 y a rellenar, no tiene más 737 00:34:38,539 --> 00:34:39,960 ¿vale? 738 00:34:41,619 --> 00:34:43,639 entonces, con esto daríamos por finalizada 739 00:34:43,639 --> 00:34:45,940 la parte de estadística 740 00:34:45,940 --> 00:34:47,800 la semana que viene 741 00:34:47,800 --> 00:34:49,239 vemos 742 00:34:49,239 --> 00:34:50,699 la parte de probabilidad 743 00:34:50,699 --> 00:34:53,380 y con ello tendríamos todo visto 744 00:34:53,380 --> 00:34:55,780 para el examen del tercer trimestre