1 00:00:00,560 --> 00:00:11,080 En principio de la clase os voy a preguntar que si alguien tiene algún inconveniente en que la grabemos, pues dejamos de grabar y nos olvidamos del tema. 2 00:00:11,080 --> 00:00:20,100 Y si no, pues supongo que estáis de acuerdo, que nos favorece el que tengáis la grabación de la clase. 3 00:00:20,100 --> 00:00:30,920 ¿De acuerdo? Bueno, pues dicho eso, vamos a verlo. Vamos a compartir la pantalla y vamos a la clase de hoy. 4 00:00:32,899 --> 00:00:48,740 La clase del viernes no la subí porque era idéntica a la del lunes pasado. La del lunes creo que me quedó bastante mejor y en la del viernes hubo un par de interrupciones y no sé, pensé que era mejor. 5 00:00:48,740 --> 00:00:55,140 Mejor dejarla que está porque es que para el caso todo era... 6 00:00:55,140 --> 00:01:04,400 Bueno, en esta evaluación os recuerdo que tenemos el bloque que es de probabilidad estadística. 7 00:01:04,400 --> 00:01:16,400 De estadística hay un tema que es de variables unidimensionales que es el que ocupa la novena quincena y la décima quincena está con distribuciones estadísticas bidimensionales. 8 00:01:16,400 --> 00:01:35,840 Os dije que esto en realidad es un ejercicio, es un ejercicio tipo, yo creo que es un ejercicio bastante asequible, que merece la pena que lo hagáis. 9 00:01:35,840 --> 00:01:45,040 y bueno, además que de vez en cuando tenéis una pista para saber si el ejercicio os ha salido bien o no. 10 00:01:45,260 --> 00:01:48,280 Me refiero sobre todo cuando calculáis el coeficiente de correlación. 11 00:01:50,040 --> 00:01:55,439 Bueno, entonces, el otro día vimos la gran distribución bidimensional, 12 00:01:55,439 --> 00:02:01,200 vimos que no íbamos a ver tablas de doble entrada, o sea, que esto sin frecuencias 13 00:02:01,200 --> 00:02:05,019 y vimos lo que era la nube de puntos 14 00:02:05,019 --> 00:02:08,400 para hacernos una idea de que va la correlación lineal 15 00:02:08,400 --> 00:02:10,280 insisto, lineal 16 00:02:10,280 --> 00:02:15,460 que todo lo que sea lineal es relativo a rectas 17 00:02:15,460 --> 00:02:18,460 a nubes de puntos que se pueden aproximar por rectas 18 00:02:18,460 --> 00:02:22,340 y bueno, las fórmulas que tenéis que saber 19 00:02:22,340 --> 00:02:25,340 son la de la recta de regresión 20 00:02:25,340 --> 00:02:28,840 bueno, para la recta de regresión necesitáis conocer 21 00:02:28,840 --> 00:02:52,280 Lo primero, lo que es la covarianza. La covarianza, si os acordáis, se calcula añadiendo una columna o una fila en la serie de datos, dividiendo entre el número de datos y restando el producto de las medias. De tal forma que conviene que calculeis la media de cada una de las variables con la calculadora. 22 00:02:52,280 --> 00:03:10,180 Bueno, insisto, el que no sepa hacerlo con la calculadora lo tendría que hacer a mano. Yo hice un ejemplo el primer día. Creo que no merece la pena. Os he dejado los dos tutoriales, según la calculadora que utilicéis, los dos más típicos. 23 00:03:10,180 --> 00:03:16,360 O si alguien tiene una calculadora un poco más extraña, pues que me lo diga y ya le busque un tutorial al uso. 24 00:03:19,560 --> 00:03:24,680 La covariación de una distribución bidimensional puede ser positiva o negativa. 25 00:03:25,039 --> 00:03:26,479 Es muy raro que se haga cero. 26 00:03:26,479 --> 00:03:45,639 Y, bueno, si la correlación es positiva, se supone que la correlación entre las dos variables implica que a mayor valor de la X le va a salir mayor valor de la Y. 27 00:03:46,520 --> 00:03:52,539 Esto puede ser con más o menos seguridad dependiendo luego del coeficiente de correlación. 28 00:03:52,539 --> 00:04:18,569 Entonces, esta era en principio la interpretación de la covarianza, si la correlación es positiva o negativa, luego tenéis que saber la fórmula de la recta de regresión, yo me la aprendo muy fácil cogiendo a la x le resto su media, a la y le resto su media y luego esto sí que es un poco más extraño. 29 00:04:18,569 --> 00:04:27,610 La covarianza, que es lo que habéis calculado antes, y abajo se pone el cuadrado de la desviación típica, que esa se ha hecho con un calzado. 30 00:04:28,569 --> 00:04:32,490 Por otra parte, fijaos entre esto y esto, es muy parecido. 31 00:04:33,110 --> 00:04:38,889 La covarianza, para hacer el coeficiente de correlación, la covarianza siempre está en el numerador. 32 00:04:39,329 --> 00:04:45,649 Y aquí en vez de ser el cuadrado de la desviación típica de la X, se multiplican las dos desviaciones típicas que nos han sido. 33 00:04:45,649 --> 00:04:55,490 Es importante, el valor del coeficiente de correlación no puede ser ni más pequeño que menos uno, ni mayor que uno. 34 00:04:55,490 --> 00:04:58,990 Si pasa eso es que el ejercicio no está bien. 35 00:05:00,269 --> 00:05:10,490 Salvo, a veces puede quedar un 1,01 porque ha habido un redondeo y entonces los datos no son exactamente precisos, pero bueno, esto es lo más raro. 36 00:05:10,490 --> 00:05:17,389 Entonces, el coeficiente de correlación es un número que está comprendido entre menos 1 y 1. 37 00:05:18,209 --> 00:05:23,250 Cuanto más se acerca a 1 o a menos 1, la correlación es más fuerte. 38 00:05:24,009 --> 00:05:28,949 Y cuanto más próximo es a 0, la correlación es débil. 39 00:05:33,949 --> 00:05:36,449 Insisto, la correlación es lineal. 40 00:05:36,449 --> 00:05:50,089 Eso quiere decir que no van a estar muy aproximadas las nubes de puntos a una recta, aunque sí pueden adoptar alguna figura, alguna forma que sea parecida. 41 00:05:50,089 --> 00:06:23,930 Bueno, este ejercicio, yo no sé si lo hicimos el otro día, creo que lo hicimos en la clase, pero bueno. Vamos a hacerlo para recordar un poco lo que era el coeficiente de correlación y cómo se puede aplicar a un D. 42 00:06:23,930 --> 00:06:42,649 Esto es la idea intuitiva. Luego, al final, lo que vale en realidad son las cuentas. Las cuentas es el ejercicio que os digo que es en lo que se basa todo el tema. Todo el tema es un ejercicio que suele caer, por supuesto. 43 00:06:42,649 --> 00:06:53,930 Bueno, a ver, aquí nos dice, los coeficientes de correlación de estas distribuciones bidimensionales son en valor absoluto 0,55, 0,75, 0,87 y 0,96. 44 00:06:55,290 --> 00:07:01,970 Entonces, dice, asigna cada ruido cambiando el signo cuando proceda, porque aquí dice en valor absoluto. 45 00:07:01,970 --> 00:07:15,519 A ver, yo diría que los términos que se aproximan más a una recta son la nube de puntos que se parecen más a una recta, yo diría que es esto. 46 00:07:17,199 --> 00:07:23,199 Entonces, aquí el valor absoluto se tiene que acercar lo más posible a 1. 47 00:07:23,639 --> 00:07:26,899 El valor más cerca a 1 a 1 es 0,96. 48 00:07:27,680 --> 00:07:29,220 ¿Pero qué es lo que ocurre? 49 00:07:29,220 --> 00:07:33,279 Que aquí esta recta tiene pendiente negativa. 50 00:07:33,600 --> 00:07:42,939 La correlación es negativa, por lo cual yo diría que este es el coeficiente de correlación que está asociado a esta nube de puntos. 51 00:07:44,199 --> 00:07:55,259 Después de este, pues yo diría que lo que más se parece a una recta, a la nube de puntos que se aproxima más a una recta, yo diría que es este. 52 00:07:55,259 --> 00:08:04,540 Esto hay gente que lo hace muy bien a ojo, a mí no me sale muy bien, pero vamos, yo diría que si tomo esta recta que es más dispersa. 53 00:08:08,660 --> 00:08:14,519 Aquí los puntos están más separados y aquí los puntos están muy separados. 54 00:08:14,779 --> 00:08:20,579 Yo diría que aquí esta recta debería ser positiva, pero alguno podría decir que se acerca más una de aquí. 55 00:08:21,699 --> 00:08:25,459 Entonces, ya os digo, esto es un poco subjetivo. 56 00:08:25,459 --> 00:08:28,600 bueno, la segunda 57 00:08:28,600 --> 00:08:30,360 correlación más fuerte es esta 58 00:08:30,360 --> 00:08:32,740 y vuelve a ser negativa 59 00:08:32,740 --> 00:08:34,919 pues menos 0,87 60 00:08:34,919 --> 00:08:38,419 yo aquí sí que diría 61 00:08:38,419 --> 00:08:40,039 que la correlación es positiva 62 00:08:40,039 --> 00:08:41,840 es 0,75 63 00:08:41,840 --> 00:08:44,519 no es tan fuerte 64 00:08:44,519 --> 00:08:45,340 como la anterior 65 00:08:45,340 --> 00:08:46,919 más o menos 66 00:08:46,919 --> 00:08:50,080 sigue la trayectoria más recta 67 00:08:50,080 --> 00:08:51,700 pero para nada 68 00:08:51,700 --> 00:08:53,899 se parece eso más recta 69 00:08:53,899 --> 00:09:00,259 Y aquí está muchísimo, esto ya diríamos, de 0.5 para abajo la correlación es débil. 70 00:09:01,500 --> 00:09:03,679 Entonces esta es media tirando a débil. 71 00:09:07,000 --> 00:09:10,440 Entonces con este color, pues estaría que es menos 0.5. 72 00:09:11,759 --> 00:09:14,740 Esto es la idea. ¿Por qué os doy esta idea? 73 00:09:15,340 --> 00:09:22,899 Pues porque yo creo que si os doy una recta de regresión con esta nube de puntos o con esta nube de puntos 74 00:09:22,899 --> 00:09:42,100 Y dais un valor intermedio, que es lo que vamos a hacer al final, pues aquí veis que la estimación es bastante fiable. En cambio aquí es menos fiable. No creo que sea demasiado mala, pero no es fiable. Pero aquí se ve que los datos están mucho más dispersos. 75 00:09:42,100 --> 00:10:06,840 Bueno, pues vamos al caso que es, vamos ya al ejercicio. Voy a hacer uno porque este es exactamente, a mí esto es lo que me gusta preguntar en un examen, exactamente esto. 76 00:10:06,840 --> 00:10:24,240 No están dos series de datos, en este caso de edades y pesos, y se obtienen determinados resultados. Y lo que queremos hacer es la estimación, una estimación y ver si es fiable esa estimación. 77 00:10:24,240 --> 00:10:39,659 A mí eso es lo que me doy mucha importancia, porque le veis la utilidad. Cuando hacéis una estimación, ¿va a ser buena o tenéis que decir, bueno, espero que sea esto, pero tampoco os esperéis gran precisión, ¿no? 78 00:10:39,659 --> 00:10:42,519 vamos a ver 79 00:10:42,519 --> 00:10:45,159 se observan las edades de 5 niñas 80 00:10:45,159 --> 00:10:47,139 y sus pesos respectivos y se obtienen 81 00:10:47,139 --> 00:10:47,679 los siguientes 82 00:10:47,679 --> 00:10:52,730 entonces, yo tengo una serie 83 00:10:52,730 --> 00:10:53,450 de datos 84 00:10:53,450 --> 00:10:56,309 que es X, de la cual 85 00:10:56,309 --> 00:10:58,470 puedo calcular una media y una desmedida 86 00:10:58,470 --> 00:11:00,570 y eso como lo hago 87 00:11:00,570 --> 00:11:01,429 con el cauto 88 00:11:01,429 --> 00:11:04,570 si la tenéis a mano 89 00:11:04,570 --> 00:11:06,389 y podéis hacerla conmigo 90 00:11:06,389 --> 00:11:08,629 estupendo, si tenéis el otro 91 00:11:08,629 --> 00:11:10,049 modelo, pues 92 00:11:10,049 --> 00:11:13,769 También podréis hacerlo si ya habéis visto el tutorial. 93 00:11:17,570 --> 00:11:20,409 Tengo cinco niños. 94 00:11:21,269 --> 00:11:24,409 Primero tengo que poner la calculadora en modo estadístico. 95 00:11:24,870 --> 00:11:25,870 Yo ahora mismo la tengo. 96 00:11:26,409 --> 00:11:31,389 Tengo que borrar los datos anteriores, que serían SID, LIAB o NO. 97 00:11:32,409 --> 00:11:34,889 Pero igual, se supone que no tengo datos. 98 00:11:34,889 --> 00:11:48,649 y entonces pongo 2m más, 4,5m más, 6m más, 7,2m más, 8m más. 99 00:11:48,769 --> 00:11:58,529 Me pone la calculadora n igual a 5, le doy a SIF 2, 1 y la media me sale 5,54. 100 00:11:58,529 --> 00:12:07,629 Aquí siempre os diré, coged siempre dos decimales. Esto como sale 5,54 exacto, pongo igual. 101 00:12:08,450 --> 00:12:16,830 Pero a la hora de hacer la desviación típica, la desviación típica generalmente no sale exacta, sale aproximadamente 2,13. 102 00:12:16,830 --> 00:12:21,409 Si sale 2,13, pongo el signo de aproximado. 2,13. 103 00:12:21,409 --> 00:12:35,029 Esto serían años. Esos niños tienen una media de 5,54 años y una desviación típica de 2 puntos. 104 00:12:35,029 --> 00:12:54,210 Lo que estoy viendo es si el peso va aumentando con la edad según una recta o la cosa se dispara o se queda una cosa más parecida a una parábola o una cosa un poco más parecida a una función logarítmica. 105 00:12:54,210 --> 00:13:11,429 Bueno, entonces yo tengo una serie de datos que es X y ahora tengo una serie de datos Y. Borro los datos. Os voy diciendo las cosas en las que soléis olvidar. La primera, que no se os olvide, borrar los datos. 106 00:13:11,429 --> 00:13:29,909 SIF, CLIA, 1, les sale igual, ya tengo 0 datos y ahora 15, N más, 19, N más, 25, N más, 33, N más y 34. 107 00:13:29,909 --> 00:13:31,830 a muchos se os olvida 108 00:13:31,830 --> 00:13:33,330 dar el último M más 109 00:13:33,330 --> 00:13:35,269 en la calculadora 110 00:13:35,269 --> 00:13:37,850 en la pantalla pone N igual a 5 111 00:13:37,850 --> 00:13:39,850 y ahora la media sería 112 00:13:39,850 --> 00:13:41,870 6, 2, 1 113 00:13:41,870 --> 00:13:46,070 aquí hay veces que se os olvida darle al igual 114 00:13:46,070 --> 00:13:47,909 25,2 115 00:13:47,909 --> 00:13:53,950 y la desviación típica 116 00:13:53,950 --> 00:13:55,570 de la I pues hago 117 00:13:55,570 --> 00:13:56,690 6, 2, 2 118 00:13:56,690 --> 00:14:00,110 y me sale 7,40 119 00:14:00,110 --> 00:14:02,149 esto sería 120 00:14:02,149 --> 00:14:02,950 kilogramos 121 00:14:02,950 --> 00:14:14,269 Entonces, para hacer la covarianza, tengo aquí que hacer la columna, bueno, en este caso la fila, xy por yy. 122 00:14:14,529 --> 00:14:17,210 Tengo que ir multiplicando. 2 por 15, 30. 123 00:14:18,669 --> 00:14:25,669 4,5 por 19, 85,5. 124 00:14:27,049 --> 00:14:33,049 6 por 25, 150. 125 00:14:34,490 --> 00:14:41,539 7,2 por 33, 236. 126 00:14:41,539 --> 00:15:01,009 237,6 y 8 por 34 que sería 250. Sumo todos estos datos. Esto se llama la suma de x y por y sub i. 127 00:15:01,009 --> 00:15:16,389 A mi me sale 272 más 237,6 más 150 más 85,5 más 30. 128 00:15:17,629 --> 00:15:20,309 Y me sale 775,1. 129 00:15:23,559 --> 00:15:27,000 Estos son todos los cálculos previos a todo lo que me va a meter. 130 00:15:28,000 --> 00:15:29,679 Ahora, ¿cómo hago la covarianza? 131 00:15:29,679 --> 00:15:55,409 Pues la covarianza consiste en tomar esa suma que nos ha salido, 775,1, dividir entre el número de datos, que son 5, y restarle el producto de las medias, que son 5,54 por 25,2. 132 00:15:55,409 --> 00:16:12,450 Hago esto. La covarianza no tiene unidades porque mezcla años con kilos. 775,1 dividido entre 5, menos 5,54 por 5,2. 133 00:16:12,450 --> 00:16:28,389 Me sale 15, aproximadamente, 15,41. ¿Sí? Entonces, ya puedo hacer todas las pruebas. 134 00:16:28,389 --> 00:16:44,750 En el apartado A, estos son los cálculos previos, apartado A, coeficiente de correlación. El coeficiente de correlación es la covarianza partido por el producto de las desviaciones típicas. 135 00:16:44,750 --> 00:17:05,009 Pues ya está, 15,41 dividido entre 2,13 por 7,49. Acordaos que aquí con la calculadora que tenéis vosotros hay que hacerlo con pánico. 136 00:17:05,009 --> 00:17:16,809 Voy a hacer con la calculadora que tengo aquí, para que no tengáis ningún fallo, porque esto tiene que salir un número que está entre menos uno y uno. 137 00:17:16,809 --> 00:17:30,410 A ver, sería 15,41 dividido entre, abrís paréntesis, 2,13 por 7,41. 138 00:17:30,410 --> 00:17:45,170 Y esto sale 0,97 aproximadamente, aproximadamente 0,97. Como veis es menor que 1, con lo cual yo supongo que está bien. 139 00:17:48,230 --> 00:17:57,250 Bueno, esto me dice que la correlación es muy fuerte, porque se acerca muy fuerte y positiva. 140 00:17:57,250 --> 00:18:11,039 O sea, que entre los 2 y los 8 años parece que los pesos van subiendo como en línea recta y parece que se va a poder hacer una bonanza. 141 00:18:12,000 --> 00:18:16,140 Bueno, el apartado D dice ¿qué peso correspondería a un niño de 5 años? 142 00:18:16,799 --> 00:18:26,079 Para un niño de 5 años lo que tengo que hacer es, acordaos, como un acuerdo de la fórmula de la recta de progresión. 143 00:18:26,079 --> 00:18:41,579 A y le resto su media, a x le resto su media y aquí la pendiente de la recta hemos dicho que era la covarianza partido por la desviación típica de x al cuadrado, que es lo mismo que la varianza. 144 00:18:41,579 --> 00:19:02,390 Bueno, pues aquí sustituís y cogéis y igual a sigma xy es 15,41 partido por la desviación típica que es 2,13 al cuadrado por x. 145 00:19:02,390 --> 00:19:07,559 X es igual a 5 146 00:19:07,559 --> 00:19:13,220 ¿Qué peso le corresponde 147 00:19:13,220 --> 00:19:14,940 al número de 5X? 148 00:19:15,420 --> 00:19:17,380 Pues hago 5 menos 149 00:19:17,380 --> 00:19:19,140 la media de la X que es 150 00:19:19,140 --> 00:19:23,180 5,50 y que no se os olvide 151 00:19:23,180 --> 00:19:24,920 que tenéis aquí una cosa razonable 152 00:19:24,920 --> 00:19:26,779 que esto que está restando 153 00:19:26,779 --> 00:19:29,140 va a pasar 154 00:19:29,140 --> 00:19:32,569 subido, o sea que aquí sería 155 00:19:32,569 --> 00:19:36,789 la media de la X 156 00:19:36,789 --> 00:19:38,109 que es 25,2 157 00:19:38,109 --> 00:19:40,890 Esto lo hacemos con la calculadora. 158 00:19:40,890 --> 00:20:14,210 11,91 dividido entre 2,13 al cuadrado por 5 menos 5,54 más 25,2 y me sale 23,37. 159 00:20:14,210 --> 00:20:17,670 3,37 160 00:20:17,670 --> 00:20:20,650 por coherencia redondea los dos decimales 161 00:20:20,650 --> 00:20:22,369 hace buenos redondeos 162 00:20:22,369 --> 00:20:25,089 tenéis que saber si se redondea a 36 163 00:20:25,089 --> 00:20:28,450 por último 164 00:20:28,450 --> 00:20:31,430 ¿es fiable la estimación? 165 00:20:33,809 --> 00:20:35,569 pues vamos a ver 166 00:20:35,569 --> 00:20:37,349 primera cosa 167 00:20:37,349 --> 00:20:39,890 el valor de x 168 00:20:39,890 --> 00:20:43,230 x es igual a 5 169 00:20:43,230 --> 00:20:45,470 es un valor 170 00:20:45,470 --> 00:20:47,410 entre 171 00:20:47,410 --> 00:20:49,369 2 y 8. 172 00:20:50,250 --> 00:20:51,769 Si yo pusiera, por ejemplo, 173 00:20:51,890 --> 00:20:53,410 x igual a 95, 174 00:20:54,269 --> 00:20:55,950 pues una persona de 95 175 00:20:55,950 --> 00:20:58,029 años que debe saber yo lo que va a saber 176 00:20:58,029 --> 00:20:58,369 el otro. 177 00:20:59,670 --> 00:21:01,650 Eso se llama extrapolar. 178 00:21:02,670 --> 00:21:03,349 Esto es solamente 179 00:21:03,349 --> 00:21:05,890 un poder. Esto, en principio, 180 00:21:05,890 --> 00:21:06,589 parece que 181 00:21:06,589 --> 00:21:09,789 los valores de las edades 182 00:21:09,789 --> 00:21:11,049 están entre 2 y 8. 183 00:21:11,609 --> 00:21:12,849 Y, por otra parte, 184 00:21:13,230 --> 00:21:33,750 El coeficiente de correlación es 0,97. Por lo cual, la correlación es muy fuerte. Esto se acerca muchísimo a 1. Muy fuerte. Entonces, yo sabiendo estas dos cosas, yo diría que es fiable. 185 00:21:33,750 --> 00:21:45,869 Es fiable. ¿Puede haber fallos? Sí, pero yo diría que es bastante probable que nos acerquemos bastante al peso de este niño. 186 00:21:45,869 --> 00:21:50,509 bueno, pues esto es 187 00:21:50,509 --> 00:21:52,349 este es el ejercicio 188 00:21:52,349 --> 00:21:53,190 típico 189 00:21:53,190 --> 00:22:00,349 si alguno lo tiene hecho 190 00:22:00,349 --> 00:22:02,470 ya de la semana pasada, que es posible 191 00:22:02,470 --> 00:22:04,990 es repetirlo 192 00:22:04,990 --> 00:22:05,950 porque es que es lo mismo 193 00:22:05,950 --> 00:22:08,589 y ya a partir de ahí que hagáis uno o dos 194 00:22:08,589 --> 00:22:10,549 y que, vamos 195 00:22:10,549 --> 00:22:12,609 los que necesitéis hasta que os salga 196 00:22:12,609 --> 00:22:13,910 porque este ejercicio 197 00:22:13,910 --> 00:22:16,250 es muy asequible y os tiene que salir. 198 00:22:16,769 --> 00:22:16,930 ¿Vale? 199 00:22:18,049 --> 00:22:19,250 Bueno, dicho eso, 200 00:22:19,990 --> 00:22:22,329 la próxima quincena 201 00:22:22,329 --> 00:22:23,910 vamos a 202 00:22:23,910 --> 00:22:27,910 empezar el tema de probabilidad. 203 00:22:29,549 --> 00:22:31,329 En esos temas de probabilidad 204 00:22:31,329 --> 00:22:32,910 ya estamos cambiando bastante 205 00:22:32,910 --> 00:22:35,910 de tercio. 206 00:22:37,109 --> 00:22:37,950 Con lo cual, 207 00:22:38,269 --> 00:22:39,970 hoy quería aprovechar 208 00:22:39,970 --> 00:22:42,029 para hacer algunos ejercicios de repaso 209 00:22:42,029 --> 00:22:45,470 para que recordéis lo fundamental de las unidades de ejercicio. 210 00:22:45,829 --> 00:22:46,130 ¿De acuerdo? 211 00:22:48,170 --> 00:22:51,529 Entonces, esto espero que os cueste ya también menos 212 00:22:51,529 --> 00:22:56,009 y que me digáis. 213 00:22:56,509 --> 00:22:57,910 Bueno, vamos a ver. 214 00:22:58,250 --> 00:23:01,470 Aquí se han examinado 100 lavadoras 215 00:23:01,470 --> 00:23:04,450 de distintas marcas comerciales 216 00:23:04,450 --> 00:23:07,869 y se ha notado el número de averías que ha tenido a lo largo de 10 años. 217 00:23:10,250 --> 00:23:10,349 ¿Sí? 218 00:23:10,910 --> 00:23:12,250 Bueno, primera cosa. 219 00:23:12,750 --> 00:23:13,750 Primera cosa. 220 00:23:13,789 --> 00:23:31,150 Esto es XY y esto es su frecuencia. No es que en una lavadora de cero averías tenga que esto ha sido 30 años. 221 00:23:31,150 --> 00:23:43,410 Yo lo que estoy diciendo es que aquí hay 30 lavadoras que han tenido cero averías. 28 que han tenido una, 17 que han tenido dos, 15 que han tenido tres y 10 que han tenido seis. 222 00:23:44,089 --> 00:23:52,630 Cuidado con esto cuando tengáis una tabla que veáis lo primero, si esto es una distribución unidimensional o bidimensional. 223 00:23:52,990 --> 00:23:54,930 En este caso es unidimensional. 224 00:23:58,730 --> 00:23:59,849 Bueno, ¿por qué lo sé? 225 00:24:00,890 --> 00:24:03,650 Pues porque estas son las frecuencias. 226 00:24:04,329 --> 00:24:09,289 No es lo mismo el otro, que era un niño que tenía tantos años y su peso era este. 227 00:24:12,109 --> 00:24:15,849 Eran dos datos distintos que habíamos recogido de un mismo individuo. 228 00:24:15,849 --> 00:24:38,630 Estos son cien balabadoras y estamos viendo qué datos está repitiendo cada vez. Entonces, llegado aquí y alguien me ha escrito con la siguiente. La media y la desviación típica. Si la hago con la calculadora, ¿tengo que escribir algo? La respuesta es no. Y ya os digo, podéis hacerlo como queráis. 229 00:24:38,630 --> 00:24:40,990 ahora bien 230 00:24:40,990 --> 00:24:43,170 que lo hacéis con calculadora 231 00:24:43,170 --> 00:24:44,910 es que lo siento 232 00:24:44,910 --> 00:24:46,650 porque es que en esta calculadora 233 00:24:46,650 --> 00:24:48,430 no sé por qué no funciona 234 00:24:48,430 --> 00:24:50,869 ah bueno 235 00:24:50,869 --> 00:24:52,730 no, es que este es el otro tipo 236 00:24:52,730 --> 00:24:54,890 de calculadora, entonces no os puedo 237 00:24:54,890 --> 00:24:56,970 explicar cómo se hace con esta calculadora 238 00:24:56,970 --> 00:24:58,589 que creo que era la más complicada 239 00:24:58,589 --> 00:25:00,569 bueno, entonces 240 00:25:00,569 --> 00:25:02,849 yo voy a hacer con la calculadora 241 00:25:02,849 --> 00:25:04,190 mía, la que tengo aquí 242 00:25:04,190 --> 00:25:06,549 la media y la desviación típica 243 00:25:06,549 --> 00:25:08,329 si lo hacéis con calculadora 244 00:25:08,329 --> 00:25:18,900 media y desviación 245 00:25:18,900 --> 00:25:25,019 típica. Si lo hacéis con 246 00:25:25,019 --> 00:25:29,750 calculadora, solo tenéis 247 00:25:29,750 --> 00:25:31,589 que escribir el resultado. 248 00:25:32,730 --> 00:25:33,829 Entonces, la media 249 00:25:33,829 --> 00:25:35,430 de la X y 250 00:25:35,430 --> 00:25:37,630 la desviación típica de la X. 251 00:25:38,529 --> 00:25:39,809 Y ahora, ¿qué diferencia 252 00:25:39,809 --> 00:25:41,809 hay con los de estadística 253 00:25:41,809 --> 00:25:43,289 unidimensional? 254 00:25:43,950 --> 00:25:44,809 Primera cosa, 255 00:25:45,589 --> 00:25:47,470 quiero hacerme de desviación típica 256 00:25:47,470 --> 00:25:49,029 o recuerdo, SIF 257 00:25:49,029 --> 00:25:51,670 CLIAR, SIF 9, le dais a 1. 258 00:25:52,829 --> 00:26:16,109 Ya están todos los datos borrados. Y ahora, con esta calculadora, que no es la otra, a ver, ¿cómo hago la media? A ver, tengo con cero averías, pongo cero, y ahora, para poner que hay 30 lavadoras que tienen cero averías, tengo que darle a SIF y a la coma. 259 00:26:16,109 --> 00:26:19,049 sale un punto y una coma en la pantalla 260 00:26:19,049 --> 00:26:20,470 y pongo 30 261 00:26:20,470 --> 00:26:22,849 si ahora le doy a n más 262 00:26:22,849 --> 00:26:25,130 me pone n igual a 263 00:26:25,130 --> 00:26:27,150 30, ¿por qué? porque he metido 264 00:26:27,150 --> 00:26:28,869 30 datos de golpe 265 00:26:28,869 --> 00:26:30,769 ahora quiero meter 266 00:26:30,769 --> 00:26:32,430 que con una avería 267 00:26:32,430 --> 00:26:35,210 o sea, uno, hay 28 268 00:26:35,210 --> 00:26:36,630 lavadoras, pues le doy 269 00:26:36,630 --> 00:26:39,390 shift coma 28 270 00:26:39,390 --> 00:26:41,190 le doy a n más 271 00:26:41,190 --> 00:26:43,170 y os pondrá 58 272 00:26:43,170 --> 00:26:44,329 ¿por qué 58? 273 00:26:44,329 --> 00:27:08,190 Pues las 30 primeras y estas 28, 58. Continúo con 2, 6, 17. M más. Me salen 75. 3, 6, 15. M más. Me salen 90. 274 00:27:08,190 --> 00:27:34,230 Y por último, 6, 5, 10 en menos. Y me salen 100 datos. Es precisamente las simuladoras que me salen. O sea, que todo esto parece que está correcto. Y ahora le doy así, 2, 1. Igual, que no se os olvide, y sale 1,67 averías por término medio. El promedio es 1,67. 275 00:27:34,230 --> 00:28:00,289 Y ahora, se espera que después de dos años, pues que, vamos, un poco antes de dos años, sea la primera variable. Y ahora, la desviación típica sería, si 2, le dais al 2, al igual, y sale aproximadamente 1,77. 276 00:28:00,289 --> 00:28:21,049 Le pongo 1,77. Como veis, la media no es muy alta y la desviación típica en relación con la media es bastante alta. O sea, hay lavadoras que posiblemente se estropeen muy pronto y otras que van a tardar, pues, tres años por lo menos. 277 00:28:21,049 --> 00:28:23,250 bueno y ahora 278 00:28:23,250 --> 00:28:24,869 ¿cómo hago la mediana y la moda? 279 00:28:25,809 --> 00:28:27,529 pues para hacer la mediana y la moda 280 00:28:27,529 --> 00:28:36,430 para hacer la mediana y la moda 281 00:28:36,430 --> 00:28:38,130 pues bueno, la moda 282 00:28:38,130 --> 00:28:38,990 se ve 283 00:28:38,990 --> 00:28:41,569 que es cero averías 284 00:28:41,569 --> 00:28:48,910 porque es el valor 285 00:28:48,910 --> 00:28:51,230 la frecuencia mayor 286 00:28:51,230 --> 00:28:52,230 que estrella 287 00:28:52,230 --> 00:28:54,509 y para hacer la mediana 288 00:28:54,509 --> 00:28:57,269 a mí me gusta más ponerla en columnas 289 00:28:57,269 --> 00:28:58,829 estos ya son mías 290 00:28:58,829 --> 00:29:01,630 a ver, esto sería el número de averías 291 00:29:01,630 --> 00:29:23,170 Esto sería la frecuencia. Entonces, cogería la frecuencia acumulada. Número de averías. 0, 1, 2, 3 y 6. Frecuencia. 30, 28, 17, 15 y 10. 292 00:29:23,170 --> 00:29:46,269 Y ahora, las acumuladas acordadas. Cero averías, 30 lavadoras. Cero o una avería, 30 más 28, 58 lavadoras. Cero o una o dos averías, 58 más 17, 75 lavadoras. Hasta tres averías serían 90 y hasta cuatro averías, hasta seis averías serían 100. 293 00:29:46,269 --> 00:30:20,640 ¿Sí? Entonces, si yo ordeno de menor a mayor el término medio, bueno, los términos medios de 100 elementos, pues acordaos que son, como el número es par, hay dos. 294 00:30:20,640 --> 00:30:51,849 Son el 50 y el 51. Los dos están aquí. Los dos están, valen uno. Entonces, la mediana vale uno. 295 00:30:51,849 --> 00:31:08,309 O sea, la mitad de las lavadoras van a tener menos de una avería o una avería y la otra mitad menos de una avería o menos, ¿vale? Pues esta es la idea de Borobudur. 296 00:31:08,309 --> 00:31:42,019 Este es el repaso de cómo se calculan las medidas de centralización y, bueno, aunque no lo pide, recuerdo que el rango es el mayor valor, valor menos el menor, pues sería 6 menos 0, que es 6. 297 00:31:42,019 --> 00:32:07,359 La mediana también son averías, una avería y aquí, he equivocado, porque la media y la desviación típica también son averías. 298 00:32:07,359 --> 00:32:15,279 O sea que en 10 años la media de averías es 1,63. 299 00:32:15,279 --> 00:32:27,329 Bueno, pues esto es un ejercicio básico de parametrización y dispersión. 300 00:32:27,329 --> 00:32:46,359 Bueno, si veis el examen del curso pasado, en este algo creo que había que calcular. Vamos, son los tres ejercicios típicos. 301 00:32:46,359 --> 00:32:52,460 Este es un ejercicio de regresión. Vamos a hacerlo. 302 00:32:59,559 --> 00:33:11,920 La siguiente tabla relaciona las horas dedicadas al estudio diario y el número de suspensos que obtiene un alumno a final de curso. 303 00:33:11,920 --> 00:33:15,579 Y se calcula la covarianza, el coeficiente de correlación. 304 00:33:16,220 --> 00:33:18,079 Bueno, pues esto ya os digo. 305 00:33:18,519 --> 00:33:22,299 De la forma más rápida posible lo vamos a ir haciendo. 306 00:33:22,880 --> 00:33:24,380 A ver, cuestiones previas. 307 00:33:24,500 --> 00:33:34,200 Tengo que calcular la media de la X, la media de la Y, la desviación típica de la X y la desviación típica de la Y. 308 00:33:36,640 --> 00:33:39,839 Esto seguramente será aproximado con dos decimales. 309 00:33:39,839 --> 00:33:43,319 entonces, esto sé que es un ejercicio 310 00:33:43,319 --> 00:33:45,519 de correlación, porque esto es X 311 00:33:45,519 --> 00:33:48,839 y esto es Y, no son frecuencias 312 00:33:48,839 --> 00:33:51,180 esto quiere decir que hay un alumno 313 00:33:51,180 --> 00:33:54,720 aquí, a ver, hay 1, 2, 3 314 00:33:54,720 --> 00:34:00,240 4, 5, 6, 7 y 8 datos 315 00:34:00,240 --> 00:34:05,930 ¿no? entonces se supone 316 00:34:05,930 --> 00:34:09,130 que es un alumno que si estudia a hacer horas 317 00:34:09,130 --> 00:34:12,130 suspende 7, si estudia a una 318 00:34:12,130 --> 00:34:14,730 suspender 7, suspender 2, suspender 5 319 00:34:14,730 --> 00:34:16,369 y ya estudiando 6 horas 320 00:34:16,369 --> 00:34:17,690 o 7 horas luego 321 00:34:17,690 --> 00:34:18,869 como pudiera 322 00:34:18,869 --> 00:34:21,769 suspendería hacer 323 00:34:21,769 --> 00:34:24,269 acordaos, número de datos 324 00:34:24,269 --> 00:34:24,889 8 325 00:34:24,889 --> 00:34:28,389 bueno, entonces 326 00:34:28,389 --> 00:34:29,269 nos ponemos 327 00:34:29,269 --> 00:34:32,050 directamente con la calculadora 328 00:34:32,050 --> 00:34:34,110 ya os digo que 329 00:34:34,110 --> 00:34:35,210 lo voy haciendo 330 00:34:35,210 --> 00:34:37,690 a ver, mirad 331 00:34:37,690 --> 00:34:39,909 como no he guardado los datos, me sabía que tenía 332 00:34:39,909 --> 00:34:40,989 100 datos 333 00:34:40,989 --> 00:34:43,150 ahora creo que ya está 334 00:34:43,150 --> 00:34:45,469 0 m más 335 00:34:45,469 --> 00:34:47,309 1 m más 336 00:34:47,309 --> 00:34:49,030 2 m más 337 00:34:49,030 --> 00:34:50,030 3 m más 338 00:34:50,030 --> 00:34:51,389 4 m más 339 00:34:51,389 --> 00:34:54,150 5 m más 340 00:34:54,150 --> 00:34:55,250 6 m más 341 00:34:55,250 --> 00:34:56,210 7 m más 342 00:34:56,210 --> 00:34:57,530 me salen muchos datos 343 00:34:57,530 --> 00:35:01,489 la media es 3,5 344 00:35:01,489 --> 00:35:03,050 que es lo lógico entre 0 y 7 345 00:35:03,050 --> 00:35:04,349 la media es 0,5 346 00:35:04,349 --> 00:35:06,130 es 3,5 347 00:35:06,130 --> 00:35:08,230 esto horas 348 00:35:08,230 --> 00:35:10,610 y la desviación típica sería 349 00:35:10,610 --> 00:35:14,769 Así, 2, 2, que aproximadamente es 2,20. 350 00:35:15,449 --> 00:35:19,750 Esto lo hago rápido porque se supone que lo vais a hacer también vosotros con la calculadora. 351 00:35:20,849 --> 00:35:22,789 Y ahora cojo los datos. 352 00:35:22,789 --> 00:35:40,010 Y pongo 7 y más, 7 y más, 5 y más, 4 y más, 1 y más, 1 y más, 0 y más, 0 y más. 353 00:35:40,010 --> 00:35:55,150 Me salen de nuevo 8 datos y ahora le doy 2, 1 a la media. Sale aproximadamente, cuidado, son dos decimales, pues 3, como pone 125 es 3,13. 354 00:35:55,150 --> 00:36:13,530 Y la desviación típica, si 2, 2, me doy al igual y me sale aproximadamente 2,80. Conviene que pongáis el último decimal, porque así sabéis que habéis aproximado a las centésimas. Estos son suspensos. 355 00:36:13,530 --> 00:36:46,739 Y ahora, bueno, voy a colocar aquí, no me he dado cuenta aquí de dejar un espacio, los productos 0x7, 0, 7x1, 7, 2x5, 10, 3x4, 12, 4x1, 4, estas son las x y por y sub i. 356 00:36:49,199 --> 00:36:53,179 5x1, 5, 6x0, 0 y 7x0, 0. 357 00:36:53,639 --> 00:37:04,539 Entonces, si sumo, la suma de más xy por y sub i, esto se puede hacer mentalmente, 22, 29, 33, 38. 358 00:37:07,119 --> 00:37:12,659 Entonces, ya dice, calcula la covarianza. Bueno, pues ya puedo hacer la covarianza. 359 00:37:12,659 --> 00:37:30,840 La covarianza es este número, 38, dividido entre el número de datos, que es 8, menos el producto de las medias, que es 3,5 por 3,13. 360 00:37:30,840 --> 00:37:57,469 Esto aproximadamente vale... 38 dividido entre 8, menos 2,5 por 3,13. 361 00:37:59,469 --> 00:38:06,510 Negativo, curioso, menos 6,21. Aproximadamente menos 6,21. 362 00:38:06,510 --> 00:38:09,789 No voy a aportar los redondeos, siempre bien hechos, ¿no? 363 00:38:10,510 --> 00:38:13,909 Entonces, ¿cómo es la relación entre las dos variables? 364 00:38:14,510 --> 00:38:16,590 Pues tienen correlación negativa. 365 00:38:24,789 --> 00:38:25,909 Es normal, ¿eh? 366 00:38:25,909 --> 00:38:32,429 Porque se supone que a mayor número de los estudios diarios, el número de suspensos va a ser menor. 367 00:38:33,110 --> 00:38:35,369 Y ahora, ¿para hacer el coeficiente de correlación? 368 00:38:35,369 --> 00:38:41,670 El coeficiente de correlación es la covarianza partido por el producto de las desviaciones típicas. 369 00:38:41,670 --> 00:38:53,670 Pues la covarianza es menos 6,21 dividido entre 2,29 por 2,80. 370 00:38:53,670 --> 00:38:58,710 Si esto es más pequeño que menos 1, me he equivocado. 371 00:39:00,949 --> 00:39:05,389 Pues luego con la calculadora quiero hacerlo en vuestras narices para que no os equivoquéis. 372 00:39:05,389 --> 00:39:23,309 menos 6,21 dividido, abro paréntesis, 2,29 por 2,80, cierro y sale menos 0,97. 373 00:39:28,409 --> 00:39:34,230 Pues esto dice que la correlación es negativa y muy fuerte porque se acerca mucho a menos 1. 374 00:39:34,230 --> 00:40:06,250 Y ahora, para hacer la recta de regresión, para tener el apartado B, la recta de regresión, que sepáis que yo intento notar un término de memoria, pongo a la Y la recta submedia, a la X la recta submedia, y aquí pongo, esto sí que me lo tengo que saber, la covarianza y abajo la desviación típica de la X al parámetro. 375 00:40:06,250 --> 00:40:35,719 Entonces, en este caso dice tres horas y cuarto. Tres horas y cuarto es 3,25. Pues si la x vale 3,25, os recuerdo que esto que está restando pasa sumando, pues cogería la covarianza que es menos 6,21. 376 00:40:35,719 --> 00:40:40,440 partido por la desviación típica de la x al cuadrado 377 00:40:40,440 --> 00:40:45,960 por 3,25 378 00:40:45,960 --> 00:40:50,860 menos la media que es 3,5 379 00:40:50,860 --> 00:40:57,699 y ahora este menos pasa con más y la media de las y es 3,13. 380 00:40:57,699 --> 00:41:10,860 Para hacerlo, menos 6,21 381 00:41:10,860 --> 00:41:15,340 dividido entre 2,29 al cuadrado 382 00:41:15,340 --> 00:41:26,239 por 3,25 menos 3,5, cierro, más 3,3. 383 00:41:27,239 --> 00:41:30,480 Y me sale 3,43. 384 00:41:32,400 --> 00:41:34,960 Aproximadamente 3,43. 385 00:41:35,659 --> 00:41:38,440 Bueno, aquí entonces la respuesta sería 386 00:41:38,440 --> 00:41:44,500 que tendrá entre 3 y 4 suspensos. 387 00:41:49,719 --> 00:41:57,659 Esto es, como os digo, que tengáis otro ejercicio de correlación en vuestro repertorio para que veáis que esto es repetitivo. 388 00:41:57,800 --> 00:42:11,349 Hay una cosa, y aunque no lo ponga aquí, vuelve a ser muy fiable. Es muy fiable. ¿Por qué? 389 00:42:11,349 --> 00:42:32,059 ¿Por qué? Porque 3,25 está entre 0 y 7 y porque el coeficiente de correlación se acerca mucho a menos 1. 390 00:42:35,329 --> 00:42:43,929 A mí me gusta preguntar la fiabilidad y para eso tenéis que comprobar si se cumplen esas dos cosas. 391 00:42:43,929 --> 00:43:01,170 Si yo dijera que se estudia 23 horas diarias, pues eso no tiene ninguna fiabilidad, porque además este señor seguramente lo ha hecho por un mal examen. O si el coeficiente de correlación es 0,25, pues yo diría que esto es muy poco fiable porque la correlación es 9. 392 00:43:01,170 --> 00:43:10,739 Bueno, pues este es el tema de correlación que lo he repasado y como mínimo… 393 00:43:16,010 --> 00:43:31,329 A ver, este es otro distinto, lo podría hacer el próximo día en la próxima clase para que tengáis alguno distinto y lo pregúntale. 394 00:43:31,329 --> 00:43:57,019 Y, bueno, este, que es un poquito diferente, dice, en una muestra de 75 clases eléctricas se han obtenido estos datos sobre su relación. Entonces, dice, calcula la media y la desnudación típica. Y luego calcula la media. 395 00:43:57,019 --> 00:44:14,000 Vamos a ver. Si yo tengo esto por intervalos, acordaos que aquí la marca de clase, por lógica, entre 25 y 30, hago la media. 396 00:44:14,960 --> 00:44:20,719 25 más 30 dividido entre 2 y esto sale 27,5. 397 00:44:22,599 --> 00:44:28,940 Por favor, hacedlo con calculadora porque os voy a decir lo que suele pasar. 398 00:44:29,619 --> 00:44:37,099 Si vosotros hacéis 25 más 30 dividido entre 2, os sale una cosa rarísima. 399 00:44:37,239 --> 00:44:40,119 40. 40 no está entre 25 y 30. 400 00:44:40,739 --> 00:44:41,659 ¿Qué es lo que ocurre? 401 00:44:42,360 --> 00:44:47,119 Que para hacer eso, primero por jerarquía de operaciones, hay que hacer la suma. 402 00:44:47,179 --> 00:44:48,920 Y para eso hay que poner un paréntesis. 403 00:44:49,539 --> 00:44:51,800 Y después el resultado se divide entre 2. 404 00:44:51,800 --> 00:44:55,119 Y aquí ya sale todo. Sale 27,5. 405 00:44:55,800 --> 00:44:57,900 Bueno, así voy haciendo el siguiente. 406 00:44:57,900 --> 00:45:19,139 Y voy poniendo X, Y, F, Y y pongo 27,53. Este entre 30 y 35, pues sería 32,5, pues tiene una frecuencia de 5. 407 00:45:19,139 --> 00:45:34,019 Acordaos lo que era la marca de clase. Entre 35 y 40, 37,5. Cogeis 21. 45, 42,5 con una frecuencia de 28. 408 00:45:34,019 --> 00:45:52,820 Y bueno, entonces aquí el total es 75. Este es el tamaño de la muestra. Y a ver, 42,5. ¿Qué más? Y ahí 57,1. Esto no me gusta. 409 00:45:52,820 --> 00:45:54,480 entre 57 y 70 410 00:45:54,480 --> 00:45:55,500 voy a hacerlo 411 00:45:55,500 --> 00:45:57,159 57 y 70 412 00:45:57,159 --> 00:46:03,489 perdón, entre 55 y 70 413 00:46:03,489 --> 00:46:06,889 hago la media 414 00:46:06,889 --> 00:46:08,550 y me sale 415 00:46:08,550 --> 00:46:10,610 62,5 416 00:46:10,610 --> 00:46:13,349 esto, a mí me gusta 417 00:46:13,349 --> 00:46:15,469 que los intervalos sean todos iguales 418 00:46:15,469 --> 00:46:17,610 este se nos ha escapado un poquito 419 00:46:17,610 --> 00:46:19,670 pero bueno, ahí lo hacemos 420 00:46:19,670 --> 00:46:21,449 ¿no? entonces 421 00:46:21,449 --> 00:46:22,829 bueno, ya que he hecho la tabla 422 00:46:22,829 --> 00:46:25,650 la tabla nos va a servir 423 00:46:25,650 --> 00:46:26,510 para dos cosas 424 00:46:26,510 --> 00:46:36,349 Si hago las frecuencias acumuladas acordadas en este primer intervalo que está representado por 7,5 por 27,5 hay tres valores. 425 00:46:39,280 --> 00:46:50,940 Pues habría 3 más 5 que son 8 más 21 que es 29, 29 más 28 que es 57 y por último tengo 75 datos. 426 00:46:51,880 --> 00:46:55,679 Las frecuencias acumuladas serían para calcular la media. 427 00:46:55,679 --> 00:47:19,679 Mediano. Bueno, si yo cojo 75 datos, sumo 75 más 1, divido entre 2, me sale 36. Esto me quiere decir que el dato mediano es el que ocupa el lugar 36. 428 00:47:19,679 --> 00:47:35,800 Y el 36 está aquí. Porque aquí están desde el 30 hasta el 57. La mediana es 42,5. 429 00:47:35,800 --> 00:47:45,170 y la media aritmética y la desviación típica 430 00:47:45,170 --> 00:47:46,789 hacerla con calculadora 431 00:47:46,789 --> 00:47:49,010 hacerla con calculadora 432 00:47:49,010 --> 00:47:51,750 a partir de esta tabla 433 00:47:51,750 --> 00:47:53,909 con estos valores 434 00:47:53,909 --> 00:47:55,710 con calculadora 435 00:47:55,710 --> 00:47:57,550 os digo que lo hagáis con calculadora 436 00:47:57,550 --> 00:48:00,050 por un tema que me parece muy importante 437 00:48:00,050 --> 00:48:03,010 que es que hay un ejercicio que os di 438 00:48:03,010 --> 00:48:04,429 que también cayó 439 00:48:04,429 --> 00:48:07,650 estoy poniendo todo lo que puede caer en el examen 440 00:48:07,650 --> 00:48:24,769 Pero el que cayó el año pasado no es exactamente este, pero es muy parecido. A ver, aquí tenemos el peso de cinco chicos y sus alturas representativas respectivas. 441 00:48:24,769 --> 00:48:30,269 Se dice que comparemos la variación, la dispersión de cada una de esas dos variables. 442 00:48:31,510 --> 00:48:35,769 Entonces, este ejercicio, si no, por ejemplo, voy a repasarlo, 443 00:48:36,349 --> 00:48:40,329 porque el ejercicio de variación permite comparar series de datos. 444 00:48:40,969 --> 00:48:51,690 Entonces, yo al peso lo llamo X y a la altura lo llamo Y, con calculador. 445 00:48:52,090 --> 00:48:54,130 El que quiera hacer la mano, queda la mano. 446 00:48:54,769 --> 00:49:13,349 Calculado. Voy a hacer la media y la desviación típica de la X. La media y la desviación típica de la Y. Esto espero que ya con vuestras calculadoras lo habéis consultado. 447 00:49:13,349 --> 00:49:24,250 Os recuerdo, y por eso os estoy repitiendo los cálculos, que parece que no significan nada, pero lo que os vayáis escuchando estará bien. Borro los datos. 448 00:49:24,250 --> 00:49:25,389 shift-clear 449 00:49:25,389 --> 00:49:28,210 shift-clear 450 00:49:28,210 --> 00:49:30,289 1. Poner igual 451 00:49:30,289 --> 00:49:32,130 y ya puedo empezar. Pongo 452 00:49:32,130 --> 00:49:33,989 55n más 453 00:49:33,989 --> 00:49:36,349 63n más 454 00:49:36,349 --> 00:49:39,510 57n más 455 00:49:39,510 --> 00:49:42,329 66n más 456 00:49:42,329 --> 00:49:44,349 y 65n más 457 00:49:44,349 --> 00:49:45,690 Me doy 458 00:49:45,690 --> 00:49:47,130 y calculo la media 459 00:49:47,130 --> 00:49:50,090 shift-2 460 00:49:50,090 --> 00:49:52,329 1. La media me sale 461 00:49:52,329 --> 00:49:53,750 61,2 462 00:49:53,750 --> 00:49:55,289 veo que es una cosa 463 00:49:55,289 --> 00:49:57,610 razonable, entonces espero no haberme 464 00:49:57,610 --> 00:49:59,949 equivocado en los datos, 61,2 465 00:49:59,949 --> 00:50:00,690 kilogramos 466 00:50:00,690 --> 00:50:02,630 desviación típica 467 00:50:02,630 --> 00:50:04,969 622, tendría que ser igual 468 00:50:04,969 --> 00:50:07,329 4,4, que es raro 469 00:50:07,329 --> 00:50:08,489 que sea exacto 470 00:50:08,489 --> 00:50:10,969 pero también son kilogramos 471 00:50:10,969 --> 00:50:13,630 y ahora, para las alturas 472 00:50:13,630 --> 00:50:15,710 recordad 473 00:50:15,710 --> 00:50:16,849 borrar los datos 474 00:50:16,849 --> 00:50:18,929 y no tendréis a la igual 475 00:50:18,929 --> 00:50:21,130 y ahora vais poniendo 476 00:50:21,130 --> 00:50:23,090 175 477 00:50:23,090 --> 00:50:40,090 Este dato, 175, 168, 175 M más, 168 M más, 154 M más, 179 M más, 181 M más. 478 00:50:40,090 --> 00:51:07,840 Le doy así, 2, 1, me sale la media, 175,4 centímetros y la desviación típica aproximadamente es 4,50. 479 00:51:07,840 --> 00:51:16,079 Pongo el 4,49, 8, aunque sea 4,50 o un cero, pongo el cero porque eso indica que estáis delineando con dos decimitas. 480 00:51:17,219 --> 00:51:33,139 El coeficiente de variación del peso es la desviación típica partido por la media, que en este caso es 4,4 dividido entre 61,2. 481 00:51:33,139 --> 00:51:50,199 Voy a hacer 4,4 entre 61,2 y me sale 0,01719. 482 00:51:56,730 --> 00:52:01,599 0,0719. 483 00:52:04,980 --> 00:52:09,860 Esto pasaba porcentaje, sabéis que es, cuando esto es aproximado, 484 00:52:09,860 --> 00:52:34,849 Esto es el 7,19%. En cambio, el coeficiente de variación de las alturas es la desviación típica de la Y partido por la media de la Y, que en este caso será 4,50 partido por 175,4. 485 00:52:34,849 --> 00:52:47,489 Esto va a salir más pequeño. 4,50. 4,50 dividido entre 175 puntos. 486 00:52:48,949 --> 00:53:05,150 Y sale igual, sale 0,0257 por un grado. 2,57. Y esto es un 2,57%. 487 00:53:05,150 --> 00:53:27,360 Entonces, los pesos están más dispersos que las alturas. Esta es la conclusión a la que tenéis que llegar. Ejercicio importante, ¿sí? Esta es la conclusión. 488 00:53:27,360 --> 00:53:50,650 Incluso lo de la dispersión puede valer para distintas cosas. Hay gente que lo utiliza en el deporte, por ejemplo, y yo tengo la media de tiros de unos jugadores de baloncesto y voy ganando. 489 00:53:50,650 --> 00:53:52,690 generalmente me interesa 490 00:53:52,690 --> 00:53:54,409 coger a los que son más regulares 491 00:53:54,409 --> 00:53:56,170 a los que tienen menos dispersión 492 00:53:56,170 --> 00:53:58,929 para tomar los menores riesgos posibles 493 00:53:58,929 --> 00:54:00,610 si son, si voy 494 00:54:00,610 --> 00:54:02,389 perdiendo, por lo normal 495 00:54:02,389 --> 00:54:03,429 es que 496 00:54:03,429 --> 00:54:06,750 es que tome 497 00:54:06,750 --> 00:54:08,170 el equipo 498 00:54:08,170 --> 00:54:10,750 que tenga más dispersión 499 00:54:10,750 --> 00:54:12,570 porque tomo más riesgos 500 00:54:12,570 --> 00:54:14,550 y existe la posibilidad de que saquen 501 00:54:14,550 --> 00:54:15,630 los puntos, de la misma 502 00:54:15,630 --> 00:54:18,230 forma que tengo la posibilidad de 503 00:54:18,230 --> 00:54:19,989 tener menos puntos 504 00:54:19,989 --> 00:54:22,250 bueno pues esta es la clase de hoy 505 00:54:22,250 --> 00:54:24,690 el próximo día intentaré hacer algún ejercicio 506 00:54:24,690 --> 00:54:26,650 un poco distinto para que tengáis un poco 507 00:54:26,650 --> 00:54:28,050 las clases variadas pero 508 00:54:28,050 --> 00:54:31,110 más o menos son los que tenemos en la hoja 509 00:54:31,110 --> 00:54:31,570 de acuerdo 510 00:54:31,570 --> 00:54:34,369 en cuanto pueda subo la clase 511 00:54:34,369 --> 00:54:36,309 detengo la grabación