1 00:00:00,110 --> 00:00:26,010 Vale. Cuando usamos la tabla de valores críticos de lo de la TED Students, tengo dudas en dos cosas. Cuando usamos el nivel de significancia en dos polas, supuestamente el nivel de significancia es alfa entre dos, pero los ejercicios los estamos haciendo con alfa completo. 2 00:00:26,010 --> 00:00:35,590 No es que sea alfa entre dos, es que… Estoy compartiendo, ¿verdad? 3 00:00:36,869 --> 00:00:37,189 Sí. 4 00:00:37,450 --> 00:00:47,450 Vale. Realmente… A ver, ¿dónde están las tablas que las tengo? Aquí. 5 00:00:49,250 --> 00:00:50,670 Arriba, eso es. 6 00:00:50,670 --> 00:00:52,950 Claro, o sea, realmente 7 00:00:52,950 --> 00:00:54,649 Lo que quiero decir 8 00:00:54,649 --> 00:00:57,549 Es que nuestro alfa hay una mitad aquí 9 00:00:57,549 --> 00:00:58,890 Y la otra mitad aquí 10 00:00:58,890 --> 00:01:00,789 Vale 11 00:01:00,789 --> 00:01:02,490 En cambio, en el de una cola 12 00:01:02,490 --> 00:01:04,409 El 100% está a este lado 13 00:01:04,409 --> 00:01:05,849 Sí 14 00:01:05,849 --> 00:01:09,310 Entonces tenemos que utilizar, claro, nosotros utilizamos en realidad alfa 15 00:01:09,310 --> 00:01:10,890 Porque sería alfa medios por aquí 16 00:01:10,890 --> 00:01:12,030 Y alfa medios por aquí 17 00:01:12,030 --> 00:01:13,890 No tenemos que utilizar alfa medios 18 00:01:13,890 --> 00:01:16,829 Vale, vale, vale 19 00:01:16,829 --> 00:01:19,489 Pues esa duda ya resuelta 20 00:01:19,489 --> 00:01:25,209 Porque claro, yo hacía los ejercicios con alfa medios y yo decía, aquí algo me está faltando. 21 00:01:25,469 --> 00:01:29,549 No, lo que quiero decir, claro, igual es que la tabla esta es un poco ambigua. 22 00:01:29,709 --> 00:01:34,530 Si te das cuenta, lo que quiero decir es que alfa es toda la zona que está sombreada en gris 23 00:01:34,530 --> 00:01:41,170 y como tenemos la mitad por arriba y la mitad por abajo, si cogiésemos solo un trozo, sería alfa medios. 24 00:01:41,290 --> 00:01:43,870 Pero en total, alfa medios más alfa medios da alfa. 25 00:01:44,689 --> 00:01:52,609 Alfa. Vale. ¿Y cuándo usamos una cola y cuándo usamos dos colas? Sé que con los intervalos de confianza se usan dos colas. 26 00:01:52,730 --> 00:01:58,409 Siempre dos colas con los intervalos de confianza. ¿Por qué? Porque nos da igual, tenemos nuestro valor y nos da igual, nos da igual, no. 27 00:01:58,709 --> 00:02:06,269 Queremos saber lo que está un poquito por encima y lo que está un poquito por debajo. Eso es un poco la regla mnemotécnica, la regla a utilizar. 28 00:02:06,269 --> 00:02:23,169 Daos cuenta que la diferencia entre una cola y dos colas de valores es irse uno a la derecha o uno a la izquierda. En dos colas este es el 0,05 y en cambio en una cola este es el 0,05. Eso es lo que cambia. 29 00:02:23,169 --> 00:02:29,469 Nos va a cambiar sensiblemente nuestra T cuando la vayamos a comparar. 30 00:02:29,990 --> 00:02:33,150 ¿Cuándo utilizamos el nivel de significancia de una cola? 31 00:02:33,530 --> 00:02:39,610 Cuando nosotros estamos haciendo un ejercicio en el que lo que queremos es comparar un... 32 00:02:39,610 --> 00:02:44,689 Por ejemplo, si estamos hablando de medias, queremos saber si una de las dos medias es mayor que la otra. 33 00:02:45,430 --> 00:02:52,330 Si estadísticamente podemos asumir, por ejemplo, que uno de los dos métodos nos da una media mayor que la otra. 34 00:02:53,169 --> 00:02:56,449 Ahí utilizamos una cola o menor que la otra 35 00:02:56,449 --> 00:02:58,469 Cuando solamente o mayor o menor 36 00:02:58,469 --> 00:03:01,569 En cambio, cuando tenemos un ejercicio que lo que nos dice es 37 00:03:01,569 --> 00:03:05,509 Si nuestras dos medias son iguales o son diferentes 38 00:03:05,509 --> 00:03:07,830 No queremos saber si es mayor o menor 39 00:03:07,830 --> 00:03:09,849 Queremos saber si simplemente no es igual 40 00:03:09,849 --> 00:03:11,270 Ahí utilizamos dos colas 41 00:03:11,270 --> 00:03:13,849 Si me da igual que sea mayor o más pequeña, dos colas 42 00:03:13,849 --> 00:03:16,009 Si lo restrinjo por un lado 43 00:03:16,009 --> 00:03:21,169 La explicación estadística va mucho más allá 44 00:03:21,169 --> 00:03:22,909 pero bueno, yo tampoco 45 00:03:22,909 --> 00:03:24,969 es una cosa mucho más 46 00:03:24,969 --> 00:03:26,349 tiene su enjumbia 47 00:03:26,349 --> 00:03:29,270 pero lo que en la aplicación práctica 48 00:03:29,270 --> 00:03:30,789 que es lo que hacemos nosotros 49 00:03:30,789 --> 00:03:32,889 cuando tenemos restringido 50 00:03:32,889 --> 00:03:35,050 un valor a un máximo 51 00:03:35,050 --> 00:03:37,430 mínimo por arriba o por abajo 52 00:03:37,430 --> 00:03:39,270 utilizamos una cola y si nos da igual 53 00:03:39,270 --> 00:03:41,229 si simplemente queremos decir si algo es igual 54 00:03:41,229 --> 00:03:43,229 o es distinto, utilizamos dos colas 55 00:03:43,229 --> 00:03:44,930 vale 56 00:03:44,930 --> 00:03:46,189 y ya 57 00:03:46,189 --> 00:03:48,750 una cosa que va ligada a esto, perdona 58 00:03:48,750 --> 00:03:50,990 un caso medio especial que es cuando 59 00:03:50,990 --> 00:03:56,949 utilizamos la tabla de la F de CISER, vosotros tendréis a tener la tabla de una cola. ¿Pero 60 00:03:56,949 --> 00:04:02,629 por qué? Porque esta en la práctica es la que se utiliza, ¿vale? Entonces, aunque nosotros 61 00:04:02,629 --> 00:04:07,389 estemos comparando si las precisiones son iguales o distintas, utilizamos esta tabla, 62 00:04:07,389 --> 00:04:12,889 ¿vale? Es el único caso en el que no distinguimos entre una cola y dos colas, por practicidad, 63 00:04:13,210 --> 00:04:16,750 que si encontramos… Es que esta tabla es hasta difícil de encontrar la de dos colas, 64 00:04:16,870 --> 00:04:20,769 pero por existir, existe. Si la tuviésemos, la podríamos usar. Si le hacemos la simplicidad 65 00:04:20,769 --> 00:04:36,430 Porque al final es tan tan parecido que no hay prácticamente diferencia, ¿vale? Y además como no es simétrica, como la de Student, que se des cuenta como normal, ¿vale? Y lo otro que te he cortado, perdona. 66 00:04:36,430 --> 00:04:38,569 vale, que lo único 67 00:04:38,569 --> 00:04:39,550 que por mí 68 00:04:39,550 --> 00:04:42,209 hacer algún ejercicio de plantear hipótesis 69 00:04:42,209 --> 00:04:43,850 porque me lío bastante 70 00:04:43,850 --> 00:04:46,170 para plantearlo 71 00:04:46,170 --> 00:04:48,290 cuál es H0 y H1 72 00:04:48,290 --> 00:04:49,949 y con los valores que nos dan 73 00:04:49,949 --> 00:04:51,970 saber si rechazo 74 00:04:51,970 --> 00:04:53,790 lo que significa mi rechazo 75 00:04:53,790 --> 00:04:56,129 y lo que significa mi aceptación 76 00:04:56,129 --> 00:04:57,250 no sé si me he explicado bien 77 00:04:57,250 --> 00:04:59,329 vamos a ver ello 78 00:04:59,329 --> 00:05:01,410 y lo hacemos así de primeras 79 00:05:01,410 --> 00:05:02,370 y luego ya seguimos 80 00:05:02,370 --> 00:05:04,290 va genial 81 00:05:04,290 --> 00:05:16,250 ¿Cómo planteamos las hipótesis? Nosotros siempre vamos a tener, cuando tenemos estos ejercicios de contraste de hipótesis, podemos tener distintos casos. 82 00:05:16,329 --> 00:05:29,750 Podemos tener dos series de datos. Yo tengo mi serie de datos 1 en la que yo he tomado una serie de valores. 83 00:05:29,750 --> 00:05:32,089 luego tengo mi serie de datos 84 00:05:32,089 --> 00:05:34,629 en la que he tomado 85 00:05:34,629 --> 00:05:36,250 otra serie de valores que pueden ser 86 00:05:36,250 --> 00:05:37,269 el mismo número 87 00:05:37,269 --> 00:05:40,149 n o un número distinto 88 00:05:40,149 --> 00:05:42,089 ¿vale? porque yo puedo tener 89 00:05:42,089 --> 00:05:44,290 se me puede dar el caso de que yo 90 00:05:44,290 --> 00:05:46,050 haya hecho, pues como los que 91 00:05:46,050 --> 00:05:47,990 vinisteis por ejemplo a las prácticas 92 00:05:47,990 --> 00:05:49,009 de laboratorio 93 00:05:49,009 --> 00:05:52,490 la valoración manual la hicimos 3 veces 94 00:05:52,490 --> 00:05:54,449 o sea que nuestro n sería 3 95 00:05:54,449 --> 00:05:56,029 y la valoración automática 96 00:05:56,029 --> 00:05:57,949 la hicimos 6 veces, por ejemplo 97 00:05:57,949 --> 00:06:04,189 nos traen la teoría 6. Entonces, nosotros queremos comparar, por ejemplo, si la precisión 98 00:06:04,189 --> 00:06:10,649 de los dos métodos es significativamente diferente. Siempre nuestra hipótesis nula 99 00:06:10,649 --> 00:06:19,209 es la de que son iguales. Entonces, cuando nosotros comparamos precisión, lo que estamos 100 00:06:19,209 --> 00:06:29,209 comparando es la varianza, decimos, ¿vale? Yo digo que S sub 1 es igual que S sub 2, S 101 00:06:29,209 --> 00:06:32,970 cuadrado, perdón, la varianza. Esta es mi hipótesis nula, ¿vale? La nula siempre es 102 00:06:32,970 --> 00:06:45,129 que sean iguales. La alternativa sería que las varianzas sean distintas, ¿vale? Y esto 103 00:06:45,129 --> 00:06:51,389 Os pongo aquí el asterisco de que cuando utilizamos la tabla F no hacemos caso a lo de una o dos colas. 104 00:06:52,810 --> 00:06:59,329 Entonces plantearíamos nuestras hipótesis, la hipótesis nula que las varianzas son iguales, 105 00:06:59,810 --> 00:07:03,149 la hipótesis alternativa que las varianzas no son iguales. 106 00:07:03,529 --> 00:07:10,290 Calculamos el estadístico que es igual en este caso a la varianza de uno entre la varianza del otro. 107 00:07:11,870 --> 00:07:15,069 ¿Cuál ponemos arriba? La mayor. 108 00:07:15,129 --> 00:07:31,850 El número mayor, porque esta F tiene que ser mayor que 1. Entonces, esta es nuestra F calculada. Después nos vamos a ir a las tablas y vamos a buscar la F tabulada. 109 00:07:31,850 --> 00:07:46,810 En este caso, nuestra tabla está establecida según los grados de libertad que tengamos en el numerador y en el denominador. 110 00:07:46,810 --> 00:08:10,689 Entonces, ¿el numerador cuál hemos puesto? La que nos ha dado una variedad más grande, que puede ser cualquiera de las dos. La que hemos calculado, hemos hecho nuestra S cuadrada y nos ha dado un número mayor. Pues la ponemos arriba y buscamos en la tabla de la F, aquí, el número de grados de libertad N-1 del que hemos puesto arriba y aquí del que hemos puesto abajo. 111 00:08:10,689 --> 00:08:30,629 Entonces, vamos a imaginarnos que arriba hemos puesto el de la valoración automática, porque nos ha dado una varianza mayor, imagínate, que eran 6 menos 1, 5. Y en el denominador hemos puesto el de la manual, porque era más pequeña, en un caso inventado que estamos teniendo, pues eran 3, 3 menos 1, 2. 112 00:08:30,629 --> 00:08:42,909 Nos iríamos aquí y nuestro valor sería 19,30. Ya tenemos el F tabulado. Hemos calculado el calculado con los valores que tenemos y el tabulado lo vemos en la tabla. 113 00:08:42,909 --> 00:08:58,289 Pues ahora, si nuestro F calculado es menor que el F tabulado, aceptamos la hipótesis nula. O sea, que las variantes son iguales. Si no, la alternativa. 114 00:08:58,289 --> 00:09:10,610 Siempre en todos los ejercicios de significancia, nuestro valor, el que nosotros calculamos con nuestros datos, si es menor que el que está en las tablas, aceptamos la hipótesis nueva. 115 00:09:10,610 --> 00:09:23,129 En el caso, por ejemplo, de la evaluación de resultados dudosos, cuando hacemos la Q de Dixon, en realidad es lo mismo. 116 00:09:23,129 --> 00:09:35,250 Si nuestra Q calculada, la que nosotros calculamos, es más pequeña que la que está en las tablas, decimos que sí, que nuestro valor sí que es igual que el resto, sí que está dentro de la misma población. 117 00:09:35,690 --> 00:09:39,269 Aceptamos el valor, aceptamos la hipótesis nula. 118 00:09:41,470 --> 00:09:41,950 Vale. 119 00:09:42,450 --> 00:09:52,710 Entonces, en este caso que hemos dicho, hemos planteado la hipótesis para ver si nuestras series de datos eran igual de precisas. 120 00:09:53,269 --> 00:09:53,389 ¿Vale? 121 00:09:53,950 --> 00:09:56,669 El micrófono, ¿lo tienes abierto tú, Silvia? 122 00:09:57,269 --> 00:09:58,870 Sí, la tengo yo, la tengo yo. Espera, que lo cierro. 123 00:09:58,870 --> 00:10:04,909 Cierralo un segundo. Es que yo creo que... Ábrelo cuando quieras hablar, ¿vale? Sin problema. Pero creo que es que se escucha un poco de eco. 124 00:10:06,330 --> 00:10:09,210 Entonces, bueno, cuando queráis me cortáis cualquiera de vosotros. 125 00:10:09,830 --> 00:10:15,570 Entonces, hemos planteado estas hipótesis para ver si las precisiones son iguales o distintas. 126 00:10:15,669 --> 00:10:16,889 Hemos hecho nuestra prueba F. 127 00:10:17,450 --> 00:10:22,850 Ahora, imagínate que yo quiero saber si mis medias son, quiero plantear una hipótesis con las medias. 128 00:10:22,950 --> 00:10:24,450 Pues tengo distintas maneras de hacerlo. 129 00:10:24,450 --> 00:10:32,830 Mi hipótesis nula va a ser siempre que la media del primero es igual que la media del segundo. 130 00:10:33,210 --> 00:10:38,789 Esta es mi hipótesis nula, que mi valoración manual me da el mismo resultado que la valoración automática. 131 00:10:39,210 --> 00:10:49,309 Ahora, tengo una hipótesis alternativa, que es, no, mi media del primero es distinta que mi media del segundo. 132 00:10:49,450 --> 00:10:59,269 Si yo planteo esta hipótesis, luego en mi tabla de la T de Student tengo que mirar en el de dos colas, porque es bilateral. 133 00:10:59,690 --> 00:11:06,070 Yo te estoy diciendo que es o mayor o menor, es distinto, me da igual que sea mayor o menor, simplemente que es distinto. 134 00:11:06,070 --> 00:11:13,789 ¿Vale? Y esta sería, pues, una manera de plantearlo, con una hipótesis bilateral, te deciden de dos colas. 135 00:11:14,330 --> 00:11:25,470 Ahora, otro caso que yo digo, vale, mi hipótesis nula es la misma, que la media del primero es igual que la media del segundo, 136 00:11:25,470 --> 00:11:37,330 pero ahora mi hipótesis alternativa es que el primero, la media que me da el primer método es superior a la que me da el segundo método. 137 00:11:37,750 --> 00:11:44,610 Yo aquí tengo que plantear mi hipótesis unilateral y miro en la tabla de la TED Student de una cola. 138 00:11:46,490 --> 00:11:53,669 Entonces ahora haré mis cálculos para ver cómo calcular la TED, que si queréis repasar eso ahora lo vemos, 139 00:11:53,669 --> 00:12:05,970 Y luego me iré a las tablas y diré, vale, si la T que yo he calculado es menor que la T de las tablas, acepto la hipótesis nula. 140 00:12:07,289 --> 00:12:10,909 Y eso quiere decir que mis medias son iguales. 141 00:12:11,409 --> 00:12:19,009 Ahora, si la T que yo he calculado es más grande que la T tabulada, rechazo la hipótesis nula. 142 00:12:19,009 --> 00:12:26,509 Y en ese caso acepto la alternativa, que si yo me he planteado la hipótesis de una cola, será esta de aquí, 143 00:12:27,149 --> 00:12:31,789 podré decir que la media del primero da superior, más grande que la media del segundo, 144 00:12:32,429 --> 00:12:36,789 y si lo he planteado aquí, diré que la media del primero es distinta que la media del segundo. 145 00:12:38,070 --> 00:12:45,950 Muchas, muchas veces, planteando la hipótesis de una cola o de dos colas, al final el resultado que nos da es, obtenemos lo mismo. 146 00:12:45,950 --> 00:13:04,509 ¿Por qué? Pues porque al final como la TED Student tampoco varía mucho, sobre todo cuando estamos ya en datos más grandes, no varía mucho de una fila a la otra, de una columna a la otra, pues muchas veces por casualidad me da el mismo resultado. 147 00:13:04,509 --> 00:13:14,289 Pero sí que tenemos que saber eso, cómo plantearlas, que si es unilateral es que es mayor que o menor que, y entonces una cola, ¿vale? 148 00:13:14,330 --> 00:13:17,789 Y que si es bilateral, dos colas, y es que es distinto. 149 00:13:18,190 --> 00:13:29,929 Y aquí estamos asumiendo todo el rato, yo calculo los valores, me los invento, imaginaos que x sub 1 me da 3,7, x sub 2 me da 3,5. 150 00:13:30,450 --> 00:13:35,509 Esta hipótesis tiene sentido, ¿no? Que yo diga, vale, la media del primero es mayor que la media del segundo. 151 00:13:35,850 --> 00:13:41,629 No tendría sentido que yo dijese que la media del primero es menor que la media del segundo, ¿vale? 152 00:13:41,629 --> 00:13:45,470 Porque veo, o sea, mis datos me están diciendo que este es mayor que este. 153 00:13:45,809 --> 00:13:47,769 Pero ¿es mayor que este estadísticamente? 154 00:13:48,250 --> 00:13:52,029 O se puede asumir que las pequeñas diferencias que hay hacen que sean iguales, ¿vale? 155 00:13:52,029 --> 00:13:57,309 Lo digo por lo de plantear la hipótesis alternativa, que hay que plantearla con sentido, ¿vale? 156 00:13:57,309 --> 00:14:11,590 Si esto fuese así, lo que tengo que plantear es que este es mayor que este como hipótesis alternativa, que mi hipótesis nula ha sido que ambos son iguales, que yo lo veo y veo que no son iguales, que no es el mismo número, que este es un 7 y este es un 5. 157 00:14:11,590 --> 00:14:31,370 Pero lo que trata la estadística diferencial es de ver si esas diferencias pequeñas que hay se deben a variabilidades inherentes al sistema, a pequeños errores, o realmente es que mis datos estadísticamente no se pueden considerar iguales. 158 00:14:31,370 --> 00:14:33,309 ¿Vale? 159 00:14:34,590 --> 00:14:35,450 ¿Vuelvo al chat? 160 00:14:36,029 --> 00:14:37,610 ¿Aquí, Silvia? ¿Más o menos? 161 00:14:38,750 --> 00:14:40,070 Sí, pero te voy a hacer 162 00:14:40,070 --> 00:14:42,250 un caso 163 00:14:42,250 --> 00:14:43,110 concreto, ¿vale? 164 00:14:43,710 --> 00:14:45,529 Fue el ejercicio que hicimos de hipótesis, 165 00:14:45,909 --> 00:14:47,950 que nos daban la concentración de plomo en una 166 00:14:47,950 --> 00:14:49,990 muestra de agua, nos dieron ciertas 167 00:14:49,990 --> 00:14:51,909 mediciones y nos decían que el valor de 168 00:14:51,909 --> 00:14:54,389 referencia era 11,5, 169 00:14:54,450 --> 00:14:54,629 ¿vale? 170 00:14:55,850 --> 00:14:58,190 Yo lo que me lío es, ¿se puede concluir 171 00:14:58,190 --> 00:15:00,629 que el agua analizada esté del valor de referencia? 172 00:15:00,629 --> 00:15:03,210 claro, mi hipótesis nula es que 173 00:15:03,210 --> 00:15:04,629 las medias son iguales 174 00:15:04,629 --> 00:15:06,450 y la 175 00:15:06,450 --> 00:15:09,570 alternativa es que no son iguales 176 00:15:09,570 --> 00:15:11,210 es en este tipo de ejercicios 177 00:15:11,210 --> 00:15:12,909 en los que yo me lío 178 00:15:12,909 --> 00:15:15,330 para decir, sí, si accede o no accede 179 00:15:15,330 --> 00:15:17,129 o sea, entonces, si acepto o no acepto 180 00:15:17,129 --> 00:15:19,529 vale, te digo, si yo por ejemplo 181 00:15:19,529 --> 00:15:21,169 el valor de alcohol en sangre 182 00:15:21,169 --> 00:15:22,289 máximo para permitir 183 00:15:22,289 --> 00:15:24,809 es que no sé cuánto, es 0,5 184 00:15:24,809 --> 00:15:26,289 no sé, es 0,5 185 00:15:26,289 --> 00:15:28,110 y yo tengo 0,4 186 00:15:28,110 --> 00:15:30,149 ¿puedo conducir o no? 187 00:15:30,629 --> 00:15:44,029 legalmente. Sí, ¿no? Sí. Pero si tengo 0,6. Claro, pero a mí, claro, sí, pero yo, vale, sí, ya, porque mi T calculada 188 00:15:44,029 --> 00:15:51,009 es mayor al valor de referencia, vale, ya está. A lo que voy es que en el caso este, yo siempre, bueno, no sé, 189 00:15:51,009 --> 00:15:57,210 a mí me sirve pensar en lo del control alcoholemia, por ejemplo. Tú dices, vale, yo no quiero saber si mi alcohol en sangre 190 00:15:57,210 --> 00:16:03,370 es distinto de 0.5, yo quiero saber si es mayor de 0.5, porque si es menor es totalmente legal. 191 00:16:03,710 --> 00:16:07,570 Entonces, ahí yo lo estoy restringiendo, o sea, yo tengo aquí el valor de referencia, 192 00:16:08,429 --> 00:16:19,409 X referencia, y lo que quiero saber es si mi valor está por aquí, está por encima, 193 00:16:19,590 --> 00:16:21,490 porque si está por debajo, todo bien, ¿no? 194 00:16:21,490 --> 00:16:25,809 Entonces, siempre cuando te dicen lo de si supera o si no llega, 195 00:16:25,809 --> 00:16:47,730 Estamos diciendo ahora que lo supere, pero también puede ser, por ejemplo, que el calcio mínimo considerado saludable en una dieta es no sé cuánto. Y tú quieres saber si te has quedado por debajo, por ejemplo. Tú lo estás siempre restringiendo a si es mayor que o menor que. Es lo mismo. Es lo mismo que hemos hecho con esto de aquí. 196 00:16:48,490 --> 00:16:49,289 Vale, vale, vale. 197 00:16:50,370 --> 00:16:58,789 Siempre que te digan, esto también truco, siempre que te digan si se supera un valor legal o si se llega a un valor legal, tú estás acotándolo a uno de los dos lados. 198 00:16:59,070 --> 00:17:02,529 No te valen los dos, te vale solo uno. Entonces, siempre va a ser una cola. 199 00:17:04,089 --> 00:17:05,609 Vale, vale, genial. Vale, ya está. 200 00:17:05,869 --> 00:17:10,829 Porque justo te he empezado a decir que me he ido por las ramas, te he dicho, tenemos distintos tipos de ejercicios. 201 00:17:10,829 --> 00:17:24,430 Uno es el de que tenemos dos series de datos, luego tenemos otro que es que tenemos una serie de datos que yo me he ido en el laboratorio y un valor de referencia, que es el que tú me acabas de decir, ¿vale? 202 00:17:24,430 --> 00:17:44,039 que es el que tú me acabas de decir, que yo comparo, que sería este caso de aquí, en la hoja de fórmulas, este de aquí, ¿no? 203 00:17:44,740 --> 00:17:45,839 Sí, sí, sí. 204 00:17:45,839 --> 00:17:53,980 calcular la T de student y aquí tenemos nuestro valor de referencia, aquí tenemos la media de nuestra serie de datos, 205 00:17:54,119 --> 00:18:00,259 la desviación de nuestra serie de datos y la N. Y es lo mismo, lo que tenemos que hacer es plantear la hipótesis unilateral. 206 00:18:00,259 --> 00:18:05,839 Aquí es que no se me ocurre ningún caso en el que tuviese sentido plantear la bilateral. 207 00:18:07,099 --> 00:18:15,019 No tiene sentido para la utilidad que tiene. Estadísticamente se podría hacer, ¿vale? 208 00:18:15,019 --> 00:18:33,579 Y luego, importante, es que hemos hecho lo primero, no tenéis en la hoja de fórmulas, que eso, bueno, como vais a tener esta hoja tal cual en el examen, ¿vale? No tenéis la de la prueba F, que es la primera que se hace en estos ensayos, la de si mis varianzas son homogéneas o no. 209 00:18:33,579 --> 00:18:35,160 acordas que es simplemente 210 00:18:35,160 --> 00:18:38,279 varianza de uno entre varianza de otro 211 00:18:38,279 --> 00:18:38,660 ¿vale? 212 00:18:39,440 --> 00:18:41,279 y luego en función de lo que me dé 213 00:18:41,279 --> 00:18:44,220 ya calculo la T con esta fórmula 214 00:18:44,220 --> 00:18:46,319 si mis varianzas son homogéneas 215 00:18:46,319 --> 00:18:47,700 con esta fórmula 216 00:18:47,700 --> 00:18:49,599 si mis varianzas no son homogéneas 217 00:18:49,599 --> 00:18:51,920 y aquí tengo los grados de libertad 218 00:18:51,920 --> 00:18:54,180 que es donde tengo que mirar 219 00:18:54,180 --> 00:18:55,900 en mi tabla de la T de Steven 220 00:18:55,900 --> 00:18:58,319 ¿vale? entonces si yo por ejemplo he planteado 221 00:18:58,319 --> 00:19:00,559 una hipótesis bilateral 222 00:19:00,559 --> 00:19:01,579 aquí 223 00:19:01,579 --> 00:19:12,759 y tenía siete valores en la primera y quince en la segunda, me lo invento, pues siete y quince son veintidós, menos dos, veinte. 224 00:19:13,240 --> 00:19:20,400 Como he dicho que de dos colas me tendría que ir aquí al veinte y luego, bueno, pues la significancia no la he dicho, suele ser el noventa y cinco, ¿no? 225 00:19:20,400 --> 00:19:28,839 Entonces esta de aquí, mi TED Student sería 2,09, la tabulada. 226 00:19:29,240 --> 00:19:42,680 Si yo la que he calculado con esta fórmula de aquí es menor que 2,09, acepta la hipótesis nula y las medias puedo decir que son iguales. 227 00:19:42,680 --> 00:19:51,700 En cambio, si esta teca que he calculado me sale mayor que este valor de aquí, rechaza la hipótesis nula y digo que las medias son diferentes. 228 00:20:00,529 --> 00:20:10,569 Tenía también aquí en el chat… Por favor, grabarlo. Lo he puesto a grabar. A ver, en el examen nos pondrás qué tipo de ejercicio realizar. 229 00:20:10,569 --> 00:20:27,470 Ahora, no expresamente, estoy leyendo la pregunta de Brenda, perdón, la leo en alto, que si en el examen pondré el tipo de ejercicio a realizar, o sea, no te voy a poner, este ejercicio es un ejercicio de calibración, pero tú lo vas a ver, ¿vale? Porque todos al final tienen más o menos el mismo enunciado. 230 00:20:27,470 --> 00:20:32,069 y como teoría 231 00:20:32,069 --> 00:20:33,609 tendremos que desarrollar conceptos 232 00:20:33,609 --> 00:20:37,809 no vais a tener que hacer 233 00:20:37,809 --> 00:20:38,970 un desarrollo largo 234 00:20:38,970 --> 00:20:41,089 van a ser preguntas 235 00:20:41,089 --> 00:20:42,789 tipo test 236 00:20:42,789 --> 00:20:45,509 preguntas a lo mejor de verdadero o falso 237 00:20:45,509 --> 00:20:47,509 preguntas de puede haber alguna 238 00:20:47,509 --> 00:20:48,730 de rellenar huecos 239 00:20:48,730 --> 00:20:49,869 este tipo de preguntas 240 00:20:49,869 --> 00:20:53,369 y a lo mejor alguna que se conteste en una o dos líneas 241 00:20:53,369 --> 00:20:55,569 imagínate una que se me viene a la cabeza 242 00:20:55,569 --> 00:20:56,609 que no tiene por qué ser esa 243 00:20:56,609 --> 00:21:03,950 Pero yo que sé, que digas, yo que sé, pues tres equipos de protección individual o de protección colectiva, algo así, ¿vale? 244 00:21:03,950 --> 00:21:10,089 Pero no vais a tener que coger y ponéis a desarrollar la calidad es el concepto, ¿vale? Nada de eso. 245 00:21:11,210 --> 00:21:14,829 La unidad 5 es la más importante y es la que más pesa en el examen, sí. 246 00:21:15,430 --> 00:21:25,950 Acordaos que ya lo comenté, si habéis podido ver la clase anterior, que evaluamos por resultados de aprendizaje. 247 00:21:26,609 --> 00:21:46,750 El resultado de aprendizaje 2 es el que más peso tiene en este módulo. Es el que se corresponde con la unidad 5, con los ejercicios. Es el que más peso tiene de nota y además muy probablemente por la casuística que tiene esto es en el que más tiempo vais a tardar en el examen. 248 00:21:46,750 --> 00:22:11,529 Yo os voy a dar todo junto y os gestionáis el tiempo como queráis. Si alguien prefiere empezar con el tipo test porque prefiere quitárselo de encima y luego ya irse a los ejercicios bien, si alguien quiere empezar con la parte de los ejercicios y luego pasarla de seguridad y luego hacerla de calidad bien también, eso lo gestionáis como queráis vosotros porque lo vais a tener todo desde el principio. 249 00:22:11,529 --> 00:22:33,269 Y vais a tener lo que os comenté, el examen dividido según los resultados de aprendizaje, porque luego en el caso de que suspendáis algún resultado de aprendizaje, que esperemos que no, pues luego en la extraordinaria tendréis que hacer ese resultado de aprendizaje. 250 00:22:41,529 --> 00:22:50,190 Para tu pregunta está Brenda, que sé que no puedes hablar, entonces, bueno, espero haberlo resuelto, si no, escríbeme en el chat, ¿vale? 251 00:22:50,490 --> 00:23:00,509 Y Sandra, sí, ahora voy a ello. Ejercicio de datos emparejados, que me avisó Sandra que el ejercicio que tenía subido al aula virtual y el ejercicio resuelto no lo entendía, 252 00:23:00,509 --> 00:23:03,630 y no lo entendía con razón porque es que estaban mal los datos. 253 00:23:05,869 --> 00:23:13,349 Era un ejercicio que planteé y luego me di cuenta que los datos quedaban muy, muy cerquita, 254 00:23:14,990 --> 00:23:21,730 a ver cómo lo explico, que el valor que calculábamos para compararlo era muy cercano 255 00:23:21,730 --> 00:23:28,049 y si unos utilizábamos unos decimales y otros otros, pues a lo mejor unos los rechazaban y otros los aceptaban. 256 00:23:28,049 --> 00:23:32,750 Entonces, modifiqué los datos para que fuese más claro y a todos nos diese lo mismo, ¿vale? 257 00:23:33,170 --> 00:23:37,210 Entonces, vamos a resolverlo porque los de datos emparejados son muy fáciles. 258 00:23:37,650 --> 00:23:44,630 Lo más difícil de los datos emparejados es saber cuándo los tenemos que utilizar, en mi opinión, ¿vale? 259 00:23:45,150 --> 00:23:51,950 Como norma, como regla, así un poco... me sale nemo técnica, como regla, así... 260 00:23:51,950 --> 00:23:56,789 Para darnos cuenta, cuando nos enfrentamos a un ejercicio de datos emparejados 261 00:23:56,789 --> 00:24:05,710 es cuando realmente mis datos, mis datos, estoy comparando cada una de mis muestras, 262 00:24:06,269 --> 00:24:08,210 tiene identidad propia, ¿vale? 263 00:24:08,210 --> 00:24:18,190 Por ejemplo, imaginaos que tengo aquí muestras cogidas en distintos ríos, muestras de agua 264 00:24:18,190 --> 00:24:30,069 y he cogido una muestra en el río Manzanares, otra muestra, la número 2, la he cogido en el Tajo, otra en el Ebro, otra en el Duero, ¿vale? 265 00:24:30,869 --> 00:24:38,569 Después, bueno, con estas muestras, a cada una de ellas le he medido el pH, por ejemplo, la conductividad. 266 00:24:38,569 --> 00:25:06,569 Ahora, después, y me ha dado unos valores, para la de Madrid-Río me ha dado un valor, para la del otro río me ha dado otra, para la del otro me ha dado otra, he medido el pH, luego he añadido un compuesto que baja un poco el pH y he vuelto a medir después de añadirlo, este es antes de añadirlo y este es el pH después de añadirlo. 267 00:25:08,569 --> 00:25:20,890 Y he tenido otros valores. Estos datos que yo voy a comparar, aunque tenga dos series de datos, pH antes y pH después, son datos que están emparejados. 268 00:25:20,990 --> 00:25:27,170 ¿Eso qué quiere decir? Que este dato lo voy a comparar con este dato. Este dato lo voy a comparar con este dato. 269 00:25:27,170 --> 00:25:41,369 No tiene sentido que yo compare el pH antes en el río Manzanares con el pH después del tratamiento en el Duero, porque realmente no voy a obtener una información de calidad. 270 00:25:41,369 --> 00:26:01,430 Ahora, un ejemplo también muy significativo, que lo pongo siempre, por eso he querido cambiar con el de los ríos, es el de análisis clínico. Pues eso, yo voy al hospital y yo, Elena, me miden la tensión o me sacan sangre, me dan un medicamento y me vuelven a sacar sangre. 271 00:26:01,430 --> 00:26:09,789 y analizan el hierro antes y después. Después a cada uno de vosotros, a Sandra lo mismo, 272 00:26:10,589 --> 00:26:16,970 le sacan sangre, le dan una pastilla de hierro y le vuelven a sacar sangre y miden la sangre 273 00:26:16,970 --> 00:26:24,809 antes y después. A Ramiro lo mismo. A lo mejor mi hierro al principio era 12 y después 274 00:26:24,809 --> 00:26:31,349 de mi pastilla de hierro son 12,7. A lo mejor el de Sandra era 9 y ahora son 9,3. 275 00:26:31,430 --> 00:26:47,410 No tiene sentido que yo compare el valor de antes de Sandra con el mío de después, tendré que comparar este con este. ¿Cómo lo hago? Lo hago con esta fórmula de aquí que es muy sencilla. 276 00:26:47,410 --> 00:26:51,849 Lo difícil es eso, saber cuándo me enfrento a un ejercicio de medias emparejadas. 277 00:26:52,210 --> 00:26:55,970 ¿Qué es eso? Cuando cada una de mis muestras tiene nombre y apellidos. 278 00:26:56,950 --> 00:27:02,589 Entonces, ¿qué es lo que hago? Hago la diferencia media, que ¿cómo sería? 279 00:27:05,029 --> 00:27:12,349 Cojo y digo, vale, el valor absoluto 12 menos 12,7, en mi caso 0,7. 280 00:27:12,349 --> 00:27:24,150 9 menos 9 con 3, 0 con 3, aquí el siguiente, pues 10 y 10 con 5, por ejemplo, 0 con 5, ¿no? 281 00:27:24,289 --> 00:27:28,269 Este menos este, en valor absoluto siempre la diferencia. 282 00:27:28,990 --> 00:27:37,910 Ahora, una vez que tengo hechas estas diferencias, hago la media, 0,7 más 0,3 más 0,5 dividido entre 3, ¿vale? 283 00:27:37,910 --> 00:27:48,069 O sea, sumo las diferencias y lo divido entre el número de diferencias que haya tenido, que va a ser el número de pares de datos que tenga, ¿vale? 284 00:27:48,130 --> 00:27:56,549 Y después, ¿qué hago? Calculo la desviación, que la puedo calcular, pues, como siempre con la calculadora, ¿vale? 285 00:27:56,549 --> 00:28:15,910 Aquí tenemos la fórmula, pero no hay necesidad, la puedo calcular metiendo estos datos de aquí en la calculadora y con esto calculo mi media y calculo mi desviación, ¿vale? 286 00:28:16,910 --> 00:28:24,990 Mi desviación, perdón, esta es mi media de mis desviaciones y mi desviación que he puesto una vez, mi desviación típica, desviación estándar, como siempre, la de la calculadora. 287 00:28:26,549 --> 00:28:34,750 ya tendría todo, tengo el valor absoluto de mi diferencia media, acordaos que el valor absoluto es siempre en positivo, 288 00:28:35,269 --> 00:28:44,930 dividido entre la desviación de esos valores que acabo de calcular, a su vez dividido entre raíz de n, que es n, 289 00:28:44,930 --> 00:28:54,289 el número de pares de valores que yo tengo, o sea, este es 1, 2 y 3, en este caso n sería igual a 3, ¿vale? 290 00:28:54,289 --> 00:28:59,089 Porque tengo tres parejas de valores y ya lo tendría calculado. 291 00:28:59,509 --> 00:29:05,230 Sabéis que como esto está aquí dividiendo en el denominador, sería lo mismo que ponerlo aquí multiplicando. 292 00:29:05,650 --> 00:29:06,430 Lo hacéis como queráis. 293 00:29:07,170 --> 00:29:14,430 Me va a dar una T y ya esa T la comparo con la T de las tablas. 294 00:29:18,250 --> 00:29:23,710 ¿Vale? Entonces vamos a hacer uno con datos reales para verlo bien, si queréis. 295 00:29:23,710 --> 00:29:30,490 en el tipo test entra también teoría de la unidad 5 296 00:29:30,490 --> 00:29:34,049 solo son los ejercicios, puede haber algo de teoría de la unidad 5 297 00:29:34,049 --> 00:29:36,349 lo que me lleva, ahora hacemos el ejercicio 298 00:29:36,349 --> 00:29:41,529 de datos emparejados, pero por ejemplo acordaos 299 00:29:41,529 --> 00:29:45,609 había ciertas cosas de teoría de la unidad 5 que son importantes 300 00:29:45,609 --> 00:29:50,049 que luego, bueno de teoría, que a lo mejor no tienen 301 00:29:50,049 --> 00:29:52,950 una aplicación tan práctica en los ejercicios, pero por ejemplo 302 00:29:52,950 --> 00:30:01,990 sí que tenemos que saber distinguir si os acordáis lo que son las variables discretas y continuas, cualitativas y cuantitativas. 303 00:30:03,569 --> 00:30:13,410 Por ejemplo, una pregunta tipo test a lo mejor es, tú te sabes una, yo qué sé, pues tú te pregunto algo de los intervalos de confianza, 304 00:30:13,589 --> 00:30:21,970 tú sabes perfectamente calcularlo, pues si es una pregunta tipo test que te dice, yo qué sé, pues ¿qué test de estudio me utilizas para calcular los intervalos de confianza? 305 00:30:21,970 --> 00:30:26,089 y te pone la de una cola, la de dos colas, no se utiliza la T de student, 306 00:30:26,390 --> 00:30:28,910 pues tú sabes que tienes que utilizar la de dos colas, ¿vale? 307 00:30:29,589 --> 00:30:32,809 La T de los datos emparejados se mira en la de dos colas. 308 00:30:33,309 --> 00:30:37,089 Bueno, un poco depende también de lo que nos estén diciendo. 309 00:30:37,490 --> 00:30:45,970 Vamos a ir al ejercicio concreto, porque si nos dicen que si los resultados... 310 00:30:45,970 --> 00:30:49,029 No, se puede plantear también de una cola. 311 00:30:49,250 --> 00:30:51,650 Date cuenta, vamos a ver en lo del análisis de sangre. 312 00:30:51,970 --> 00:31:17,609 ¿Qué hemos puesto este del hierro? Si yo te digo, vale, mi hipótesis nula es que la pastilla no hace efecto, es que la media, el valor x sub a, no hace falta que sea media, perdón, es igual que x sub b. 313 00:31:17,609 --> 00:31:21,890 O sea, que antes y después el valor es realmente el mismo estadísticamente, ¿vale? 314 00:31:22,089 --> 00:31:31,130 Mi hipótesis alternativa es que el valor inicial es más bajo que el valor final, ¿no? 315 00:31:31,470 --> 00:31:36,009 Eso significaría que mi pastilla está funcionando. 316 00:31:36,630 --> 00:31:40,950 Se podría plantear también, aquí sería lo más correcto, pero bueno, si cayese algo de este estilo, 317 00:31:41,549 --> 00:31:44,490 yo dejaría muy claro cómo hay que plantear la hipótesis, ¿vale? 318 00:31:44,490 --> 00:31:47,390 Porque aquí es mucho más complicado. 319 00:31:47,609 --> 00:31:51,490 que en el caso de comparar dos series de datos no emparejados, ¿vale? 320 00:31:51,490 --> 00:31:58,029 Pero imagínate que el enunciado fuese, di si la pastilla baja o sube el hierro en sangre. 321 00:31:58,490 --> 00:32:05,849 Si te dice si lo sube, tienes que plantear la hipótesis alternativa como que el final es mayor que el inicial. 322 00:32:06,789 --> 00:32:16,529 Si te dijese, di si la pastilla varía el hierro en sangre, pues ya ahí sí que podrías plantear, vale, 323 00:32:16,529 --> 00:32:25,250 La alternativa es que realmente la de después y la de antes no son iguales, ¿vale? 324 00:32:25,730 --> 00:32:35,990 Pero reitero que si cayese algo así de datos emparejados con hipótesis dejaría muy claro si es unilateral o bilateral, ¿vale? 325 00:32:35,990 --> 00:32:38,670 Porque sé que es más complicado. 326 00:32:38,670 --> 00:32:49,069 Entonces, por ejemplo, vamos a inventarnos uno como este, ¿vale? Si queréis. 327 00:32:50,250 --> 00:32:59,589 Yo voy al hospital y me sacan sangre antes de un tratamiento, ¿vale? Antes del tratamiento. 328 00:32:59,589 --> 00:33:16,950 Y mi valor inicial es 12,3 y después del tratamiento mi valor es 12,7. 329 00:33:16,950 --> 00:33:17,950 que es lo que hemos visto, ¿no? 330 00:33:17,950 --> 00:33:19,630 Y el siguiente, 11 con... 331 00:33:19,630 --> 00:33:21,829 Ay, perdonad, que estoy en mi Excel con puntos. 332 00:33:27,690 --> 00:33:31,569 11 con 1, 11 con 2. 333 00:33:33,470 --> 00:33:38,410 12 con 2, 12 con 9. 334 00:33:38,410 --> 00:33:45,410 9 con 8, 9 con 9. 335 00:33:46,950 --> 00:33:52,890 10 con 1, 10 con 6, ¿vale? Por ejemplo. 336 00:33:53,309 --> 00:33:54,410 Entonces, ¿qué tenemos aquí? 337 00:33:55,130 --> 00:33:58,650 Tenemos una serie de muestras, vamos a numerarlas, 338 00:33:59,910 --> 00:34:03,349 podemos llamar la 1, la 2, la 3, la 4 y la 5, ¿vale? 339 00:34:03,349 --> 00:34:10,510 Y yo lo que quiero demostrar con mi tratamiento es que realmente aumenta el nivel de hierro en sangre, por ejemplo. 340 00:34:10,510 --> 00:34:28,750 Vale, pues yo puedo, lo primero, plantear las hipótesis y lo que hemos dicho, mi hipótesis nula es que después del tratamiento no hay un cambio significativo, ¿vale? 341 00:34:28,750 --> 00:34:49,869 O sea que antes del tratamiento y después del tratamiento tengo el mismo valor, que yo lo veo, repito esto con lo de los ensayos estadísticos, yo veo que no es exactamente el mismo número. 342 00:34:49,869 --> 00:34:53,230 A lo que voy es si estadísticamente hay diferencia, ¿vale? 343 00:34:53,630 --> 00:34:56,489 Porque puede ser eso, pues que hay una pequeña variación, por lo que sea, 344 00:34:56,590 --> 00:34:58,750 pero que realmente no es que mi tratamiento esté funcionando. 345 00:34:59,170 --> 00:35:01,070 Entonces, esto es antes y esto es después. 346 00:35:01,429 --> 00:35:04,349 Mi hipótesis nula, que la pastilla no sirve, que antes es igual que después. 347 00:35:04,829 --> 00:35:09,269 Ahora, yo quiero demostrar que mi pastilla sube el nivel de hierro en sangre. 348 00:35:09,590 --> 00:35:11,690 Entonces, ¿cómo sería mi hipótesis alternativa? 349 00:35:11,690 --> 00:35:24,150 que yo digo, vale, pues el valor inicial es más bajo que el final porque mi pastilla sube el nivel de hierro en sangre, ¿vale? 350 00:35:25,030 --> 00:35:31,309 Entonces, las hipótesis ya las tengo planteadas, ahora tendré que calcular mi T calculada 351 00:35:31,309 --> 00:35:37,590 y me tendré que ir a las tablas a comparar con la T tabulada, ¿vale? 352 00:35:37,590 --> 00:35:50,530 Entonces, lo primero que hago es calcular la diferencia, que es restar, ¿no? 353 00:35:51,030 --> 00:36:00,010 Digo, vale, pues esta menos esta, ¿no? 12,7 menos 12,3. 354 00:36:00,949 --> 00:36:06,809 Lo podría hacer al revés, podría hacer 12,3 menos 12,7 y entonces me daría menos 0,4. 355 00:36:06,809 --> 00:36:10,889 Pero como luego lo pongo en valor absoluto, me da igual cómo hacerlo, ¿vale? 356 00:36:12,329 --> 00:36:14,949 11,2 menos 11,1. 357 00:36:15,550 --> 00:36:19,030 12,9 menos 12,2. 358 00:36:20,610 --> 00:36:23,750 9,9 menos 9,8. 359 00:36:25,530 --> 00:36:28,829 Y 10,6 menos 10,1. 360 00:36:30,030 --> 00:36:33,849 Vale, aquí tengo la diferencia de cada uno de estos pares de valores. 361 00:36:33,849 --> 00:36:44,150 tengo 5 datos, mi n es igual a 5 porque tengo 5 parejas de valores y por lo tanto 5 diferencias he calculado 362 00:36:44,150 --> 00:36:51,329 y ahora calculo la media de estas diferencias, que sería sumar todas y dividirlas entre 5 363 00:36:51,329 --> 00:36:59,369 o meterlas en la calculadora, estos datos, como cuando meto los de cualquier serie de valores y calcular la media. 364 00:36:59,369 --> 00:37:21,369 Yo lo voy a hacer aquí con la hoja de cálculo, ¿vale? Para hacerlo, y digo, vale, la media, 0,36, esto es la media, y la desviación típica o desviación estándar, que acordaos que son sinónimos, desviación típica. 365 00:37:21,369 --> 00:37:29,429 científica, la voy a calcular también con el Excel en vez de con la calculadora y me 366 00:37:29,429 --> 00:37:38,349 da que es 0,2607, ¿vale? Me da esto de aquí, media y desviación científica. Pues ahora 367 00:37:38,349 --> 00:37:47,469 me voy a calcular la T, que si acordáis la T calculada, tenemos aquí nuestra fórmula 368 00:37:51,369 --> 00:38:14,039 vamos a pegar para tenerla bien a la vista, donde estaba yo, aquí, aquí, vale, pues 369 00:38:14,039 --> 00:38:15,039 como calculo mi T 370 00:38:15,039 --> 00:38:15,900 es 371 00:38:15,900 --> 00:38:27,619 la media de mis diferencias 372 00:38:27,619 --> 00:38:28,739 que la he calculado 373 00:38:28,739 --> 00:38:30,239 y me daba 374 00:38:30,239 --> 00:38:31,619 0,36 375 00:38:31,619 --> 00:39:00,800 Es igual a 0,36 dividido entre la desviación, que la vamos a redondear a 0,26. 376 00:39:01,619 --> 00:39:16,340 ¿Vale? 0,26 y dividido esto a su vez por raíz de n, que n eran los 5 pares de valores por raíz de 5. 377 00:39:16,340 --> 00:39:36,519 Y esto nos da pues 0,36, esto dividido entre esto y lo multiplicamos por raíz de 5, esto con la calculadora todo y nos da 3,087. 378 00:39:37,519 --> 00:39:44,260 Tenemos que nuestra T calculada es 3,087. 379 00:39:44,260 --> 00:39:57,079 Vale, yo quiero hacer esta comparación de si mi pastilla sube de verdad el hierro con una fiabilidad al 95%. 380 00:39:57,079 --> 00:39:59,619 ¿Qué tengo que mirar ahora? 381 00:39:59,739 --> 00:40:01,880 Tengo que mirar la tabla de la TED Student, ¿no? 382 00:40:01,880 --> 00:40:08,619 Para buscar la tabulada, la tengo que buscar al 95%, la tengo que buscar de una cola, ¿no? 383 00:40:08,619 --> 00:40:18,440 ¿Por qué? Mi hipoteca alternativa es unilateral, o sea, alfa, 0,05, una cola. 384 00:40:19,019 --> 00:40:28,920 ¿Y cuántos son mis grados de libertad? Tengo 5 pares de valores, n es igual a 5, n-1 es igual a 4. 385 00:40:28,920 --> 00:40:46,699 Pues me voy a mi tabla de la T de Steven y digo, vale, me voy, dos colas no, quiero una cola, pues voy aquí abajo, 0,05, esta columna de aquí y me tengo que ir a M es igual a 4, me he dicho, ¿no? 386 00:40:46,699 --> 00:41:03,380 Esta de aquí, 2,13. Mi T tabulada es 2,13. 387 00:41:03,380 --> 00:41:14,400 Entonces, T calculada es igual a 2,3. 388 00:41:14,980 --> 00:41:18,820 ¿Mi T calculada es menor que mi T tabulada? 389 00:41:19,460 --> 00:41:21,900 No, rechazo la hipótesis nula. 390 00:41:23,380 --> 00:41:25,920 La rechazo, porque la que yo he calculado es mayor. 391 00:41:27,400 --> 00:41:28,340 ¿Eso qué quiere decir? 392 00:41:28,940 --> 00:41:30,300 Que acepto la alternativa. 393 00:41:30,300 --> 00:41:40,300 que realmente sí que puedo decir que estadísticamente mis datos finales son mayores que mis datos iniciales. 394 00:41:45,099 --> 00:41:55,429 El cuestionario de la unidad 3 es hasta el 30 de mayo. 395 00:41:55,550 --> 00:41:58,889 Los cuestionarios los dejo abiertos todos hasta antes del examen. 396 00:42:00,829 --> 00:42:04,869 Lo que tiene fecha de entrega son las tareas. 397 00:42:04,869 --> 00:42:15,730 pero los cuestionarios por petición popular os los dejé hasta el final para que los podáis mirar. 398 00:42:15,989 --> 00:42:18,369 ¿Se podría ver el caso de que fuera a mirar la tele de dos colas? 399 00:42:18,630 --> 00:42:24,809 Bueno, se podría plantear así, tú quieres decir, imagínate el mismo ejercicio que hemos hecho, 400 00:42:24,809 --> 00:42:37,889 pero nuestro enunciado nos dice que sí, se puede asumir que es distinto el hierro antes del tratamiento y después. 401 00:42:38,309 --> 00:42:45,570 Te pregunta que si es distinto. En ese caso, tú harías exactamente lo mismo, que eso es lo importante, 402 00:42:45,690 --> 00:42:47,849 que el tratamiento del ejercicio es exactamente igual. 403 00:42:47,849 --> 00:42:57,829 Pero tú ahora, en vez de mirar aquí, mirarías aquí, en la de dos colas, porque te da igual que sea mayor o menor, simplemente que sea distinto. 404 00:42:58,449 --> 00:43:07,570 ¿Qué pasa? Que lo que os he dicho antes, que 2,78 sigue siendo más pequeño que 3,087. 405 00:43:08,050 --> 00:43:12,070 Por lo tanto, nos da el mismo resultado, que sí que aceptamos la hipotesis alternativa. 406 00:43:12,869 --> 00:43:17,969 Por poder sí que podría ser, solo que estadísticamente sí que se podría plantear así. 407 00:43:18,710 --> 00:43:24,849 Pero sí que es verdad que no tiene muchas veces sentido, si yo por ejemplo estoy haciendo un estudio clínico 408 00:43:24,849 --> 00:43:35,210 y lo que quiero es saber si realmente sube el hierro en sangre o baja el azúcar en sangre, etc., 409 00:43:35,210 --> 00:43:39,289 no tiene sentido que haga una hipótesis bilateral, lo que tiene sentido es que lo haga unilateral. 410 00:43:39,289 --> 00:43:42,690 porque lo estoy limitando a un lado 411 00:43:42,690 --> 00:43:43,769 básicamente 412 00:43:43,769 --> 00:43:45,750 y es más restrictivo 413 00:43:45,750 --> 00:43:46,829 porque realmente 414 00:43:46,829 --> 00:43:51,030 es más difícil 415 00:43:51,030 --> 00:43:52,489 que mi valor 416 00:43:52,489 --> 00:43:54,530 sea más pequeño que esto 417 00:43:54,530 --> 00:43:57,250 a que sea más pequeño que esto 418 00:43:57,250 --> 00:43:57,730 ¿vale? 419 00:43:58,309 --> 00:43:59,670 de eso se trata, que al final es 420 00:43:59,670 --> 00:44:01,849 el mismo tratamiento 421 00:44:01,849 --> 00:44:03,570 se hace el ejercicio de la misma manera 422 00:44:03,570 --> 00:44:06,510 pero el de dos colas, como el valor es un poquito más alto 423 00:44:06,510 --> 00:44:07,909 es más fácil 424 00:44:07,909 --> 00:44:11,650 rechazar la hipótesis nula 425 00:44:11,650 --> 00:44:14,409 ¿vale? perdón, aceptar la hipótesis nula 426 00:44:14,409 --> 00:44:15,309 ¿vale? 427 00:44:18,199 --> 00:44:18,719 porque 428 00:44:18,719 --> 00:44:19,820 como mi t 429 00:44:19,820 --> 00:44:23,320 calculado tiene que ser más pequeño 430 00:44:23,320 --> 00:44:25,239 que el tabulado, si el tabulado es más grande 431 00:44:25,239 --> 00:44:27,800 pues es más fácil que yo acepte esa hipótesis 432 00:44:27,800 --> 00:44:29,260 ¿vale? 433 00:44:29,340 --> 00:44:31,300 simplemente eso, o sea, es una cuestión de 434 00:44:31,300 --> 00:44:33,519 que varían un poco 435 00:44:33,519 --> 00:44:34,380 los decimales 436 00:44:34,380 --> 00:44:40,599 Y a ver, de aquí yo creo que he contestado todo. 437 00:44:48,130 --> 00:44:52,329 ¿Más dudas de algo? Que nos queda un poquillo de tiempo. 438 00:44:53,429 --> 00:45:05,489 De aquí al examen me podéis escribir, si os surgen cosas de última hora, me escribís al correo a la aula virtual y yo os contesto rápido. 439 00:45:05,489 --> 00:45:14,750 Pero vamos, básicamente tener en mente eso, que al final estos ejercicios asustan, bueno, asustan. 440 00:45:15,070 --> 00:45:18,590 Se ven un poco farragosos porque son fórmulas muy largas, con mucho número, 441 00:45:18,710 --> 00:45:22,489 pero luego si lo tenéis claro y lo razonas son todos iguales. 442 00:45:23,889 --> 00:45:26,849 Los de la distribución normal también son todos iguales. 443 00:45:26,929 --> 00:45:30,570 Tengo que tener en cuenta que eso lo quería hacer y no lo he hecho. 444 00:45:31,610 --> 00:45:32,829 Me había gustado un repaso. 445 00:45:35,489 --> 00:45:45,349 Lera, disculpa 446 00:45:45,349 --> 00:45:48,329 sabes el ejercicio 447 00:45:48,329 --> 00:45:50,050 de la práctica 448 00:45:50,050 --> 00:45:52,429 ¿te acuerdas que había uno donde se planteaban 449 00:45:52,429 --> 00:45:54,210 las dos medidas 450 00:45:54,210 --> 00:45:56,150 la del manual 451 00:45:56,150 --> 00:45:57,550 la de la valoración manual 452 00:45:57,550 --> 00:45:59,730 y la valoración con el aparato 453 00:45:59,730 --> 00:46:01,130 no sé cuánto, Toledo 454 00:46:01,130 --> 00:46:06,070 Sí, es que a mí ese se me dio muy raro 455 00:46:06,070 --> 00:46:10,630 porque la primera desviación estándar me dio muy baja 456 00:46:10,630 --> 00:46:13,630 y luego la segunda porque me dio muy alta 457 00:46:13,630 --> 00:46:16,110 y luego cuando hice la comparación para la tabla F 458 00:46:16,110 --> 00:46:20,630 me dio 223,4 la F calculada 459 00:46:20,630 --> 00:46:37,510 Sí, tres y luego cuatro 460 00:46:37,510 --> 00:46:40,989 tres el manual y cuatro la... 461 00:46:40,989 --> 00:46:53,460 En el manual tenías uno de los datos que era muy discrepante con el resto. Por ejemplo, es que creo que era el tuyo, no quiero abrirlo. ¿Cuál es el que tenías? Yo qué sé. 462 00:46:54,559 --> 00:46:57,880 Sí, era 4208, 4269 y 4209. 463 00:47:10,760 --> 00:47:11,280 4208. 464 00:47:12,940 --> 00:47:17,059 Luego 4269 y 4209. 465 00:47:17,059 --> 00:47:29,190 De lo que fuera. 466 00:47:29,190 --> 00:47:33,150 ¿O era así, no? ¿O era ya el cálculo final de las masas? 467 00:47:34,030 --> 00:47:36,230 Ese era el porcentaje de ácido sálico. 468 00:47:36,250 --> 00:47:40,320 Ah, el porcentaje, vale, vale. 469 00:47:40,599 --> 00:47:40,860 Sí. 470 00:47:41,420 --> 00:47:43,000 Vale, ¿y en la automática? 471 00:47:44,139 --> 00:47:52,480 En la automática tenía 46,55, 58,95, bueno, ahí ya se va un poco. 472 00:47:52,500 --> 00:47:55,760 Esto es lo que hay, ¿y 5,5 y? 473 00:47:57,320 --> 00:48:00,019 51,84 y 50,04. 474 00:48:00,019 --> 00:48:04,860 Estoy casi segura 475 00:48:04,860 --> 00:48:07,380 Mira la corrección del ejercicio 476 00:48:07,380 --> 00:48:08,900 Porque estoy casi segura de que te lo puse 477 00:48:08,900 --> 00:48:10,059 Aquí lo que nos pasa 478 00:48:10,059 --> 00:48:12,699 Es que no lo he mirado, no lo he encontrado 479 00:48:12,699 --> 00:48:15,199 ¿Dónde está? 480 00:48:15,900 --> 00:48:16,960 En el ejercicio 481 00:48:16,960 --> 00:48:18,559 Que subisteis 482 00:48:18,559 --> 00:48:20,920 Tenéis una calificación 483 00:48:20,920 --> 00:48:22,500 Y luego unos comentarios 484 00:48:22,500 --> 00:48:25,000 A los que os he puesto 485 00:48:25,000 --> 00:48:26,860 Lo tenéis todo lo que fuera 486 00:48:26,860 --> 00:48:28,880 Pero creo que fue en tu caso concreto 487 00:48:28,880 --> 00:48:31,000 Algún compañero, pues sería tu compañero 488 00:48:31,000 --> 00:48:40,699 sino que lo hicisteis igual, que aquí en este caso lo que nos pasa es que realmente lo primero que tenemos que hacer antes de comparar el manual y el automático 489 00:48:40,699 --> 00:48:55,260 es ver si nuestros datos entre ellos tienen sentido. En el manual vemos 42,08, 42,69, 42,09, hago mi media y hago mi desviación y son unos valores que están muy cercanos entre ellos. 490 00:48:55,260 --> 00:49:04,239 Aquí lo que pasa es que como este dato se aleja tanto, o sea, entre este dato y este dato hay 12 unidades de diferencia. Es una bestialidad. 491 00:49:04,880 --> 00:49:19,480 Entonces, lo que tendríamos que haber hecho es, lo primero, podríamos haberlo hecho a lo bruto y decir, vale, este dato no me vale, lo elimino y voy a hacer una medida más o simplemente me quedo con estos tres. 492 00:49:19,480 --> 00:49:38,519 O lo podríamos haber hecho bonito y haber calculado, por ejemplo, según el criterio de la Q de Dixon, si este dato es anómalo o no. Y nos hubiese salido seguro que es anómalo, porque es el que del que dudamos menos el más cercano y dividido entre el rango. 493 00:49:38,519 --> 00:49:43,699 nos hubiese dado una Q que seguro que hubiese sido más grande que la Q tabulada 494 00:49:43,699 --> 00:49:49,760 entonces hubiésemos eliminado este dato y ya al hacer la media y la desviación 495 00:49:49,760 --> 00:49:56,099 hubiésemos tenido una desviación mucho más pequeña y al hacer la F 496 00:49:56,099 --> 00:50:02,260 que es la varianza de uno entre la varianza del otro, esta varianza ya no hubiese sido tan tan grande 497 00:50:02,260 --> 00:50:05,719 porque la varianza lo que nos dice es los dispersos que están los datos 498 00:50:05,719 --> 00:50:19,500 Estos datos están muy, muy dispersos porque este dato de aquí es un dato anómalo, ¿vale? Entonces, tu F te dio tan, tan grande, si me acuerdo de ver un guión de prácticas con 300 y pico, una burrada de una F. 499 00:50:19,960 --> 00:50:27,500 Entonces, no pasa nada, pero lo único que podríamos haber hecho el análisis de decir, vale, es que este dato a lo mejor no lo tengo que utilizar. 500 00:50:27,500 --> 00:50:49,400 ¿Por qué te doy una F tan grande? Pues porque la S cuadrado de aquí es muy pequeña porque hay muy poca variabilidad, será de 0, lo que sea, 0, lo que sea y esta de aquí probablemente sea de 1 o 2 unidades. 501 00:50:49,400 --> 00:50:56,340 Entonces, si divides entre 0, algo es como multiplicar por 10, te da una f de 30, a lo mejor, ¿vale? 502 00:50:56,340 --> 00:51:07,639 Entonces, sí o sí, tu f calculada, cuando te vayas a las tablas, va a ser más grande que la f tabulada. 503 00:51:08,059 --> 00:51:14,079 Entonces, tú rechazas la hipótesis nula y dices que tus dos series de datos no son igual de precisas, ¿vale? 504 00:51:14,099 --> 00:51:16,820 Porque esta es mucho más precisa que esta. 505 00:51:16,820 --> 00:51:30,519 ¿Qué pasa? Que si lo hubiésemos eliminado este valor, pues a lo mejor, aunque esta S es más grande que esta, haciendo nuestros cálculos estadísticos, sí que nos podría salir que estadísticamente son similares. 506 00:51:30,519 --> 00:51:34,860 Vale, de acuerdo. 507 00:51:47,480 --> 00:51:52,139 Entre ellas tiene coherencia y nuestra serie de datos 2 entre ellas tiene coherencia. 508 00:51:52,579 --> 00:51:59,039 Pues eso, voy a comparar pHs de una muestra y pHs de otra. 509 00:51:59,300 --> 00:52:02,900 Esto es agua residual de un lado y esto es agua residual de otro. 510 00:52:02,900 --> 00:52:13,000 Y esta es 3,5, 3,4, 3,3, 5,2, 3,1. 511 00:52:13,000 --> 00:52:21,940 Y esta es 4,0, 4,1, 4,2 y 4,0 otra vez. 512 00:52:22,519 --> 00:52:31,360 Yo, antes de ponerme a comparar esta media con esta media, igual tengo que echar un ojo y decir, vale, de estos datos de aquí, 513 00:52:31,519 --> 00:52:39,079 de estos datos de aquí, ¿hay alguno discrepante? Digo, hombre, pues este 5,2 suena raro, ¿no? 514 00:52:39,619 --> 00:52:44,300 pues venga, voy a hacer un cálculo de la Q de Dixon, que también os digo que si pasa esto en el examen, 515 00:52:44,860 --> 00:52:49,239 o sea que yo os especifico si tenéis que hacer el test, que no tenéis que pensar, 516 00:52:49,239 --> 00:52:57,679 o que decir vosotros antes de hacer la comparación entre dos series de datos, 517 00:52:58,559 --> 00:53:01,460 si entre esas series de datos los datos están bien. 518 00:53:01,659 --> 00:53:06,099 Si lo tenéis que hacer, yo os lo especifico, de primero evalúa si hay algún dato anómalo 519 00:53:06,099 --> 00:53:09,619 Y luego compara la media de las dos series de datos. 520 00:53:09,619 --> 00:53:21,280 Pero aquí en este caso yo diría, vale, 5,2 menos 3,5, dividido entre 5,2 menos 3,1. 521 00:53:22,980 --> 00:53:28,119 3,1, que esto me da, pues 5,2 menos 3,5. 522 00:53:28,119 --> 00:53:32,840 menos 3,5 523 00:53:32,840 --> 00:53:34,179 dividido entre 524 00:53:34,179 --> 00:53:36,559 5,2 525 00:53:36,559 --> 00:53:38,599 menos 3,1 526 00:53:38,599 --> 00:53:43,780 esto me da 527 00:53:43,780 --> 00:53:45,800 0,809 528 00:53:45,800 --> 00:53:48,159 ¿vale? he calculado mi Q 529 00:53:48,159 --> 00:53:50,400 de Dixon 530 00:53:50,400 --> 00:53:52,599 0,809 531 00:53:52,599 --> 00:53:53,199 he dicho ¿no? 532 00:53:53,679 --> 00:53:55,980 0,81 533 00:53:55,980 --> 00:53:56,739 venga 534 00:53:56,739 --> 00:54:17,340 Me voy a mi tabla de la Q de Dixon, al 95% y para 5 datos, que son los que tengo, creo que puesto 5, 1, 2, 3, 4, 5, 6. 535 00:54:17,340 --> 00:54:32,360 Mi Q es 0,710. Mi Q calculada es 0,710. ¿Qué quiere decir esto? 536 00:54:32,360 --> 00:54:43,840 Como mi Q calculada es más grande que la de las tablas, este valor no lo puedo utilizar. Este valor lo rechazo. 537 00:54:43,840 --> 00:54:50,059 entonces ahora compararé esta serie de datos con esta serie de datos 538 00:54:50,059 --> 00:54:51,420 pero este valor ya no existe 539 00:54:51,420 --> 00:54:54,480 ahora mismo tengo cuatro datos aquí y cuatro datos aquí 540 00:54:54,480 --> 00:54:56,980 porque este que tenía originalmente ya no lo tengo 541 00:54:56,980 --> 00:55:01,400 entonces en el caso de tu valoración 542 00:55:01,400 --> 00:55:03,219 que había un dato muy discrepante 543 00:55:03,219 --> 00:55:07,340 pues tendríamos que haber a lo mejor hecho este ejercicio previo 544 00:55:07,340 --> 00:55:08,940 haber eliminado ese dato 545 00:55:08,940 --> 00:55:11,059 y entonces nos hubiese dado una desviación 546 00:55:11,059 --> 00:55:13,519 y por lo tanto una varianza mucho más pequeña 547 00:55:13,519 --> 00:55:16,079 Sí, ahí estaba la clave 548 00:55:16,079 --> 00:55:18,860 Es que no me di cuenta 549 00:55:18,860 --> 00:55:21,420 Bueno, pues ya para la siguiente 550 00:55:21,420 --> 00:55:23,519 Ya en el examen 551 00:55:23,519 --> 00:55:25,460 Te vuelve a pasar, claro, para el examen 552 00:55:25,460 --> 00:55:31,440 Si nos tienes que comparar 553 00:55:31,440 --> 00:55:32,800 Medias entre dos métodos 554 00:55:32,800 --> 00:55:34,619 Si no compras las medias, te das la condición primero 555 00:55:34,619 --> 00:55:36,519 Vale, justo lo que acabo de decir 556 00:55:36,519 --> 00:55:38,840 Os lo diría expresamente 557 00:55:38,840 --> 00:55:41,099 Puede pasar, es un ejercicio perfectamente 558 00:55:41,099 --> 00:55:43,440 Que yo os diga, tienes esta serie de datos 559 00:55:43,440 --> 00:55:49,219 de una valoración manual y esta de una valoración automática. Evalúa si en la valoración 560 00:55:49,219 --> 00:55:54,840 manual hay algún dato discrepante o evalúa si en la valoración automática hay un dato 561 00:55:54,840 --> 00:55:59,179 discrepante o evalúa si en alguna de las dos hay un dato discrepante. Y ahí lo harías 562 00:55:59,179 --> 00:56:10,179 por separado. O sea, tú si te digo valoración manual y valoración automática y tienes 563 00:56:10,179 --> 00:56:20,139 aquí tus datos. Y te digo, ¿hay algún dato discrepante? Tú miras si hay algún dato discrepante 564 00:56:20,139 --> 00:56:26,820 aquí y miras si hay algún dato discrepante aquí. Por ahora, mientras estemos viendo 565 00:56:26,820 --> 00:56:31,780 solo si hay datos discrepantes, entre ellas no se mezclan. Y luego ya, una vez que las 566 00:56:31,780 --> 00:56:36,400 has analizado, que dices, no, todos los datos están bien. O sí, tengo que eliminar este 567 00:56:36,400 --> 00:56:59,760 Luego ya calculas la media de uno, la media del otro, la desviación de uno, la desviación del otro, 568 00:56:59,880 --> 00:57:04,619 la varianza de uno, la varianza del otro y ya te pones a hacer ensayos estadísticos, ¿vale? 569 00:57:04,619 --> 00:57:19,500 Pero lo que digo, si os doy un ejercicio así de base de comparar estas dos series de datos, no tenéis que hacer lo de evaluar la Q de Dixon en cada uno de ellos, a no ser que esté especificado porque puede ser un apartado del ejercicio. 570 00:57:19,500 --> 00:57:39,300 ¿Vale? ¿Alguna duda más? ¿Qué queráis? Si no, eso, cuando repaséis y tal, lo que surja me lo mandáis. 571 00:57:39,300 --> 00:57:41,920 ¿Te puedo preguntar algo muy rápido? 572 00:57:42,139 --> 00:57:42,539 Sí, claro. 573 00:57:43,599 --> 00:57:47,139 Es que yo en este mismo ejercicio seguí, bueno, y lo miraré en las correcciones, 574 00:57:47,320 --> 00:57:51,139 pero claro, como me lié tanto con los resultados, ¿sabes qué me puse a buscar? 575 00:57:51,139 --> 00:57:56,780 Que si las, que si las, si eran, ¿cómo se llama? 576 00:57:58,199 --> 00:57:58,800 Ay, Dios. 577 00:58:00,800 --> 00:58:04,139 Las frecuencias homogéneas. 578 00:58:05,500 --> 00:58:07,000 Las varianzas homogéneas. 579 00:58:07,000 --> 00:58:17,679 Bueno, pareces homogéneas, claro, porque dije, no era homogénea esta, porque esto, como se ha vuelto un lío, esto tiene truco, dije yo, no sé, claro, el problema estaba en el origen. 580 00:58:18,119 --> 00:58:33,789 Pero tú, mira, a ti, por ejemplo, como te salió en tu, ¿cómo lo hiciste? Luego lo hiciste bien, el desarrollo, o sea, si en realidad tenías que haber eliminado ese valor, pero luego todo lo demás de la práctica lo hiciste bien porque utilizaste lo que tenías que usar. 581 00:58:34,389 --> 00:58:41,210 Otros compañeros tuyos, como tenían datos más homogéneos, su prueba S les dio que las varianzas sí que eran homogéneas. 582 00:58:41,210 --> 00:58:50,409 Entonces ellos calcularon la T de Steven con esta fórmula, buscaron en la tabla con estos grados de libertad y dieron el resultado acorde a lo que les había salido. 583 00:58:50,590 --> 00:58:59,849 Y tú, estoy casi segura, que tú dijiste, vale, es que mis varianzas no son homogéneas y tú calculaste la T de Steven con esta fórmula y los grados de libertad con esta. 584 00:58:59,849 --> 00:59:03,769 y lo comparaste, o sea, que lo que hiciste estaba bien, el razonamiento estaba todo bien, 585 00:59:04,289 --> 00:59:09,469 lo único que no teníamos datos de calidad en el laboratorio y tendríamos que haberlos afinado 586 00:59:09,469 --> 00:59:19,530 y haber eliminado ese dato que nos hacía que nuestros resultados no tuviesen la precisión suficiente. 587 00:59:19,849 --> 00:59:26,510 Cuando tenemos un dato que nos discrepa mucho, lo suyo es evaluarlo para eliminarlo, 588 00:59:26,510 --> 00:59:40,989 Igual que esto en el caso de que tengamos una serie de datos, ¿vale? La valoración automática, pues tenemos una serie de datos y uno discrepa. Si tenemos una correlación de datos, también se nos dan esos casos a veces, ¿no? Imaginaos que esto está recto. 589 00:59:40,989 --> 00:59:46,610 Tengo este dato aquí, este dato es X, esto es Y. 590 00:59:48,150 --> 00:59:56,969 Y yo hago una recta de regresión y tengo este dato, este dato, y de repente tengo este dato aquí y este dato aquí. 591 00:59:56,969 --> 01:00:05,250 Y yo mi línea recta que atraviesa todos estos datos sería algo así porque tengo este. 592 01:00:05,250 --> 01:00:11,530 Entonces, si yo calculo mi R cuadrado con este dato incluido, me va a dar una R cuadrado baja. 593 01:00:11,710 --> 01:00:21,750 Si yo este dato lo elimino, porque parece que es un dato incorrecto, que no he tomado bien, que ha habido algún tipo de fallo, 594 01:00:21,750 --> 01:00:37,889 este R cuadrado va a aumentar y mi recta de calibrado va a pasar, a ver si lo tengo de otro color, va a atravesar, digamos, mucho más cerca de todos los puntos que tengo, ¿no? 595 01:00:38,170 --> 01:00:45,929 O sea, mi recta ahora sería algo más así, algo más así, imaginaos que esto está recto, ¿vale? 596 01:00:46,650 --> 01:00:55,590 Entonces, igual que cuando tenemos un punto discrepante en nuestra recta de calibrado, lo evaluamos y lo solemos evaluar y lo eliminamos, 597 01:00:56,190 --> 01:01:06,190 cuando tenemos en una serie de datos, que no es una correlación, que es una serie de datos, un punto discrepante, pues también lo evaluamos para ver si lo tenemos que eliminar, ¿vale? 598 01:01:06,449 --> 01:01:15,150 Que podría pasar, según el criterio que utilicemos, imagínate que tú tienes un dato, que tú lo ves a ojo y dices, ostras, esto es muy distinto a los demás, 599 01:01:15,150 --> 01:01:36,670 pero luego tú haces el análisis estadístico y te dice que no, que está bien, pues tú te lo quedas, si lo vas a hacer por estadística te quedas ese dato, pero vamos, el del caso en concreto que has dicho tú del informe de laboratorio, ese con cualquier tipo de test que hubiésemos hecho nos hubiese salido que lo rechazásemos seguro porque era muy distinto del resto.