1 00:00:02,859 --> 00:00:08,199 turnos llenos y no hay lista de espera, así que en principio van a quedarse los dos turnos 2 00:00:08,199 --> 00:00:14,359 tal cual están. Y lo único, sí, ya os lo dije, pero os lo repito, si alguien no va 3 00:00:14,359 --> 00:00:18,160 a poder venir finalmente por lo que sea, por favor que escriba, o sea, si le ha surgido 4 00:00:18,160 --> 00:00:24,980 algo en el trabajo, si sabe desde, en cuanto sepáis, si no vais a poder venir, me mandáis 5 00:00:24,980 --> 00:00:29,800 un mensaje para que os borre de la lista y si hay alguien en lista de espera que se apuntan 6 00:00:29,800 --> 00:00:36,679 estos días pueda entrar y si no, para redistribuir el material y demás. Entonces, bueno, nuestras 7 00:00:36,679 --> 00:00:47,560 prácticas presenciales van a ser una el día jueves 19 de febrero y la otra, que es exactamente 8 00:00:47,560 --> 00:00:53,359 igual, solo hay que apuntarse a un turno porque se hace la misma práctica, el día 5 de marzo. 9 00:00:53,359 --> 00:01:11,299 Entonces, lo que pasa durante este mes, que ya os lo habrá dicho María José en tutoría, si lo habéis visto, es que como hay mucho lío, muchas prácticas, nos da tiempo a venir a clase y las profesoras también estamos apoyando unos módulos a otros, 10 00:01:11,299 --> 00:01:28,239 Entonces, bueno, las clases de las videoconferencias no se dan con normalidad. Entonces, yo en el caso aquí de calidad, ya os digo, el día 19 no hay videoconferencia porque tenemos la práctica presencial, el día 26 no va a haber videoconferencia, 11 00:01:28,239 --> 00:01:43,239 El jueves 5 tenemos otra vez práctica presencial y tampoco hay videoconferencia. Y luego el jueves 12 probablemente tampoco haya porque el jueves 19 sí que hay… 12 00:01:43,239 --> 00:01:51,439 y donde estamos, estamos aquí el jueves 19 y el jueves 26, si no me equivoco, 13 00:01:51,519 --> 00:01:54,379 este es el calendario de la Comunidad de Madrid, tenemos clase normal. 14 00:01:54,799 --> 00:02:02,340 Entonces, en principio, los dos días que no tenemos prácticas, tampoco vamos a tener sesiones, 15 00:02:02,340 --> 00:02:06,319 porque vamos bastante bien de tiempo. Os lo he dicho muchas veces, 16 00:02:06,500 --> 00:02:09,620 pero lo gordo de este módulo es esta unidad que estamos dando, 17 00:02:09,620 --> 00:02:32,759 Y luego las demás son mucho más cortitas y les dedicamos muy pocas sesiones. Si yo viese que tenemos que aligerar, lo que sí que haré será poner alguna videoconferencia estos días o subiros yo la videoconferencia grabada en otro momento y para que la veáis vosotros. 18 00:02:32,759 --> 00:02:44,840 Como la mayoría además no os podéis conectar por cuestiones de trabajo y las veis después, en el caso de que lo necesitemos os subiré videoconferencias al aula virtual para que las tengáis. 19 00:02:44,840 --> 00:03:03,919 Con lo mismo, con las explicaciones igual. Esto en relación a las prácticas. Os subiré también la semana que viene o la siguiente cuando la expliquemos, un poquito más adelante porque todavía queda. 20 00:03:03,919 --> 00:03:27,599 Os subiré unas normas de laboratorio, un vídeo para que lo veáis y bueno, de todas formas las normas de seguridad en el laboratorio son comunes a todos los módulos, entonces como muchos de vosotros y vosotras vais a hacer bastantes módulos distintos de prácticas, pues bueno, lo que hagáis en uno os va a aplicar al resto, ¿vale? 21 00:03:27,599 --> 00:03:49,199 Y luego, respecto a las optativas, bueno, ya os preguntaré porque a lo mejor no sé si os habéis apuntado el mismo día a las dos prácticas porque a lo mejor pueden tener una parte común, pero bueno, esto ya os lo diré más adelante, ¿vale? 22 00:03:50,199 --> 00:03:57,539 Entonces, vamos a retomar con el temario. Bueno, ¿alguna duda de esto relacionada con las prácticas o similar? 23 00:04:00,490 --> 00:04:12,909 A ver el chat. Nadie. Vale, pues nada. Vamos a comenzar con lo que dejamos la semana pasada de teoría. 24 00:04:12,909 --> 00:04:21,209 que si os acordáis habíamos terminado con los ensayos de significancia 25 00:04:21,209 --> 00:04:26,110 de encontrar un resultado dudoso y evaluarlo para ver si lo tenemos que eliminar o no 26 00:04:26,110 --> 00:04:33,689 y vamos a pasar, bueno, comenzamos, planteamos la comparación entre los parámetros de dispersión 27 00:04:33,689 --> 00:04:39,430 de dos series de medidas y vimos que cuando comparamos la precisión, la dispersión 28 00:04:39,430 --> 00:04:48,610 de dos series de medidas, utilizamos la varianza y que estos ensayos serán aplicables a posibles diferencias 29 00:04:48,610 --> 00:04:53,370 en la precisión que ofrecen dos métodos, dos laboratorios o dos analistas. 30 00:04:54,250 --> 00:05:01,509 Comparar las varianzas de dos muestras estadísticas para ver si los datos son de una población con una varianza homogénea 31 00:05:01,509 --> 00:05:05,189 o homocedásticas o heterogénea, heterocedásticas. 32 00:05:05,189 --> 00:05:28,050 Entonces, casos prácticos, lo que comentamos el otro día. Estamos en el laboratorio, dos personas distintas están realizando el mismo análisis y queremos comparar si la precisión de esos dos analistas ha sido la misma, utilizando mismos reactivos, mismo procedimiento, mismo equipo. 33 00:05:28,050 --> 00:05:51,269 Lo hacemos comparando las varianzas, porque acordaos que la precisión, lo que nos indica, es un indicativo de cómo de cerca están las medidas, cómo de cerca están entre ellas, cómo de dispersos están los datos. 34 00:05:52,029 --> 00:05:57,089 Aquí tenemos, en el ejemplo típico de la diana, tenemos alta precisión y alta exactitud. 35 00:05:57,790 --> 00:06:06,389 Precisión porque está en el centro de la diana, perdón, exactitud porque está en el centro de la diana y precisión porque todos los datos están cercanos. 36 00:06:06,949 --> 00:06:15,230 Aquí, en cambio, no tenemos una buena exactitud porque estamos alejados del centro, pero los datos están muy juntitos, o sea que sí que tenemos una alta precisión. 37 00:06:15,230 --> 00:06:28,569 ¿Vale? Luego tenemos baja precisión, baja exactitud, que es un caso que no queremos en absoluto, y baja precisión, alta exactitud, que esto es un poco controvertido, 38 00:06:28,569 --> 00:06:38,550 porque aquí tenemos alta exactitud, ¿por qué? Por casualidad absoluta, ¿no? Si nosotros tiramos un dardo aquí, otro aquí, otro aquí, otro aquí, y hacemos la media, 39 00:06:38,550 --> 00:06:42,550 nos va a dar en el centro, pero bueno, eso no significa que sea exacto el método, es 40 00:06:42,550 --> 00:06:48,009 exacto por casualidad. Entonces, bueno, nosotros idealmente queremos esto y lo que vamos a 41 00:06:48,009 --> 00:06:56,730 poder evaluar es esto y esto. Ahora nos vamos a fijar en la precisión. ¿Cómo hacemos 42 00:06:56,730 --> 00:07:03,790 eso? Con la varianza. ¿Te acuerdas que la varianza es la distancia que hay? Si os acordáis 43 00:07:03,790 --> 00:07:17,339 de la fórmula de la varianza, que a ver que os la voy a poner aquí y si os acordáis 44 00:07:17,339 --> 00:07:30,120 de las varianzas, las tenemos por aquí, la varianza lo que nos está diciendo es la diferencia 45 00:07:30,120 --> 00:07:36,259 que hay entre cada uno de los valores y la media dividido entre n-1, el número de valores 46 00:07:36,259 --> 00:07:43,319 es menos 1. O sea, es la media de las diferencias de cada uno de los datos a el valor medio. 47 00:07:44,560 --> 00:07:49,560 Todo ello elevado al cuadrado porque queremos que sea siempre positivo. Por eso se eleva 48 00:07:49,560 --> 00:07:55,060 al cuadrado, porque si no, si os dais cuenta, si lo hiciésemos de otra manera, vamos a 49 00:07:55,060 --> 00:08:12,480 coger esto para pegárnoslo aquí, yo tengo mis datos, imaginaos que este es el valor 50 00:08:12,480 --> 00:08:22,879 medio y yo tengo mis datos, que tengo pues uno por aquí, otro por aquí, otro por aquí, 51 00:08:22,879 --> 00:08:28,620 otro por aquí, otro por aquí, otro por aquí, ¿vale? Lo que me está diciendo la 52 00:08:28,620 --> 00:08:35,100 varianza es la diferencia que hay entre la media, que es ese valor central que hemos 53 00:08:35,100 --> 00:08:42,659 marcado en azul, que lo voy a poner más finito, la diferencia entre la media, que es ese valor 54 00:08:42,659 --> 00:08:54,460 central, y cada uno de los valores. O sea, esta diferencia, esta diferencia, esta diferencia, 55 00:08:54,460 --> 00:09:03,980 ¿Por qué la elevo al cuadrado? Porque si no, imaginaos, si esto es más 1 y esto es menos 1, la diferencia me queda como si fuese 0 y eso es mentira. 56 00:09:03,980 --> 00:09:11,240 La diferencia sí que hay una diferencia con ambos, solo que una tiene valor positivo y otra tiene valor negativo. 57 00:09:11,240 --> 00:09:35,159 Entonces, lo que hago es coger cada uno de mis datos, le resto el valor medio, lo que me dé lo elevo al cuadrado, o sea, si esto es menos uno, menos uno al cuadrado más uno y uno al cuadrado más uno. 58 00:09:35,159 --> 00:09:50,340 Luego los sumo todos y lo divido entre n-1. Entonces eso me está indicando cuanto mayor sea la varianza, a mayor varianza mayor dispersión de los datos. 59 00:09:50,340 --> 00:10:08,720 Si yo tuviese todos los datos muy juntitos, muy juntitos, aquí muy pegaditos, si fuesen estos mis datos y están todos muy cerca del valor medio, la varianza va a ser más pequeña porque estas diferencias van a ser más pequeñas, o sea que todas sumadas van a ser más pequeñas. 60 00:10:08,720 --> 00:10:22,240 La varianza me da un indicativo de la precisión que tiene un método. Entonces, si quiero comparar las precisiones de dos métodos o de dos analistas o de dos laboratorios, lo hago a través de las varianzas. 61 00:10:22,240 --> 00:10:39,700 Y una cosa importantísima, acordaos que varianza es S al cuadrado. S es desviación típica y S al cuadrado es varianza. Si a mí en un ejercicio me dan la S y yo quiero la S al cuadrado, simplemente la elevo al cuadrado. 62 00:10:39,700 --> 00:10:46,259 Si me pasase al revés, que me dan la S al cuadrado y yo quiero tener la S, ¿qué hago? Pues la raíz cuadrada. 63 00:10:50,379 --> 00:10:59,100 Entonces, recordado esto, vamos a ver cómo hacemos esa prueba. 64 00:10:59,240 --> 00:11:05,039 El otro día lo empezamos a ver que lo hacemos como con todos los ensayos estadísticos. 65 00:11:05,039 --> 00:11:22,330 Pues calculamos un estadístico, como calculamos la Q de Dixon o la R de Gruss, buscamos en una tabla el valor de ese estadístico 66 00:11:22,330 --> 00:11:30,769 con unas ciertas características que van a depender de los grados de libertad y después comparamos a ver si es mayor el que hemos calculado nosotros 67 00:11:30,769 --> 00:11:38,830 o el que viene en las tablas. Si el que hemos calculado nosotros es menor, aceptamos la hipótesis nula, ¿vale? 68 00:11:38,990 --> 00:11:46,710 Que nuestra hipótesis nula es que las varianzas sí que son iguales. En cambio, si el nuestro, el que nosotros hemos calculado, 69 00:11:46,870 --> 00:11:54,070 es mayor que el de las tablas, rechazamos la hipótesis nula y, por lo tanto, no son igual de precisos, ¿vale? 70 00:11:54,070 --> 00:12:15,029 ¿Vale? Entonces, eso lo hacemos con la prueba F y planteamos hipótesis como siempre, ¿no? Porque esto se trata de contrastar hipótesis, de plantear qué es lo que puede pasar y luego decidir con apoyo de matemático si aceptamos o no aceptamos eso que hemos planteado. 71 00:12:15,029 --> 00:12:28,590 Entonces, la hipótesis nula es que la varianza del primer método es igual que la del segundo, ¿vale? Esto puede ser S sub A y esto S sub B, da igual los nombres, pero es que la varianza de uno es igual que la del otro. 72 00:12:29,110 --> 00:12:41,549 Y la hipótesis nula, acordaos, que es H sub 0. La hipótesis alternativa, en el caso de la prueba F, para comparar varianzas, es unilateral, ¿vale? 73 00:12:41,549 --> 00:13:08,110 Luego entenderéis mejor esto cuando veamos lo de las medias. ¿Pero eso qué significa? Yo, cuando tengo un planteamiento de hipótesis, yo puedo decir, vale, tengo mi valor, ¿no? Mi S cuadrado del método 1 y mi S cuadrado del método 2. 74 00:13:08,110 --> 00:13:17,870 Me los voy a inventar los datos y voy a decir que este es 7,1 y que este de aquí es 6,9, ¿vale? 75 00:13:18,289 --> 00:13:30,049 Mi hipótesis nula es, acordaos, que S cuadrado de A es igual a S cuadrado de B, ¿no? 76 00:13:30,350 --> 00:13:33,269 O sea, obviamente yo veo los números y veo que son diferentes, 77 00:13:33,269 --> 00:13:48,389 Pero lo que se trata del contraste de hipótesis es ver si con la estadística inferencial, ver si esas diferencias, esas pequeñas diferencias, se deben a que realmente son distintos o a errores que hay en el proceso analítico, a la variabilidad inherente al método. 78 00:13:48,389 --> 00:14:03,629 ¿Vale? Si yo, por ejemplo, tuviese, imaginaos, S sub A es igual a 7 con 1, S cuadrado, perdón, y S cuadrado del método B es igual a 7 con 1, no hay hipótesis que tenga que hacer, ¿no? 79 00:14:03,629 --> 00:14:08,090 Yo ya lo estoy viendo que son exactamente iguales. Es cuando son distintas, pero hay una pequeña diferencia. 80 00:14:09,129 --> 00:14:17,230 Entonces, lo que hemos dicho, mi hipótesis nula es que son iguales. Y ahora yo puedo plantear la hipótesis alternativa de dos maneras. 81 00:14:17,230 --> 00:14:47,210 Puedo decir, vale, una de las maneras es que esta varianza es distinta de esta varianza y la otra manera es decir que esta varianza... 82 00:14:47,230 --> 00:14:52,070 Esta varianza es mayor que esta varianza. 83 00:14:53,649 --> 00:15:01,149 ¿Tendría sentido intentar demostrar estadísticamente que esta varianza es mayor que esta? 84 00:15:01,269 --> 00:15:03,250 No, no tiene sentido, ya estoy viendo los datos. 85 00:15:03,590 --> 00:15:05,269 Entonces, estas son las opciones que tengo. 86 00:15:05,769 --> 00:15:13,730 Yo puedo tratar de demostrar que son iguales, tratar de demostrar que son distintas o tratar de demostrar que una es mayor que la otra. 87 00:15:13,730 --> 00:15:18,129 Estas son las hipótesis que vamos a plantear siempre 88 00:15:18,129 --> 00:15:20,870 Cuando comparemos varianzas, cuando comparemos medias 89 00:15:20,870 --> 00:15:24,809 Cuando comparemos una media con un valor de referencia 90 00:15:24,809 --> 00:15:27,129 Que son todos los ensayos que vamos a ver 91 00:15:27,129 --> 00:15:29,269 Ahora, ¿qué pasa? 92 00:15:29,350 --> 00:15:34,669 Que ya os digo que cuando comparamos precisamente varianzas 93 00:15:34,669 --> 00:15:39,169 Utilizamos siempre este tipo de hipótesis 94 00:15:39,169 --> 00:15:41,210 La hipótesis unilateral 95 00:15:41,210 --> 00:15:59,929 Esta de aquí es la hipótesis bilateral, pero cuando comparamos la prueba S siempre utilizamos la unilateral. ¿Por qué? Porque por convenio es lo que se utiliza, por poder se podrían plantear las otras, pero no se hace en la práctica. 96 00:15:59,929 --> 00:16:17,409 ¿Vale? Entonces, acordaos, cuando veíamos lo de la TED Student, os acordáis cuando hacíamos el intervalo de confianza, que teníamos aquí nuestro nivel de significancia, por ejemplo, al 95%, y teníamos que todo lo que estaba afuera era alfa, ¿no? 97 00:16:17,409 --> 00:16:32,370 alfa era un 5%, 0,05, y era este trocito más este trocito, o sea, este lado de aquí es la mitad de alfa, 2,5, 98 00:16:32,370 --> 00:16:45,409 y este de aquí la otra mitad, 2,5, ¿vale? Aquí es bilateral porque estamos considerando tanto este lado como este lado, ¿vale? 99 00:16:45,409 --> 00:17:01,700 Podemos tener otras tablas como esta de aquí, que si os dais cuenta, lo único que nos cuenta es uno de los lados. 100 00:17:02,679 --> 00:17:10,200 ¿Veis que no es simétrico? Tenemos aquí nuestro 95% y el 0,05 es solamente uno de los lados de aquí. 101 00:17:10,200 --> 00:17:25,279 Entonces, en lo que se va a diferenciar nuestro ensayo de contraste de hipótesis es simplemente en qué tabla vamos a mirar o dónde vamos a mirar en la tabla, pero se va a realizar exactamente igual. 102 00:17:26,539 --> 00:17:30,200 Entonces, vamos a volver a nuestras hipótesis. 103 00:17:32,079 --> 00:17:38,640 Hemos planteado la hipótesis nula, que significa que la varianza de uno es igual que la varianza del otro. 104 00:17:38,640 --> 00:17:54,460 Y ahora vamos a plantear la hipótesis alternativa, que en este caso es unilateral, que es que una de las varianzas es mayor que la otra. Una vez que hemos planteado las hipótesis, vamos a calcular F. 105 00:17:54,460 --> 00:18:13,460 ¿Y F cómo se calcula? Muy fácil, F es el cociente, o sea, la división entre las dos varianzas de mis dos métodos, de mis dos operadores y siempre tengo que colocar la más grande arriba, ¿vale? Esto siempre tiene que ser mayor de 1, la F, la más grande arriba y la más pequeña abajo. 106 00:18:13,460 --> 00:18:17,759 ahora, ya tengo calculado el estadístico, facilísimo 107 00:18:17,759 --> 00:18:22,640 igual que con la Q de Dixon hacía el valor dudoso menos el valor más cercano 108 00:18:22,640 --> 00:18:25,000 dividido entre el rango y ya tenía el valor de Q 109 00:18:25,000 --> 00:18:30,539 pues aquí para tener el valor de F cojo la varianza de 1 y la divido entre la varianza del otro 110 00:18:30,539 --> 00:18:35,880 si en el ejercicio me han dado la desviación, la elevo al cuadrado y calculo la F 111 00:18:35,880 --> 00:18:39,819 eso mucho cuidado con no confundir varianzas y desviaciones 112 00:18:39,819 --> 00:18:42,700 que es un fallo muy fácil de tener 113 00:18:42,700 --> 00:18:53,319 Entonces, una vez que hemos calculado este valor de f, nos vamos a la tabla y buscamos el valor de f crítico 114 00:18:53,319 --> 00:18:56,380 Entonces, esto de aquí es una tabla simplificada 115 00:18:56,380 --> 00:19:03,099 Tenéis otra en el aula virtual, que la quería haber dejado abierta, pero la abrimos ahora en un momento 116 00:19:03,099 --> 00:19:13,039 A ver dónde la tenemos, aquí en tablas, la tabla de f 117 00:19:13,039 --> 00:19:25,599 Es la misma tabla que tenéis aquí en los apuntes, solo que esta está recortada, tiene pocos valores y esta de aquí no está tan simplificada. 118 00:19:25,599 --> 00:19:43,700 Mirad que aquí arriba tenéis 0,05, o sea, alfa igual a 0,5, 95%, y en la siguiente hoja tenéis 0,01, o sea, 99%. 119 00:19:43,700 --> 00:19:49,039 Lo digo porque aquí también hay que ver qué nivel de significancia queremos utilizar en estos ensayos. 120 00:19:49,039 --> 00:20:03,799 ¿Vale? Entonces, ya hemos calculado nuestro valor de f cogiendo la varianza mayor y dividiéndola entre la varianza menor y ahora lo que queremos es buscar un valor en la tabla para poder compararlo con ese valor de f que hemos calculado. 121 00:20:03,799 --> 00:20:24,339 ¿Cómo lo hacemos? Nosotros hemos puesto la varianza del numerador entre la varianza del denominador. Tenemos que mirar aquí los grados de libertad del numerador, o sea, del que hemos puesto arriba y aquí los del denominador, o sea, los que hemos puesto abajo. 122 00:20:24,339 --> 00:20:39,400 Entonces, imaginaos que yo he cogido mi pizarra, la voy a poner en dos pantallas. 123 00:20:39,400 --> 00:21:15,789 Imaginaos que yo tengo para un método, el caso que habíamos puesto antes, que es ese suba al cuadrado, es igual, creo que había puesto 7,1 me parece, da igual esto porque son datos un poco inventados, y es de 6,9. 124 00:21:15,789 --> 00:21:44,230 Y esto lo he obtenido haciendo una serie de medidas que en este caso yo he tomado 10 medidas, en el caso del A y en el caso del B lo he hecho también con 10 medidas. 125 00:21:44,230 --> 00:21:58,289 Vamos a poner, ¿no? ¿Cómo calculo F? Pues F es el mayor, 7,1, dividido entre el menor, 6,9. 126 00:21:58,990 --> 00:22:04,650 Y esto me tiene que dar mayor que 1. A ver si tenéis calculadora por ahí, que ya la tengo guardada. 127 00:22:04,910 --> 00:22:16,380 La voy a sacar. Y si no, abrimos Excel y lo hacemos con Excel en un momento. 128 00:22:16,380 --> 00:22:20,940 1, 0, 3 129 00:22:20,940 --> 00:22:24,880 ¿A cuántas cifras significativas redondeamos? 130 00:22:25,019 --> 00:22:27,019 Pues mire, como tenemos que hacer 131 00:22:27,019 --> 00:22:31,220 tenemos que compararlo con el valor que tenemos aquí en la tabla 132 00:22:31,220 --> 00:22:34,920 normalmente da un poco igual porque nunca, nunca hay tanta duda 133 00:22:34,920 --> 00:22:37,500 pero vamos a dejar 1, 0, 3, que nos vale 134 00:22:37,500 --> 00:22:39,299 Sí, porque luego es 0 135 00:22:39,299 --> 00:22:43,279 1, 0, 28, 9, 8, ¿sabes? 136 00:22:43,920 --> 00:22:45,319 Vale, mira, aquí tenemos 137 00:22:45,319 --> 00:22:53,359 es que depende, mira, ves esta tabla, aquí tiene un decimal, aquí tiene 3, entonces, bueno, vamos a coger que es 1,03, ¿vale? 138 00:22:53,880 --> 00:23:02,559 Entonces, ¿cuántos grados de libertad os acordáis? Los grados de libertad es, cuando tenemos una serie de valores, es n menos 1, 139 00:23:02,700 --> 00:23:09,519 que es donde mirábamos para, en la T de Student también, pues aquí tenemos n igual a 10, o sea que tenemos que mirar en el 9, 140 00:23:09,519 --> 00:23:32,970 Y aquí n igual a 10 en el 9 también. Entonces, en este caso, como son los dos iguales, vamos a mirar en la tabla para grados de libertad del numerador, del que está arriba, 9, y grados de libertad del denominador, 9 también. 141 00:23:32,970 --> 00:23:46,549 Nuestro valor sería 3,179. Entonces, nuestra F tabulada es 3,719, creo que ponía. 142 00:23:46,549 --> 00:24:14,799 Entonces, mi f calculada es menor que mi f tabulada y por lo tanto acepto mi hipótesis nula y eso significa que digo que la varianza de un método es igual que la varianza del otro. 143 00:24:14,799 --> 00:24:39,480 Aquí hemos puesto el caso más fácil en el que tenemos 10 medidas en los dos, pero ahora imaginaos que yo he hecho, del método A he hecho 6 medidas y del método B he hecho 8 medidas, por ejemplo. 144 00:24:39,480 --> 00:24:57,140 ¿Vale? Mi F la calculo exactamente igual, ¿no? O sea, esto es lo que ha cambiado, pero si mi método tiene una varianza de 7,1 el A y de 6,9 el B, yo calculo la F poniendo 7,1 entre 6,9, ¿no? 145 00:24:57,140 --> 00:25:19,140 ¿Vale? Ahora, ¿dónde tengo que mirar en la tabla? Acordaos que en la tabla se mira, en las filas pongo los grados de libertad del numerador y en las columnas los grados de libertad del denominador, ¿vale? 146 00:25:19,140 --> 00:25:35,319 O sea, del que está arriba y del que está abajo. Pues ahora me voy a la tabla y tendré que mirar para n-1 igual a 5 y para n-1 igual a 7. 147 00:25:35,319 --> 00:25:48,900 Pues vamos a la tabla, vamos a la misma que estábamos viendo. El numerador es el que he dicho que es el que tiene 5 medidas, ¿no? 148 00:25:48,900 --> 00:26:10,180 5 hemos dicho, 6 que ya es que no me acuerdo, 6, n-1 igual a 5, pues me voy aquí, porque es el numerador el que he puesto arriba, y el denominador n-1 igual a 7, o sea que mi valor será 5 y 7, 3,972, ¿vale? 149 00:26:10,180 --> 00:26:30,170 Ahora mi f, mi f tabulada es 3,972. Imaginaos que es al revés, que yo he hecho en el a 8 medidas, bueno voy a borrarlo para no... 150 00:26:30,170 --> 00:26:40,180 En el A he hecho 8 medidas y en el B he hecho 6. 151 00:26:40,680 --> 00:26:48,720 Ahora, 8 menos 1 es igual a 7 y 6 menos 1 es igual a 5, ¿no? 152 00:26:49,059 --> 00:26:54,400 Pues me voy y tengo que mirar ahora en el numerador, porque es la varianza más grande. 153 00:26:54,400 --> 00:26:58,680 O sea, yo siempre estoy poniendo S sub A entre S sub B, ¿no? 154 00:26:58,680 --> 00:27:01,559 Ese sub A es el mayor 155 00:27:01,559 --> 00:27:03,680 He hecho ocho medidas 156 00:27:03,680 --> 00:27:06,059 Pues en el numerador tendré que mirar siete 157 00:27:06,059 --> 00:27:09,619 Y en el denominador, que he hecho seis medidas 158 00:27:09,619 --> 00:27:11,539 Tendré que mirar en el cinco 159 00:27:11,539 --> 00:27:16,220 O sea, miro siete en el numerador 160 00:27:16,220 --> 00:27:18,420 Y cinco en el denominador 161 00:27:18,420 --> 00:27:22,099 Y mi F es 4,876 162 00:27:22,099 --> 00:27:26,779 Mi F es, en este caso 163 00:27:26,779 --> 00:27:39,640 4,876 la F de la tabla y la F que ya había calculado es 1,03. 164 00:27:39,640 --> 00:27:49,740 Entonces, en este caso ocurre lo mismo. Puedo decir que las varianzas de los dos métodos son iguales, comparando la precisión. 165 00:27:49,740 --> 00:28:07,500 Y si lo hago con dos valores que sean más diferentes, pues probablemente me dé este f mayor que el f tabulado y por lo tanto tenga que rechazar esa hipótesis nula y decir que no, que son distintos, que uno es mayor que el otro. 166 00:28:07,500 --> 00:28:31,799 Voy a parar aquí para mirar el chat, a ver si alguien ha dicho algo. Vale, nadie ha dicho nada. ¿Alguna duda respecto a esto? ¿Continuamos? ¿Hacemos algún ejemplo más? 167 00:28:33,180 --> 00:28:35,220 ¿Tenías abierto el calendario escolar por algo? 168 00:28:35,779 --> 00:28:38,799 Sí, porque os he comentado lo de las sesiones presenciales. 169 00:28:38,799 --> 00:29:08,779 Ah, es que claro, yo no estaba al principio. 170 00:29:08,799 --> 00:29:21,599 no se dan con regularidad. Por ejemplo, el día 19 y el día 5, en calidad, no tenemos videoconferencia porque estamos en el laboratorio. Bueno, yo estoy en el laboratorio y la mitad de vosotros que os hayáis apuntado. 171 00:29:22,559 --> 00:29:32,180 Y luego, el resto de los días depende un poco del módulo. Por ejemplo, en calidad, ya os lo digo para que lo sepáis, que el día 26 no vamos a tener clase, el jueves 26. 172 00:29:32,180 --> 00:29:56,380 Y luego el jueves 12 y el jueves 19 lo vamos a ir viendo según vayan desarrollándose los turnos, porque normalmente os sobrecargáis mucho cuando tenéis prácticas, porque son muchas horas, son muchos módulos, muchos venís del trabajo directamente y al final se os acumulan y se os hacen un poco bola las videoconferencias. 173 00:29:56,980 --> 00:30:01,200 O sea que básicamente nos van a ir diciendo al día si tenemos o no. 174 00:30:01,200 --> 00:30:13,839 No, al día no, al día no. Os lo vamos a ir diciendo cada módulo. Yo ya os he dicho, por ejemplo, que el 26 seguro que no. Y en estos días yo subiré un aviso al aula virtual para informaros de qué día tendremos clase en directo. 175 00:30:13,839 --> 00:30:34,559 ¿Qué pasa? Que como muchos no podréis asistir, lo que también hacemos en estos periodos, depende un poco del módulo, es que yo grabo la videoconferencia y os la subo. No tenemos la clase ese día, como siempre, a la misma hora, pero os subo una videoconferencia y eso va a depender un poco de cómo vayamos avanzando. 176 00:30:34,559 --> 00:30:52,859 Pero nada, os lo he comentado al principio, ya podéis apuntar si queréis en vuestro calendario, porque eso es 100% seguro, que el 19 y el 5 no hay clase, quien esté en el laboratorio bien y quien no, pues esta semana descansa, y que el jueves 26 tampoco tenemos clase, en directo. 177 00:30:52,859 --> 00:31:18,460 Y luego el día 12 y el 19, el 19 sí porque ya han acabado las prácticas, o sea que el 19 sí que tendremos y el 12 pues un poco en función de cómo esté de sobrecarga las prácticas y demás y de cómo hayamos avanzado o subo una videoconferencia online o la doy presencial o la cancelamos esa semana, ¿vale? 178 00:31:18,460 --> 00:31:30,680 Pero no os preocupéis porque yo todo esto lo he comentado al principio de la clase para empezar porque éramos muy poquitos, pero todo yo os lo voy a subir al aula virtual. Entonces, lo vais a tener por escrito. ¿Vale? 179 00:31:31,339 --> 00:31:32,319 Vale, gracias, Elena. 180 00:31:32,319 --> 00:31:54,480 Nada, entonces, me vuelvo a nuestro… vamos bastante bien de tiempo, si os sirve de consuelo, este tema es muy largo, pero una vez que termine este tema ya nos queda bastante, un temario mucho, mucho, mucho más ligero, ¿vale? El tema 5 es al final la mitad de, más de la mitad del curso. 181 00:31:54,480 --> 00:32:09,740 Entonces, esta tablita que tenéis aquí en los apuntes es exactamente la del 0,05%, o sea, el 0,05 que es alfa, o sea, el 95%, 182 00:32:09,740 --> 00:32:16,859 y es la misma que tenéis aquí extendida, la que os acabo de enseñar está de aquí, ¿vale? 183 00:32:17,059 --> 00:32:20,339 Simplemente, pues una está recortada, una es más amplia que la otra. 184 00:32:20,339 --> 00:32:41,640 Si os dais cuenta, tenemos 1, 2, 3, 4 y aquí de repente del 12 pasamos al 15. ¿Qué nos pasaría si nosotros, por ejemplo, tenemos en el numerador 14 medidas y n-1 es igual a 13 y aquí no tenemos el número 13? 185 00:32:41,640 --> 00:33:02,400 Pues que tendríamos o que hacer o que interpolar o que cogernos el más restrictivo para no pillarnos los dedos, ¿vale? O sea, si estamos entre este y este valor, nos cogeríamos este, que es el más pequeño, que es el que tiene más posibilidades de que rechacemos la hipótesis para ser siempre que ser conservador en este caso. 186 00:33:02,400 --> 00:33:15,519 Pero bueno, también os digo que no suele pasar lo de que tengamos que interpolar en la tabla. Y luego tenemos esta tabla aquí, pero si buscáis en internet, porque esta nos gusta, porque os apetece, hay muchísimas tablas. 187 00:33:15,519 --> 00:33:28,339 Igual que las de la TED Student, que las veíamos, los datos que tengamos dentro van a ser siempre los mismos, pero hay muchos formatos que pueden ser más o menos visuales. 188 00:33:28,880 --> 00:33:39,019 Yo os he subido las dos que me gustan a mí y las que vais a tener el día del examen, porque todas estas tablas, obviamente esto, nadie tiene que aprenderse absolutamente nada de memoria, 189 00:33:39,019 --> 00:33:50,339 solamente hay que saber cómo utilizarlas. Entonces, el día del examen, vosotros tenéis, aparte de los enunciados, tenéis un taquito en el que tenéis todas las tablas que necesitáis, 190 00:33:50,579 --> 00:34:01,940 una hoja con unas fórmulas que veremos en las siguientes sesiones. Entonces, como yo la tabla que os doy en el examen es esta de aquí, 191 00:34:01,940 --> 00:34:08,599 os recomiendo que para ejercicios, para familiarizaros, para practicar y demás, pues utilicéis las mismas que os pongo yo. 192 00:34:09,000 --> 00:34:15,059 Pero que hay muchos formatos distintos que son iguales y solo cambia como verlos. 193 00:34:16,699 --> 00:34:29,480 Entonces, hemos visto que tenemos que ver los grados de libertad del numerador, del denominador, buscar la f y ver si la f que nosotros hemos calculado es mayor o es menor. 194 00:34:29,480 --> 00:34:51,280 Y así podemos aceptar o rechazar la hipótesis nula. Ahora, vamos a ir a otro de los casos con los que nos podemos encontrar cuando queremos, en los casos de comparación de valores, de estadística inferencial. 195 00:34:51,280 --> 00:35:08,659 Que es el caso que nosotros queremos comparar una serie de valores con un valor de referencia, ¿vale? ¿Qué puede ser un valor de referencia? Pues imaginaos que nosotros estamos haciendo una serie de medidas y lo queremos comparar con un patrón, ¿vale? 196 00:35:08,659 --> 00:35:16,019 del cual tenemos un valor que entendemos que es el valor, entre comillas, real, el valor válido. 197 00:35:17,119 --> 00:35:25,019 O imaginaos, se utiliza en eventos deportivos y demás, pues yo que sé, en ciclismo, 198 00:35:25,019 --> 00:35:33,860 que se mira mucho lo del dopaje, entonces tú puedes tener unas concentraciones concretas de una sustancia en sangre, 199 00:35:33,860 --> 00:35:40,760 yo no entiendo mucho, pero bueno, hay algo que toman los de alto rendimiento 200 00:35:40,760 --> 00:35:45,679 que si se pasan se considera dopaje, pero si se quedan en el límite no 201 00:35:45,679 --> 00:35:53,000 pues hay un valor de referencia que es el valor a partir del cual, ojo, que se considera dopaje 202 00:35:53,000 --> 00:35:58,380 pues podemos analizar una serie de muestras y compararlas con ese valor de referencia 203 00:35:58,380 --> 00:36:03,840 entonces para eso nos sirve este tipo de contraste de hipótesis que vamos a hacer ahora 204 00:36:04,679 --> 00:36:14,940 Entonces, ¿cómo se hace? Igual que todo lo que hemos dicho, se plantea una hipótesis nula, luego se plantea una hipótesis alternativa, 205 00:36:15,659 --> 00:36:25,820 se calcula un estadístico, que en este caso es el estadístico T, y después se compara el estadístico que nosotros hemos calculado con el de las tablas. 206 00:36:25,820 --> 00:36:33,320 Si el nuestro es menor, aceptamos la hipótesis nula. Si el nuestro es mayor, rechazamos la hipótesis nula. 207 00:36:33,840 --> 00:36:44,960 ¿Vale? Entonces, nuestra hipótesis nula, igual que antes, que nuestro valor medio, el valor de la media de nuestros valores, sí que es igual al valor de referencia. 208 00:36:45,639 --> 00:36:50,599 ¿Hipótesis alternativa? Pues aquí podemos plantear las dos, que os acordáis que acabamos de ver. 209 00:36:51,619 --> 00:37:01,059 Podemos decir, o, que es bilateral, que simplemente que mis valores medios son distintos que el valor de referencia, ¿vale? 210 00:37:01,059 --> 00:37:18,300 O sea, mis datos no son iguales. O puedo decir que mis datos son mayores o menores que el valor de referencia. En este caso, mi hipótesis que yo estoy planteando es bilateral y voy a tener que mirar en la tabla de dos colas, bi-dos. 211 00:37:18,300 --> 00:37:30,760 En este caso, si yo planteo esta hipótesis, voy a tener que utilizar la tabla de una cola, unilateral una cola, ¿vale? 212 00:37:31,659 --> 00:37:45,539 Entonces, bueno, las aplicaciones ya las he comentado, comprobar si hay error sistemático, decidir si una medida supera o no supera un valor determinado, por ejemplo, es una referencia legal. 213 00:37:45,539 --> 00:38:00,500 Entonces, ¿qué tenemos que hacer? Tenemos que calcular nuestro estadístico y nuestro estadístico en este caso es T, igual que en el caso anterior era F, que para rechazar resultados era la Q de Dixon o la R de Grubbs. 214 00:38:00,500 --> 00:38:13,840 En este caso calculamos T, ¿vale? ¿Y cómo se calcula T? Muy sencillo, es un cálculo muy fácil, es el valor absoluto, que por eso están aquí estas barras, o sea, tiene que ser siempre positivo, 215 00:38:13,840 --> 00:38:30,260 de el valor de referencia, o sea, el que queremos comparar, menos la media de las medidas que nosotros hemos hecho y todo ello dividido entre S y a su vez dividido por raíz de N. 216 00:38:30,260 --> 00:38:51,570 Esto es lo mismo que poner el raíz de n arriba, lo veis, ¿no? O sea, tenemos, esto a veces es un poco, cuesta un poco, pero si yo tengo, uy, si yo tengo, esto es lo mismo que decir, 217 00:38:51,570 --> 00:39:04,969 es igual que decir el valor absoluto de mi valor de referencia menos mi media 218 00:39:04,969 --> 00:39:11,090 dividido entre SI multiplicado por raíz de N, ¿vale? 219 00:39:11,090 --> 00:39:13,929 Porque ese partido por raíz de N está en el denominador 220 00:39:13,929 --> 00:39:20,929 y si yo tengo algo en el denominador dividiendo es lo mismo que si lo paso arriba multiplicando, ¿vale? 221 00:39:21,570 --> 00:39:27,949 Simplemente por si alguna vez veis la fórmula de otra manera y por si os liáis de algún modo haciéndola así, ¿vale? 222 00:39:28,510 --> 00:39:38,550 Entonces, si os dais cuenta, cuando hacíamos el intervalo de confianza era nuestra media más menos t por s entre raíz de n. 223 00:39:38,550 --> 00:39:45,550 Os dais cuenta que lo que estamos haciendo es básicamente despejar la t de aquí, ¿vale? 224 00:39:45,550 --> 00:40:11,650 Porque lo que nosotros hacemos es ver si nuestro valor, el valor que nosotros hemos calculado a partir de una serie de valores, x1, x2, x3, x4, si entra dentro del intervalo de confianza del más menos del valor de referencia que es el que consideramos válido. 225 00:40:11,650 --> 00:40:29,090 ¿Vale? Aquí yo tendría una serie de valores, haría la media de estos valores, que en este caso como son 4, n es igual a 4 y tendría una desviación que haría con la calculadora y calcularía, ¿vale? 226 00:40:29,090 --> 00:40:50,230 ojo que es desviación y no varianza, es S, no es S cuadrado, y tendría que calcular esta T, ¿vale? La calculo y luego ¿qué hago? Me voy a las tablas para ver cuál es el valor del T que está en las tablas, T tabulado. 227 00:40:51,170 --> 00:41:00,550 Entonces, aquí es donde radica un poco la dificultad o lo que puede ser más lío o lo que puede dar lugar a error, ¿vale? 228 00:41:00,550 --> 00:41:14,610 Yo me voy a las tablas y veis que aquí tenemos nuestra tabla de dos colas y si bajamos abajo tenemos nuestra tabla de una cola, ¿vale? 229 00:41:14,610 --> 00:41:28,690 ¿Vale? Entonces, si yo he planteado mi hipótesis de manera unidireccional, tengo que mirar aquí, ¿vale? Si yo la he planteado de manera bidireccional, tengo que mirarlo aquí. 230 00:41:28,690 --> 00:41:49,070 Si os dais cuenta, mirad, este es el 0,05, que es el 95%, ¿no? Este es el 0,05 y aquí es la mitad justo, ¿vale? O sea, el de una cola es como dividir el de dos colas entre dos, ¿vale? 231 00:41:49,070 --> 00:42:02,269 Entonces, el alfa me refiero. Calculo la T y tendré que mirar para el número de grados de libertad, que acordaos que es n-1, ¿vale? 232 00:42:02,269 --> 00:42:16,949 En el caso, aquí, que hemos puesto cuatro valores, los grados de libertad serían 4 menos 1 igual a 3, 233 00:42:18,010 --> 00:42:25,269 y entonces aquí yo tendría que buscar en mi tabla para grados de libertad 3, 234 00:42:25,269 --> 00:42:47,780 Entonces, luego me tendrían que decir con qué significancia lo quiero, si lo quiero al 95, si lo quiero al 99%, ¿vale? Si no nos dicen nada, es el 95. Y tendría que ver si yo estoy viendo si mis valores son simplemente distintos o si realmente uno tiene que ser mayor que el otro, ¿vale? 235 00:42:48,539 --> 00:42:54,719 Entonces, tengo que mirar los grados de libertad, 95%, y si es de una o de dos colas. 236 00:42:55,360 --> 00:42:57,579 Una o dos colas. 237 00:42:58,559 --> 00:43:09,570 Me voy a la tabla y digo, vale, pues imaginaos que es al 95% de dos colas para estos cuatro valores. 238 00:43:09,570 --> 00:43:17,809 Pues me iría aquí al 0,05 de dos colas para n-1 igual a 3. 239 00:43:17,809 --> 00:43:31,269 Aquí mi d sería 3,18. Ahora que me dices, no, no, pero es que yo lo quiero al 99% y además lo quiero de una cola. 240 00:43:31,269 --> 00:43:53,750 Pues, ¿qué tendría que hacer? Irme aquí a una cola y al 0,01, al 99%, para n igual a 3. Miraría en esta columna para n menos 1 igual a 3, que es 4,54. 241 00:43:53,750 --> 00:44:02,269 entonces aquí lo más complejo es ver si es de una o dos colas 242 00:44:02,269 --> 00:44:05,750 que el próximo día haremos ejercicios y veremos cómo lo sabemos 243 00:44:05,750 --> 00:44:11,210 y ver cómo tengo que mirar en la tabla 244 00:44:11,210 --> 00:44:17,090 pero si os dais cuenta lo que es el cálculo es muy sencillo 245 00:44:17,090 --> 00:44:19,889 es coger el valor de referencia que me dan 246 00:44:19,889 --> 00:44:24,329 restarle la media que he hecho yo de mis valores 247 00:44:24,329 --> 00:44:28,650 y dividirlo entre la desviación de mis valores 248 00:44:28,650 --> 00:44:30,789 entre raíz del número de mis valores 249 00:44:30,789 --> 00:44:32,010 y voy a tener la t 250 00:44:32,010 --> 00:44:35,309 y lo de siempre, si la t calculada 251 00:44:35,309 --> 00:44:39,989 es menor que la t de las tablas 252 00:44:39,989 --> 00:44:41,630 acepto la hipótesis nula 253 00:44:41,630 --> 00:44:45,489 si la t calculada es mayor que la t de las tablas 254 00:44:45,489 --> 00:44:47,309 rechazo la hipótesis nula 255 00:44:47,309 --> 00:44:59,969 Entonces, por ejemplo, este sería un ejercicio de comparación de un resultado con un valor de referencia 256 00:44:59,969 --> 00:45:04,269 Lo vamos a plantear, pero ejercicio resolveremos el próximo día 257 00:45:04,269 --> 00:45:12,050 Así, bueno, si queréis, como lo tenéis, le podéis dar una vuelta y lo podéis intentar hacer 258 00:45:12,050 --> 00:45:14,610 A ver si os sale 259 00:45:14,610 --> 00:45:31,809 Entonces, nos dice, la legislación establece un límite de 50 miligramos litro, esto que sería en la fórmula X referencia, para la concentración de nitratos en agua de consumo humano. 260 00:45:31,809 --> 00:45:49,969 El análisis obtenido en cinco puntos de la red de abastecimiento es el siguiente, 50,23, 50,30, 50,58, 51,06, 50,81. Y me dicen que si realmente hay evidencias de que se ha sobrepasado el límite legal. 261 00:45:50,550 --> 00:45:54,610 Entonces, ¿qué es lo que tengo que hacer yo? Pues lo primero, analizo mis datos, ¿no? 262 00:45:54,610 --> 00:46:03,610 Y tengo un n, a ver si puedo escribir aquí, no puedo, los voy a copiar y nos los llevamos a la pizarra. 263 00:46:03,610 --> 00:46:29,820 Ahora, tenemos que n es igual a 1, 2, 3, 4 y 5. 264 00:46:31,420 --> 00:46:35,039 Lo primero, vamos a comparar, vamos a ver qué es lo que estamos haciendo. 265 00:46:35,039 --> 00:46:44,639 Nosotros lo que queremos saber es si la media de nuestros datos supera el límite legal. 266 00:46:44,960 --> 00:46:47,019 No si es igual, si lo supera, ¿no? 267 00:46:52,090 --> 00:46:53,690 ¿Vale? Esto es lo que queremos saber. 268 00:46:54,849 --> 00:46:57,550 Y para ello vamos a plantear dos hipótesis. 269 00:46:57,550 --> 00:47:28,210 ¿La hipótesis nula? Es que no, que mi método, lo que yo he calculado es igual que el de referencia y mi hipótesis alternativa es que es mayor, ¿vale? 270 00:47:28,210 --> 00:47:45,590 Entonces, tendremos que calcular nuestra T, que es el valor absoluto del valor de referencia menos el valor medio, dividido entre S, dividido a su vez entre raíz de N. 271 00:47:45,590 --> 00:48:14,070 Vale, pues tengo n igual a 5, tengo la media que la tendré que calcular, que es la media de estos valores de aquí, que es 50,23 más 50,30 más 50,58, 51,06, 50,81. 272 00:48:14,070 --> 00:48:24,699 y me da una media de... algo he metido mal, porque me da un valor muy raro. 273 00:48:25,559 --> 00:48:29,519 Bueno, tendríamos que hacer la media, ¿vale? Es que estos ejercicios los vamos a resolver el próximo día. 274 00:48:30,019 --> 00:48:36,420 Tendríamos que también calcular la desviación y ya con eso, teniendo n, teniendo valor de referencia, 275 00:48:36,420 --> 00:48:43,420 teniendo el valor medio, podríamos calcular la t. Luego nos iríamos a la tabla y buscaríamos para el nivel de significancia, 276 00:48:43,420 --> 00:49:15,539 que aquí como no nos dicen nada, ¿qué nivel de significancia nos están diciendo? El 95%, ¿vale? Esto quedaos que si en un ejercicio o en cualquier caso real al que nos enfrentemos no nos dicen nada, nosotros utilizamos el 95% y si nos dicen otra cosa, el que nos digan, que nos pueden decir cualquiera, nos pueden decir eso, el 95, el 90, el 99, el 98, lo que sea, ¿vale? 277 00:49:15,820 --> 00:49:31,170 Entonces, quería plantearos el siguiente para ya resolver ejercicios el próximo día. 278 00:49:31,170 --> 00:49:38,170 Entonces, bueno, simplemente os lo voy a plantear porque igual si no hayas mucha información, pero hemos visto, hemos visto. 279 00:49:38,170 --> 00:50:07,130 Lo primero, vamos a hacer un recopilatorio con ensayos de hipótesis. Hemos visto la Q de Dixon, la R de Grubbs y luego el 2,5D, el 4D y el 2S como ensayos para evaluar un dato anómalo. 280 00:50:07,130 --> 00:50:42,250 Ahora hemos visto F para evaluar dos precisiones, que lo que hacíamos era evaluar la varianza, ¿no? Tenemos dos series de valores, que son el A y el B, por ejemplo, método 1, método 2, método manual, método automático, ¿vale? 281 00:50:42,250 --> 00:50:45,309 Tenemos el A y el B. 282 00:50:45,429 --> 00:50:47,130 Y cada uno tiene una serie de medidas. 283 00:50:47,869 --> 00:50:49,929 Una, otra, otra, otra, otra. 284 00:50:50,730 --> 00:50:57,329 Y nosotros calculamos la F con la varianza de uno entre la varianza del otro. 285 00:50:57,329 --> 00:51:02,989 Y arriba siempre la varianza que sea mayor. 286 00:51:03,730 --> 00:51:11,670 Si esto es A y esto es B, es porque la varianza de A ha salido mayor que la varianza de B. 287 00:51:11,670 --> 00:51:28,349 Ahora, lo último que acabamos de ver es la prueba. Estos son los estadísticos que calculamos, QR. Estos de aquí no exactamente porque estos son basados en intervalos de confianza y no tenemos tablas, pero todos los demás sí. 288 00:51:28,349 --> 00:51:39,449 Este tenemos que calcular un estadístico, este también, este también y ahora hemos empezado a jugar con la T de Student. 289 00:51:39,449 --> 00:51:59,059 Entonces, hemos calculado la t para comparar un valor de referencia, x red, con una serie de valores. 290 00:52:03,530 --> 00:52:06,210 Y para eso hemos utilizado t. 291 00:52:07,590 --> 00:52:15,469 Y luego mirábamos en la tabla de una o dos colas según fuese la hipótesis y para n-1 grados de libertad. 292 00:52:15,469 --> 00:52:24,010 Mirábamos en la tabla de la TED Student para grados de libertad que es n-1 valores 293 00:52:24,010 --> 00:52:33,110 Aquí lo mismo, aquí teníamos unos grados de libertad que buscábamos en la tabla y aquí igual 294 00:52:33,110 --> 00:52:36,949 Aquí os acordáis si buscábamos por grados de libertad o por valores 295 00:52:36,949 --> 00:52:45,800 Si veis las tablas, porque siempre las tablas al final si os fijáis bien os lo dicen todo 296 00:52:45,800 --> 00:53:05,000 Mira, esta no por hablar, pero las demás sí. Si nos vamos aquí a Ericsson y Grun, aquí no pone n-1, pone n, ¿no? Miramos por los valores que son. 297 00:53:05,000 --> 00:53:14,239 Si nos vamos en cambio a la de la f, nos dice grados de libertad, que es n-1. 298 00:53:16,719 --> 00:53:19,619 Ahora, siguiente caso que vamos a ver. 299 00:53:19,960 --> 00:53:27,340 Vamos a utilizar también la t, pero esta vez vamos a comparar las medias de dos series de valores, 300 00:53:28,280 --> 00:53:31,760 que pueden ser la serie a y la serie b. 301 00:53:32,559 --> 00:53:38,360 Antes, o sea, ahora, hemos utilizado la TED Student para comparar una serie de valores, 302 00:53:38,719 --> 00:53:43,659 o sea, uno, dos, tres, cuatro, cinco, unos valores que yo he medido con un solo valor de referencia. 303 00:53:43,659 --> 00:53:50,039 Ahora vamos a comparar una serie de medidas que yo he hecho con otra serie de medidas, ¿vale? 304 00:53:50,360 --> 00:53:54,739 Que es lo mismo, pueden ser el mismo número de medidas o no. 305 00:53:54,739 --> 00:54:05,019 Yo puedo tener, por ejemplo, un método del que haya hecho 10 determinaciones y otro método del que haya hecho 6 determinaciones. 306 00:54:05,179 --> 00:54:12,059 Por ejemplo, estos métodos yo los puedo comparar. No tiene por qué ser exactamente el mismo número de medidas, el mismo n. 307 00:54:13,239 --> 00:54:20,900 Entonces, si yo tengo estos dos métodos, llamémoslos A y B, y quiero comparar la precisión, ¿qué hago? 308 00:54:20,900 --> 00:54:25,320 calculo la varianza de cada uno de ellos 309 00:54:25,320 --> 00:54:29,699 del método A y del método B 310 00:54:29,699 --> 00:54:32,099 calculo el F 311 00:54:32,099 --> 00:54:36,739 pondré arriba el mayor y abajo el menor 312 00:54:36,739 --> 00:54:41,699 y miraré en la tabla por n-1 y n-1 313 00:54:41,699 --> 00:54:44,980 de el que haya sido más grande en el numerador 314 00:54:44,980 --> 00:54:47,340 el que haya sido más pequeño en el denominador 315 00:54:47,340 --> 00:54:50,079 más grande la varianza, no el número de valores 316 00:54:50,079 --> 00:55:01,099 La varianza. Y lo compararé con F calculada, la compararé con F tabulada, la de la tabla. 317 00:55:01,920 --> 00:55:08,519 Ahora, si yo quiero comparar las medias, lo que tengo que hacer es usar otra vez una prueba T. 318 00:55:09,739 --> 00:55:15,619 Hemos utilizado la F para las varianzas y para las medias de estas dos series de datos, 319 00:55:15,619 --> 00:55:19,199 si las quiero comparar, tengo que utilizar una prueba T. 320 00:55:20,920 --> 00:55:36,739 Entonces, ¿qué prueba utilizo? Pues, antes de nada, hay un paso previo, que por eso os quería contar esto y ya lo vamos a dejar aquí, hay un paso previo que es ver si las varianzas son iguales o no son iguales. 321 00:55:36,739 --> 00:55:50,500 Entonces, siempre que os pidan que comparéis las medias de dos series de medidas, el primer paso de todos es ver si las varianzas son homogéneas o no homogéneas, o sea, hacer la prueba F. 322 00:55:50,980 --> 00:56:02,280 Aunque a mí me digan que compare las medias, yo las voy a comparar, pero antes de eso tengo que hacer un paso previo, que es lo que hemos hecho hoy, calcular si las varianzas son homogéneas o no son homogéneas. 323 00:56:02,280 --> 00:56:28,679 O sea, cuando yo planteo mi prueba F, la hipótesis nula, ¿se acepta o se rechaza? ¿Vale? Entonces, si nos vemos ante el caso de tener una serie de valores, una serie de valores que me dicen eso, 324 00:56:28,679 --> 00:56:39,559 Pues que A es igual a pH, que siempre es lo más fácil, vamos, lo más fácil, que como es adimensional no tenemos que poner unidades. 325 00:56:40,199 --> 00:56:48,639 Y me ha dado 7,1, 7,0, 7,1, 6,9 y 7,2. 326 00:56:49,340 --> 00:56:53,079 Eso haciéndolo con el método A, que vamos a decir que es un método, por ejemplo, manual. 327 00:56:53,079 --> 00:57:05,159 Y el método B me ha dado 7,0, 7,0, 6,9, 6,8, 6,6. 328 00:57:05,860 --> 00:57:16,119 Y yo quiero comparar si realmente estos dos métodos me dan un valor igual de exacto, porque voy a comparar las medias. 329 00:57:16,119 --> 00:57:36,280 Ya estoy comparando exactitud, no precisión, ¿vale? Quiero saber si la media de A se puede decir que es igual a la media por el método B, esa va a ser mi hipótesis nula, y mi hipótesis alternativa es que no, que realmente las diferencias que hay es porque los métodos no son igual de exactos. 330 00:57:36,280 --> 00:57:53,239 ¿Vale? Entonces, para yo poder evaluar esto, lo primero que tengo que hacer, primero tengo que decir, ¿las varianzas son iguales? Me tengo que plantear esta pregunta y la respondo. 331 00:57:53,239 --> 00:58:11,780 Entonces digo, vale, voy a plantear mi hipótesis nula, que es que la varianza del primer método es igual a la varianza del segundo método. 332 00:58:11,780 --> 00:58:41,639 ¿Mi hipoteca es alternativa? No. La varianza del primer método es, pues tendríamos que ver cuánto da cada una, ¿no? Lo primero, vamos a calcularla, nos vamos a abrir el Excel para que sea más rápido que con la calculadora y vamos a hacerlo aquí. 333 00:58:41,639 --> 00:59:08,969 Tenemos 7.1, 7.0, 7.1 otra vez, estamos con el método A, 7.1 otra vez, 6.9 y el último que es 7.2. 334 00:59:08,969 --> 00:59:42,860 Esto es el método A. Vamos a escribirlo para no liarnos. Ahora el método B es 7.0, 7.0, 6.9, 6.8 y 6.6. 335 00:59:42,860 --> 00:59:56,489 Vale, pues voy a calcularme las medias de cada uno de ellos, que una es 7,06 y la otra es 6,86. 336 00:59:56,650 --> 01:00:00,670 Ves que son muy, muy parecidas y voy a calcular la varianza. 337 01:00:03,489 --> 01:00:11,550 Varianza del método A. Esto lo podría hacer con la calculadora, pero lo hago aquí que me resulta más sencillo, ¿vale? 338 01:00:11,550 --> 01:00:30,699 Entonces, la varianza del método A es 0,013 y la varianza del método B es 0,028. Para calcular la F, ¿cómo lo haría? 339 01:00:30,699 --> 01:00:35,500 F 340 01:00:35,500 --> 01:00:38,019 era poner 341 01:00:38,019 --> 01:00:40,360 la varianza mayor 342 01:00:40,360 --> 01:00:41,420 arriba, justo 343 01:00:41,420 --> 01:00:44,480 7,06 y la varianza 344 01:00:44,480 --> 01:00:45,239 menor abajo, ¿no? 345 01:00:45,599 --> 01:00:48,099 No, la varianza, porque 346 01:00:48,099 --> 01:00:49,059 estas son las medias 347 01:00:49,059 --> 01:00:50,539 0,28 348 01:00:50,539 --> 01:00:54,079 dividido en 0,013 349 01:00:54,079 --> 01:00:54,500 justo 350 01:00:54,500 --> 01:00:57,199 0,013 351 01:00:57,199 --> 01:01:00,239 y eso me da, pues vamos a verlo 352 01:01:00,239 --> 01:01:01,940 esto dividido 353 01:01:01,940 --> 01:01:03,719 entre esto, me da 354 01:01:03,719 --> 01:01:22,579 2,154. Vamos a rondear. Es igual a 2,154. ¿Cuántos son mis n? Pues 1, 2, 3, 4 y 5. Y aquí lo mismo, ¿no? Tengo n igual a 5 y n igual a 5. 355 01:01:22,579 --> 01:01:41,380 Así que me voy a mi tabla de la F del 95%, porque nadie me ha dicho nada, y miro en 4, 4, ¿no? Y me da que el valor es 6,39. F tabulada. 356 01:01:45,599 --> 01:01:46,840 ¿Por qué te vas al 4, 4? 357 01:01:47,679 --> 01:01:49,900 Porque tengo 5 medidas de cada uno. 358 01:01:50,960 --> 01:01:52,880 Ah, vale, y es 5 menos 1. 359 01:01:52,880 --> 01:02:03,300 Y es 5 menos 1. Como son los grados de libertad, miro en el numerador, que es el de 0,028, hay 1, 2, 3, 4 y 5. 5 menos 1, 4. 360 01:02:03,760 --> 01:02:13,239 En el denominador, en este caso, tenemos los mismos, pero podrían ser distintos. Yo podría tener aquí 5 y aquí 3 o aquí 10 y aquí 15. 361 01:02:13,820 --> 01:02:20,260 Entonces, por eso hay que fijarse cuál está arriba y cuál está abajo. En este caso, los dos son iguales, así que no tenemos lugar a error. 362 01:02:20,260 --> 01:02:31,019 Entonces, este es porque n es igual a 4, n-1, perdón, no sé por qué ahora esto no escribe, aquí, n-1 igual a 4 y n-1 igual a 4. 363 01:02:32,039 --> 01:02:38,420 Entonces, mirando en las tablas nos daba 4 con algo, ¿no? 4, ah no, 6 con algo, 6,39. 364 01:02:38,420 --> 01:02:46,199 La F de las tablas, tabulada, es igual a 6,39. 365 01:02:46,739 --> 01:02:51,420 Por lo tanto, esta es la calculada y esta es la tabulada. 366 01:02:53,929 --> 01:03:04,699 Por lo tanto, como mi F calculada es menor que mi F tabulada, ¿qué significa? 367 01:03:05,500 --> 01:03:07,000 La F que yo he calculado... 368 01:03:08,699 --> 01:03:11,519 ¿Que aceptas el lote o lo que te vayan a dar? 369 01:03:11,519 --> 01:03:20,260 Acepto la hipótesis nula y digo que efectivamente son iguales las varianzas, porque f calculada es menor que f tabulada. 370 01:03:23,980 --> 01:03:33,750 Acepto h0, que es que ese cuadrado de a es igual que ese cuadrado de b. 371 01:03:34,989 --> 01:03:41,889 O sea que las precisiones de ambos métodos o de lo que ya estoy comparando son iguales, porque es mi hipótesis nula. 372 01:03:41,889 --> 01:03:59,889 Mi hipótesis alternativa, si estuviese sido al revés, era que la varianza de… el de arriba era 0,028, era el B, ¿no? La varianza de B es mayor. 373 01:03:59,889 --> 01:04:15,960 La hipótesis nula es que la varianza de A es igual a la varianza de B. 374 01:04:16,739 --> 01:04:33,860 La hipótesis alternativa, como es unilateral, es que la varianza de A es menor que la varianza de B. 375 01:04:33,860 --> 01:04:45,719 Bien, hemos aceptado la hipótesis nula, así que decimos que nuestros datos tienen una varianza que es igual, que no es estadísticamente diferente. 376 01:04:46,380 --> 01:04:57,420 Entonces, una vez que tenemos este primer paso, ya pasamos al segundo paso, que es calcular el estadístico para comparar las medias. 377 01:04:57,420 --> 01:05:08,840 Pero para comparar las medias primero tenemos que saber si la varianza es igual o no, porque si la varianza es igual vamos a utilizar unas fórmulas, que son estas, y si la varianza es distinta vamos a utilizar otras. 378 01:05:11,019 --> 01:05:23,420 Entonces el próximo día retomamos aquí, porque si no es mucha información, con la comparación de medias de dos series, de medidas.