1 00:00:00,050 --> 00:00:22,129 Vale, ya estamos. Vale, os cuento. Me escribió alguna compañera vuestra, no sé si estás aquí, para decirme que quería que os subiese ejercicios y que a lo mejor os podía abrir ya las actividades, bueno, las preguntas, el cuestionario y las actividades de esta unidad. 2 00:00:22,129 --> 00:00:24,190 entonces os las he abierto 3 00:00:24,190 --> 00:00:26,390 pero tenéis que tener en cuenta 4 00:00:26,390 --> 00:00:27,750 que os lo he puesto en el foro 5 00:00:27,750 --> 00:00:30,469 que no hemos dado todo todavía 6 00:00:30,469 --> 00:00:32,590 entonces por ejemplo de las cuestiones 7 00:00:32,590 --> 00:00:34,810 de tipo test 8 00:00:34,810 --> 00:00:36,670 va a haber algunas que no sepáis contestar 9 00:00:36,670 --> 00:00:38,770 así que yo bueno como tenéis más de un intento 10 00:00:38,770 --> 00:00:40,310 si queréis podéis ir haciendo uno 11 00:00:40,310 --> 00:00:41,530 pero bueno yo os recomiendo 12 00:00:41,530 --> 00:00:44,490 que os esperéis pues dentro de un par 13 00:00:44,490 --> 00:00:46,369 de sesiones que lo que es la teoría 14 00:00:46,369 --> 00:00:47,469 sobre 15 00:00:47,469 --> 00:00:50,490 esta unidad ya la habremos dado toda 16 00:00:50,490 --> 00:01:08,290 Cuando demos la parte de calibración, que es lo último que nos falta. Y luego con los ejercicios lo mismo. Los tenemos... ¿Dónde está la tarea? Os la he abierto, ¿verdad? 17 00:01:08,290 --> 00:01:12,930 Sí, yo he visto los ejercicios 18 00:01:12,930 --> 00:01:15,329 Aquí, aquí, perdonad que no la encontraba 19 00:01:15,329 --> 00:01:19,049 Vale, pues de los ejercicios 20 00:01:19,049 --> 00:01:20,849 Son tres 21 00:01:20,849 --> 00:01:22,310 El primero 22 00:01:22,310 --> 00:01:28,230 Sí que lo deberíais saber hacer 23 00:01:28,230 --> 00:01:31,890 Es hacer un test para evaluar 24 00:01:31,890 --> 00:01:34,569 Si alguno de los resultados 25 00:01:34,569 --> 00:01:37,129 Que hemos obtenido de una serie de datos 26 00:01:37,129 --> 00:01:45,090 es anómalo, ¿no? Entonces, bueno, en este caso no se os especifica con qué tipo de test lo tenéis que hacer, 27 00:01:45,430 --> 00:01:50,650 así que, bueno, se queda un poco a gusto del consumidor, ¿no? Normalmente el que utilizamos es el de la Q de Dixon, 28 00:01:50,810 --> 00:02:00,890 pero como no está expresamente especificado, pues si alguien utiliza otro y escribe el test que es y los resultados son correctos, 29 00:02:00,890 --> 00:02:07,030 pues estaría bien también, ¿vale? Entonces, bueno, el primer ejercicio, que ese sí que lo podéis ir haciendo si queréis, 30 00:02:07,129 --> 00:02:29,389 Es ver los valores por si hay algún resultado anómalo y luego, dependiendo de si lo hemos eliminado, el valor que consideramos anómalo o no, calcularemos el intervalo de confianza y veremos si el 95% y si existe alguna evidencia de sesgo. 31 00:02:29,389 --> 00:02:34,310 porque eso creo que no lo hemos visto expresamente, así que luego le echamos un ojo, ¿vale? 32 00:02:35,330 --> 00:02:42,189 Luego, el ejercicio 2 es hacer una recta de calibrado que todavía no hemos visto, ¿vale? 33 00:02:42,189 --> 00:02:45,949 Entonces, el ejercicio 2 en principio, salvo los que habéis dado ya instrumental, 34 00:02:46,229 --> 00:02:51,810 que bueno, como es una temática muy parecida, sí que a lo mejor lo sabéis hacer, 35 00:02:51,930 --> 00:02:54,990 pero bueno, si no, este por ahora lo podéis ignorar. 36 00:02:54,990 --> 00:03:11,530 Y luego el ejercicio 3 sí que es muy parecido a alguno que hemos hecho aquí en clase, yo creo, que es una comparación de dos métodos. Nos dicen que tenemos dos métodos para determinar cromo en muestras de hierba de centeno y nos dan unos resultados. 37 00:03:11,530 --> 00:03:23,669 Entonces, por el primer método obtenemos una media de 1,48 y una desviación estándar, que os recuerdo que desviación estándar es S, de 0,28. 38 00:03:24,250 --> 00:03:31,789 Y el método 2 nos da una media de 2,33 y una desviación estándar de 0,31. 39 00:03:31,789 --> 00:03:38,449 nos dan las determinaciones que nos dicen que para cada uno de los dos métodos hemos hecho 5 repeticiones, 40 00:03:38,669 --> 00:03:43,030 n igual a 5 para el método 1, n igual a 5 para el método 2, 41 00:03:43,490 --> 00:03:47,810 y nos dicen que si hay diferencias significativas entre las medias de los métodos. 42 00:03:48,669 --> 00:03:54,389 Entonces, acordaos que es lo que vimos el último día, que primero tenemos que comparar las varianzas, 43 00:03:54,389 --> 00:03:59,669 por eso os he dicho que, ojo, porque esto no es la varianza sino la desviación, 44 00:03:59,669 --> 00:04:18,670 La varianza es la desviación estándar al cuadrado, o sea, en este caso, del método 1, como nos dan la desviación, ya tenemos la varianza, que es 0,28 elevado al cuadrado, que da 0,0784, pero eso que lo consideréis porque son fallos así habituales. 45 00:04:18,670 --> 00:04:25,910 habituales. Calcularíamos mediante el test F, que es dividir la varianza mayor entre 46 00:04:25,910 --> 00:04:32,050 la menor, si os acordáis, si estas varianzas son homogéneas o no, si las podemos considerar 47 00:04:32,050 --> 00:04:39,230 iguales o no, buscando nuestras tablas y en función del resultado que obtengamos ya nos 48 00:04:39,230 --> 00:04:47,129 iremos a calcular si las medias son iguales o no. Volveremos a plantear una hipótesis 49 00:04:47,129 --> 00:05:04,170 Y como hemos calculado la F en la primera parte, ahora tendremos que ver la fórmula que tenemos que utilizar, que si os acordáis eran fórmulas muy largas, pero que las tenéis en el examen y que al final es sumar y restar. 50 00:05:04,170 --> 00:05:15,149 porque son pesadas de calcular pero no son difíciles, teníamos que en uno de los casos, en el primero, por ejemplo, 51 00:05:15,149 --> 00:05:23,209 en el que la prueba F nos dice que las varianzas son iguales, tendríamos que calcular la T con esta fórmula de aquí. 52 00:05:23,870 --> 00:05:31,709 Y luego, esta S es una S combinada, que es esta de aquí, entonces, bueno, pues calcularíamos esta S para calcular la T 53 00:05:31,709 --> 00:05:40,149 Y una vez que tengamos la T, nos vamos a nuestra tabla de la T de Student y buscamos para estos grados de libertad. 54 00:05:40,350 --> 00:05:49,189 Si tenemos, por ejemplo, en el caso de nuestro ejercicio, la primera serie de valores nos decía que habían hecho 5 medidas. 55 00:05:49,470 --> 00:05:51,449 En la segunda, otras 5 medidas. 56 00:05:51,449 --> 00:06:05,170 Pues en este caso, si las varianzas fuesen homogéneas, los grados de libertad que buscaríamos en la tabla serían 5 más 5 menos 2, ¿no? 10 menos 2, 8, ¿vale? 57 00:06:05,170 --> 00:06:22,250 ¿Vale? Que nuestra prueba de F nos da que no son homogéneas las varianzas, calculamos también la T y la calculamos en este caso con esta fórmula, ¿vale? Que, o sea, ved que son un poco enrevesadas, pero que al final tenemos todos los datos y es simplemente despejar, ¿no? 58 00:06:22,250 --> 00:06:51,860 Tenemos aquí x1 menos x2, a ver si puedo ponerlo en las dos pantallas y que lo veáis, ¿vale? Aquí x1, 1,48, la media del 2, 2,33, ese cuadrado del primero, pues el 0,28 al cuadrado. 59 00:06:52,480 --> 00:06:55,540 N sub 1, 5, porque son 5 determinaciones. 60 00:06:56,980 --> 00:07:00,920 S sub 2 al cuadrado, pues 0,31 al cuadrado. 61 00:07:01,600 --> 00:07:04,220 N sub 2, lo mismo, 5 determinaciones. 62 00:07:04,220 --> 00:07:10,000 Y ya con eso, que parece una fórmula un poco enrevesada, pero tenemos todos los datos, calculamos la T. 63 00:07:10,740 --> 00:07:18,939 Y en este, acordaos que lo más enrevesado era, para luego ver en la tabla en qué línea tenemos que mirar, 64 00:07:19,300 --> 00:07:21,360 pues tenemos que calcular los grados de libertad. 65 00:07:21,860 --> 00:07:29,459 Y era con esta fórmula de aquí, que lo mismo, es un tostón porque es meter mucho dato en la calculadora y mucho paréntesis, es fácil equivocarse, 66 00:07:29,579 --> 00:07:39,860 pero al final tenemos todos los datos, es reemplazar esto por el 0,31 al cuadrado, el 0,28 al cuadrado, esto por un 5, esto por otro 5, etc. 67 00:07:40,920 --> 00:07:50,420 Y teniendo cuidado, bueno, pues lo podemos calcular y luego ya veríamos si la t que hemos calculado es mayor o menor que la que está en la tabla. 68 00:07:50,420 --> 00:08:11,779 Ese es el procedimiento. Esos ejercicios los tenéis aquí. Y lo que os he comentado, que los de tipo test os saldrá a lo mejor alguna pregunta relacionada con el calibrado, con límites de detección, de cuantificación, que no sabéis contestar todavía. 69 00:08:11,779 --> 00:08:28,519 O no lo sabéis por lo menos por este módulo. Y luego, aparte, os he subido un taco de problemas aquí abajo, en la unidad de trabajo 5. 70 00:08:28,519 --> 00:08:52,600 Aquí tenéis las tablas, el primer documento de teoría, estos son los ejercicios que os subí y las soluciones, y esto de aquí es también, pues no lo tenéis subido, perdonadme, os lo subo ahora cuando terminemos la clase 71 00:08:52,600 --> 00:09:17,870 Aquí tenéis la teoría, que es el documento que os estoy mostrando. Pensé que os lo había subido. Bueno, tengo preparado un taco de ejercicios que están por aquí para que lo resolváis o lo resolvamos aquí en clase sobre esto que hemos visto estos días, que es lo más complicadillo. 72 00:09:17,870 --> 00:09:31,149 Entonces, si queréis, en vez de resolverlos hoy, os voy a subir el archivo y lo resolvemos el próximo día para que podáis intentarlos 73 00:09:31,149 --> 00:09:36,490 Pero si queréis, lo que podemos hacer es ir planteándolos para ver cómo lo resolveríamos 74 00:09:37,409 --> 00:09:45,269 Estoy con la pantalla completa, así que lo de siempre, si alguien me habla, no me entero, si queréis algo, me cortáis 75 00:09:45,269 --> 00:09:48,169 Respecto a incidencia 76 00:09:48,169 --> 00:09:50,889 Elena, te quería preguntar 77 00:09:50,889 --> 00:09:52,490 ¿El cuestionario que ha subido 78 00:09:52,490 --> 00:09:54,909 Tiene tiempo o no tiene tiempo? 79 00:09:54,929 --> 00:09:56,169 No está habilitado todavía 80 00:09:56,169 --> 00:09:58,309 Como normalmente se sube cuando 81 00:09:58,309 --> 00:10:00,590 Terminamos la unidad 82 00:10:00,590 --> 00:10:02,850 Y es más o menos un mes de plazo 83 00:10:02,850 --> 00:10:04,889 Pero yo todavía no le he puesto plazo 84 00:10:04,889 --> 00:10:06,370 Porque no hemos ni terminado la unidad 85 00:10:06,370 --> 00:10:08,169 Lo he abierto porque como me lo habéis pedido 86 00:10:08,169 --> 00:10:10,190 Sobre todo por los 87 00:10:10,190 --> 00:10:11,590 Por los ejercicios 88 00:10:11,590 --> 00:10:14,049 Pero todavía no hay un plazo de cierre 89 00:10:14,049 --> 00:10:25,629 No, me refiero al cuestionario, no es con tiempo. Tenemos tres intentos, pero no tiene... Es que hay otras veces que ponen 20 minutos para hacer todo el cuestionario. 90 00:10:26,210 --> 00:10:31,049 Son 10 preguntas y la verdad es que ahora mismo, a ver, configuración... 91 00:10:31,049 --> 00:10:36,690 Más que nada por no abrirlo y que no, ¿sabes? No lo he mirado antes. 92 00:10:36,690 --> 00:10:40,419 Pues 93 00:10:40,419 --> 00:10:43,419 ahora mismo la verdad es que 94 00:10:43,419 --> 00:10:45,200 no sé cómo está puesto, pero 95 00:10:45,200 --> 00:10:48,879 temporalización 96 00:10:48,879 --> 00:10:51,120 ahora mismo no tiene límite de tiempo 97 00:10:51,120 --> 00:10:53,159 No tiene, ¿no? Vale, vale 98 00:10:53,159 --> 00:10:54,120 Gracias 99 00:10:54,120 --> 00:10:58,899 Justo me estaba leyendo 100 00:10:58,899 --> 00:11:00,940 algo en el chat de la TED Student 101 00:11:00,940 --> 00:11:04,399 respecto a 102 00:11:04,399 --> 00:11:06,460 incertidumbres y TED Student, ¿también hay alguno? 103 00:11:06,559 --> 00:11:08,019 ¿Algún qué te refieres, Sonia? 104 00:11:17,200 --> 00:11:18,360 ¿Algún ejercicio? 105 00:11:18,559 --> 00:11:36,539 ¿Que os suba alguno para resolver? Vale, que os lo suba para hacerlos. Vale, pues espérate que me lo voy a apuntar. Os voy a subir el archivo con los de significación y os subo alguno también de intervalos de confianza. 106 00:11:36,539 --> 00:11:53,700 Que eso la verdad es que lo vais a utilizar en todos los módulos. Vale, ensayos de significación, archivo y TED Student, intervalos de confianza, vaya, ok. 107 00:11:53,700 --> 00:12:11,419 Ok, pues eso os lo subo cuando suba la videoconferencia y así los tenéis, ¿vale? Si os parece, de todas formas, vamos a plantear un poco cómo resolveríamos estos ejercicios para que tengáis las bases para hacerlo luego por vuestra cuenta, ¿vale? 108 00:12:12,100 --> 00:12:20,559 Entonces, bueno, en esta de aquí nos dice, un laboratorio está evaluando dos métodos diferentes para medir la concentración de un compuesto en una solución, ¿vale? 109 00:12:20,559 --> 00:12:23,559 Nos están diciendo ya que estamos evaluando dos métodos. 110 00:12:26,220 --> 00:12:32,279 Nos dan los datos de concentración, no nos dicen unidades, ¿vale? 111 00:12:32,299 --> 00:12:36,639 Lo suyo sería que nos dijeran, bueno, pues en miligramos litro, en ppm, lo que sea, ¿vale? 112 00:12:36,639 --> 00:12:42,860 y nos dan dos métodos, cada uno de los métodos unos resultados 113 00:12:42,860 --> 00:12:49,080 y nos preguntan que si hay evidencia suficiente para afirmar que las varianzas de los dos métodos son diferentes. 114 00:12:49,779 --> 00:12:55,080 O sea, nos están diciendo que si los métodos podemos decir que tienen la misma precisión o no, 115 00:12:55,080 --> 00:13:00,039 porque la varianza, acordaos, que era un indicativo de la precisión de un método. 116 00:13:00,840 --> 00:13:04,960 Entonces, en este problema de aquí, que es el caso más facilito, ¿qué tendremos que calcular? 117 00:13:06,639 --> 00:13:08,120 A ver si alguien se acuerda de memoria. 118 00:13:11,980 --> 00:13:14,639 No sé si alguien está hablando, que se escucha muy bajito. 119 00:13:24,759 --> 00:13:26,519 Tengo el micrófono abierto. 120 00:13:36,980 --> 00:13:41,980 Tendremos que calcular el parámetro f, hacer la prueba f, que acordaos que nos compara varianzas. 121 00:13:42,500 --> 00:13:44,820 Entonces, ¿cómo procedemos cuando tenemos un ejercicio así? 122 00:13:44,940 --> 00:13:49,740 Lo primero, tenemos todos los datos del método A y del método B. 123 00:13:49,740 --> 00:14:12,840 Pues lo que hacemos es hacernos la desviación y la varianza de cada uno de los métodos. ¿Cómo lo hacemos? Lo hacemos con la calculadora. Metemos todos nuestros datos en modo estadística y buscamos en las calculadoras, acordaos que normalmente lo que te calcula es S, la desviación, entonces ese valor al cuadrado es la varianza. 124 00:14:12,840 --> 00:14:15,519 una vez que tenemos las dos varianzas 125 00:14:15,519 --> 00:14:16,659 ¿qué tenemos que hacer? 126 00:14:17,100 --> 00:14:18,559 ver cuál de las dos es más grande 127 00:14:18,559 --> 00:14:20,500 porque acordaos que en la prueba F 128 00:14:20,500 --> 00:14:23,500 siempre dividimos la varianza mayor entre la menor 129 00:14:23,500 --> 00:14:26,799 para que el F, el parámetro que nos dé 130 00:14:26,799 --> 00:14:28,679 sea mayor que 1 131 00:14:28,679 --> 00:14:30,620 ¿vale? porque es como está establecido 132 00:14:30,620 --> 00:14:33,340 entonces, la que me dé mayor 133 00:14:33,340 --> 00:14:34,639 la pongo en el numerador 134 00:14:34,639 --> 00:14:35,899 y la otra en el denominador 135 00:14:35,899 --> 00:14:37,100 y voy a obtener un número 136 00:14:37,100 --> 00:14:41,039 primero calculamos las varianzas de cada método 137 00:14:41,039 --> 00:14:46,139 luego dividimos la varianza mayor entre la menor y ya tenemos un F que hemos calculado. 138 00:14:46,399 --> 00:14:48,720 Ahora, ¿qué tenemos que hacer? Irnos a la tabla. 139 00:14:49,700 --> 00:14:53,799 Nos dice que para un nivel de significación alfa igual a 0,05, 140 00:14:54,399 --> 00:14:58,419 que es el estándar cuando no nos dicen nada, el 95%, 141 00:14:58,419 --> 00:15:05,320 entonces nos vamos a la tabla y comparamos con la F que hemos calculado nosotros. 142 00:15:05,320 --> 00:15:27,799 ¿Vale? Ahora, ¿qué pasa? Que acordaos que en la tabla F tenemos unas filas y unas columnas, ¿no? Entonces, en la horizontal, arriba, ¿qué documento? No, está subido todavía, os lo subo ahora en cuanto terminemos, o bueno, ahora paramos un momentito y os lo subo, ¿vale? 143 00:15:27,799 --> 00:15:44,750 Entonces, lo que vamos es a nuestra tabla F, que está por aquí, y buscamos, esta es la de 0,05, ¿vale? 144 00:15:45,070 --> 00:15:55,950 Acordaos que por criterio general, cuando comparamos varianzas, utilizamos siempre, que es distinto que cuando utilizamos la tabla T, pero en general con varianzas, la tabla más habitual es esta de aquí, ¿vale? 145 00:15:55,950 --> 00:16:09,649 La que es de una cola. Entonces, siempre utilizamos esta tabla para la prueba F, ¿vale? Luego, para la T, dependiendo de cómo sea la hipótesis, utilizamos la de 1 o la de 2 colas, ¿vale? 146 00:16:10,190 --> 00:16:23,370 Entonces, en el caso de este ejercicio, tendremos que ver cuál de los dos métodos tiene una varianza mayor. El que tenga la varianza mayor estará en el numerador. 147 00:16:23,370 --> 00:16:39,909 Entonces vamos a imaginarnos que nos da una varianza mayor en A, pues A tiene 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, tiene 12 valores y B tiene 10. 148 00:16:39,909 --> 00:16:57,350 Pues en nuestra tabla tendremos que buscar, si hemos dicho que el numerador es el método A, 12 menos 1, 11, y en el denominador, método B, 10 menos 1, 9. 149 00:16:57,350 --> 00:17:13,150 Entonces, tendríamos que buscar este valor de aquí, ¿vale? Y si la f que nosotros hemos calculado es menor que 3,10, estoy contando con que ya lo hemos hecho y con que nos ha dado que el método A tiene una varianza mayor, no tiene por qué ser así. 150 00:17:13,150 --> 00:17:30,289 Si la F que nosotros hemos calculado es menor que la que está en las tablas, decimos que sí que las varianzas son homogéneas y si no, que no son homogéneas, ¿vale? O sea, que la precisión de los dos métodos es igual, podemos considerarla igual o no. 151 00:17:30,289 --> 00:17:50,089 Bueno, siguiente ejercicio. Nos da la concentración de plomo en una muestra de agua, nos da lo mismo una serie de mediciones y nos dice que según la normativa el valor de referencia es 11,5 ppm. 152 00:17:50,089 --> 00:18:05,990 Y nos dice, ¿podemos concluir que el agua analizada excede el valor de referencia? Nos está diciendo que sí, X referencia es menor que la media de nuestras mediciones, que X media. 153 00:18:05,990 --> 00:18:28,279 ¿Vale? O planteado al revés, si X media es mayor que X de referencia. ¿Vale? Entonces, ¿os acordáis qué teníamos que hacer aquí? Calculábamos la T y en este caso, en este caso lo que queríamos era comparar con un valor de referencia. 154 00:18:28,279 --> 00:18:50,589 ¿Vale? Calculamos nuestra T como el valor de referencia, que es el dato ese que nos dan de la concentración de la legislación, menos la media, que tenemos todos los datos, así que podemos calcular la media de nuestra serie de valores, todo ello en valor absoluto, 155 00:18:50,589 --> 00:18:55,950 dividido entre S, la desviación, que la podemos hacer también porque tenemos todos los valores, 156 00:18:56,890 --> 00:18:59,269 y esta S dividida entre raíz de N. 157 00:18:59,410 --> 00:19:06,529 Acordaos que esto está dividido, que es lo mismo que si pusiésemos esto de aquí y multiplicado por raíz de N, 158 00:19:06,630 --> 00:19:08,990 porque es dividido del denominador. 159 00:19:10,470 --> 00:19:15,309 Entonces, tenemos también N, pues ya tenemos todos los datos para calcular la T 160 00:19:15,309 --> 00:19:20,190 y ahora lo que tendríamos que hacer es irnos a nuestra tabla de la T de Student 161 00:19:20,190 --> 00:19:40,309 Y lo mismo, comparar el valor de la T calculada con el que está en la tabla, ¿vale? Y en función de si es mayor o menor diremos que sí que supera el valor de referencia o que no, ¿vale? Ese es el segundo caso. Aquí están todos los casos que tenemos de estos ejercicios, ¿vale? 162 00:19:40,309 --> 00:19:51,190 Ahora, nos dice, dos grupos de estudiantes realizan experimentos para medir la densidad de una disolución concentrada de sulfúrico en gramos por mililitro. 163 00:19:51,190 --> 00:20:02,490 Y los resultados son los siguientes. Para el grupo 1 nos da estos datos de aquí y para el grupo 2 nos da estos de aquí. 164 00:20:03,369 --> 00:20:08,450 Y nos dice que si hay diferencias significativas entre los dos grupos, entre las medias de los dos grupos. 165 00:20:08,450 --> 00:20:20,829 Se entiende cuando nos dicen que si hay diferencias entre los resultados, lo que queremos saber es si el resultado final obtenido, o sea, la media de todos estos valores, es igual estadísticamente o no. 166 00:20:21,789 --> 00:20:32,109 Y nos dice que utilicemos alfa 0,05, o sea, el 95%. Pues aquí, ¿qué tenemos que hacer? Como en todos los problemas nos lo planteamos de la misma manera. 167 00:20:32,109 --> 00:20:46,250 Primero, como tenemos toda esta serie de mediciones, tenemos los datos, lo primero que hacemos es calcular nuestros parámetros, podemos calcular la media, podemos calcular la desviación, etc. 168 00:20:46,869 --> 00:20:58,150 Una vez que tenemos las desviaciones del grupo 1 y del 2, las podemos elevar al cuadrado y tenemos las varianzas y así hacemos la prueba F para comparar las varianzas. 169 00:20:59,029 --> 00:21:06,809 ¿Qué sabemos con eso? Si los dos grupos son igual de, los experimentos que han realizado son igual de precisos o no. 170 00:21:07,710 --> 00:21:21,089 Una vez que hayamos calculado eso con la prueba F, lo que hacemos es irnos a ver cómo tenemos que calcular nuestra T de Student para comparar las medias. 171 00:21:21,769 --> 00:21:34,529 Entonces, lo mismo que hemos visto antes, si nuestra prueba F nos ha dicho que los resultados tienen, perdón, los experimentos tienen varianzas homogéneas, 172 00:21:34,529 --> 00:21:43,190 o sea que las varianzas son iguales, calculamos esta T de aquí. Y si nos dicen que no, que no son iguales, calculamos esta T de aquí. 173 00:21:43,190 --> 00:21:49,089 independientemente de cómo la calculemos, luego nos tenemos que ir a nuestra tabla de la TED Student 174 00:21:49,089 --> 00:22:02,710 y tendremos que mirar según el nivel de significancia que nos hayan dicho, ¿no? 175 00:22:02,710 --> 00:22:10,470 Porque normalmente nos dicen 0,05 o no nos dicen nada y por defecto entendemos 95%, ¿vale? 176 00:22:10,470 --> 00:22:27,490 Y tenemos que ver si hemos planteado una hipótesis de una o de dos colas. Vamos a ver qué nos dice el ejercicio. Nos dice, hay diferencias, no nos está preguntando si uno es mayor que otro, nos está diciendo simplemente si son distintos. 177 00:22:27,490 --> 00:22:51,450 Eso es una hipótesis bilateral de dos colas. Cuando nos dicen si es mayor o menor, es de una cola. Cuando nos dicen si es igual o distinto, es de dos colas. Entonces, nos tendríamos que ir al 95% a la T de student de dos colas, por aquí arriba, este 0,05. 178 00:22:51,450 --> 00:23:13,990 Si fuese de una cola, acordaos que tendríamos que mirar esta de aquí, esta columna. Y luego para los grados de libertad que sean, que en función del test estadístico que estemos utilizando, en función de si es las varianzas homogéneas o no, se calculará de una manera o de otra. 179 00:23:13,990 --> 00:23:34,990 Si son homogéneas, acordaos que es n sub 1 más n sub 2 menos 2, que es muy fácil, y si no, tenemos que calcular pues toda esta fórmula de aquí y con el número que saquemos aquí, imaginaos que aquí nos sale 15, nos vamos a nuestra tabla y buscamos aquí por 15, ¿vale? 180 00:23:34,990 --> 00:23:57,059 Para eso calculamos los grados de libertad, para luego saber en qué línea tenemos que mirar de nuestra tabla, ¿vale? Entonces, bueno, estos son los tres tipos de ejercicios que ya hemos visto, ahora aquí va a haber un cuarto que es exactamente igual, ¿vale? 181 00:23:57,059 --> 00:24:06,859 Lo tenemos que plantear igual que el 3. ¿Qué pasa con este? Pues que están pensados para que uno salgan las varianzas homogéneas y otro no, entonces así hay que calcularlo de las dos maneras, ¿vale? 182 00:24:06,859 --> 00:24:17,799 Pero el planteamiento del problema es el mismo. Nos están diciendo que tenemos dos laboratorios, hay veces que son dos métodos, hay veces que son dos laboratorios, hay veces que son dos instrumentos. 183 00:24:17,799 --> 00:24:35,799 El caso es comparar los parámetros de dos métodos, por ejemplo, algo que difiera en algo sobre una misma muestra, para ver si realmente los dos métodos son iguales, los dos laboratorios también llegan a las mismas conclusiones. 184 00:24:35,799 --> 00:24:51,299 Conclusiones. Entonces, lo mismo. Nos dicen para el laboratorio 1 en ppms y nos dan estos datos de aquí. Para el laboratorio 2 nos dan estos datos de aquí y nos dicen si hay diferencias significativas entre las medias. 185 00:24:52,180 --> 00:25:04,400 Aquí nos están planteando exactamente lo mismo que en el problema anterior. Si existen diferencias. No nos están diciendo que comparemos si una es mayor que la otra. Nos están diciendo que si hay diferencias. 186 00:25:04,400 --> 00:25:23,380 ¿Qué hacemos? Procedemos a hacer lo mismo que hemos hecho antes. Con nuestros datos calculamos nuestra varianza de este y de este. ¿Qué hacemos después? Dividir la mayor entre la menor. 187 00:25:23,380 --> 00:25:49,480 Si queréis, mira, podemos hacer un poco, para hacer uno, podemos coger este mismo, venga, el laboratorio 1 nos dice que los datos son 7,5, 7,8, 7,6, 7,7, 7,9, 188 00:25:49,480 --> 00:25:59,619 7,8, 7,7, 7,6, 7,8 y 7,9, ¿vale? 189 00:25:59,619 --> 00:26:21,259 Y el laboratorio 2 nos dice que 8,3, 8,1, 8,2, 8,4, 8,0, 8,2, 8,1 y 8,3. 190 00:26:21,259 --> 00:26:29,480 Tengo aquí mis datos del laboratorio 1 y del laboratorio 2. 191 00:26:29,619 --> 00:26:40,259 laboratorio 1, laboratorio 2, vale, entonces lo primero, me están diciendo que compare las medias, 192 00:26:40,720 --> 00:26:46,779 yo me voy a hacer aquí una columna nueva que me diga los parámetros estadísticos, 193 00:26:46,779 --> 00:26:52,559 voy a poner aquí cuál es la media y cuál es la varianza de cada una de mis series de valores, 194 00:26:52,559 --> 00:26:56,000 entonces la media del laboratorio 1 195 00:26:56,000 --> 00:26:58,099 pues la hago, la hago con la calculadora 196 00:26:58,099 --> 00:27:01,259 que esto acordaos de practicar 197 00:27:01,259 --> 00:27:03,839 ponéis el modo estadística 198 00:27:03,839 --> 00:27:07,000 metéis todos los datos y luego si es un acasio 199 00:27:07,000 --> 00:27:09,319 normalmente es el shift, el inverso 2 200 00:27:09,319 --> 00:27:10,779 y ahí tenéis todos los parámetros 201 00:27:10,779 --> 00:27:14,019 pero si tenéis dudas o tenéis algún modelo 202 00:27:14,019 --> 00:27:18,400 un poco distinto, echadle un ojo 203 00:27:18,400 --> 00:27:23,240 para ver cómo se meten los datos 204 00:27:23,240 --> 00:27:25,640 porque son todas muy parecidas pero sin verlas 205 00:27:25,640 --> 00:27:29,720 y luego también acordaos que depende del modelo 206 00:27:29,720 --> 00:27:32,160 pero por ejemplo la Casio que tengo yo ahora mismo delante 207 00:27:32,160 --> 00:27:34,619 la media sí que es universal 208 00:27:34,619 --> 00:27:38,200 el símbolo que es la X con la barra arriba 209 00:27:38,200 --> 00:27:41,480 pero luego en función de lo moderna que sea vuestra calculadora 210 00:27:41,480 --> 00:27:44,900 podéis tener una S para la desviación 211 00:27:44,900 --> 00:27:47,480 estándar muestral 212 00:27:47,480 --> 00:28:01,660 una sigma para la poblacional, acordaos que nosotros trabajamos con la muestral, pero si es una calculadora un poco menos moderna tenéis x o n y x o n menos 1, 213 00:28:01,660 --> 00:28:44,109 La nomenclatura cambia y esto acordaos que es porque la fórmula de la desviación y la varianza difieren de la poblacional y la muestral, el que en la poblacional es dividido entre n y en la muestral entre n-1. 214 00:28:44,109 --> 00:28:56,990 Entonces, en vuestra calculadora tenéis que utilizar, si os viene esta nomenclatura, la que pone xn-1, ¿vale? Lo digo, bueno, para que os bajéis el manual y veáis cómo utilizarla. 215 00:28:56,990 --> 00:29:21,130 Pero a lo que vamos, la calculamos con la calculadora, ¿vale? Yo lo voy a hacer ahora mismo en Excel, que hago el promedio, la media, que es sumar todo esto y dividir entre el número de datos y me da que es 7,73 para el laboratorio 1 y para el laboratorio 2 me da que es 8,2, ¿vale? 216 00:29:21,130 --> 00:29:43,890 Ahora la varianza la calculo también, si la habéis calculado con la calculadora os calcula normalmente la desviación, lo tenéis que elevar al cuadrado, ¿vale? Entonces calculo la varianza del laboratorio 1 y la varianza del laboratorio 2, que es este de aquí, ¿vale? 217 00:29:43,890 --> 00:29:56,970 Y me da que la del laboratorio 1 es 0,01788 y la del laboratorio 2, muy muy parecida, es 0,01714. 218 00:29:57,609 --> 00:30:01,089 Lo he hecho bien, ¿no? De esta y de esta, ¿vale? 219 00:30:01,269 --> 00:30:03,029 Entonces, ahora, ¿cómo calculo yo mi f? 220 00:30:04,650 --> 00:30:08,670 Tendré que dividir la mayor entre la menor, ¿no? 221 00:30:08,670 --> 00:30:11,930 Pues son muy muy parecidas, pero esta es mayor que esta. 222 00:30:11,930 --> 00:30:32,630 Así que divido esta entre esta y me da el parámetro F, 1,04. Me dice que F es 1,0435. ¿Qué tengo que hacer ahora? Vamos a apuntar aquí también el número de datos que tenemos. 223 00:30:32,630 --> 00:30:51,430 Aquí, para el laboratorio 1, se han hecho 10 medidas. Y para el laboratorio 2, se han hecho 8. 224 00:30:51,430 --> 00:30:57,990 ¿No? ¿Vale? Ahora, ¿qué laboratorio hemos puesto en el numerador y cuál en el denominador? 225 00:30:58,210 --> 00:31:04,069 El laboratorio 1, como tiene una varianza mayor, lo hemos puesto en el numerador, ¿vale? 226 00:31:04,069 --> 00:31:11,029 Voy a ponerlo aquí entre paréntesis. Y el laboratorio 2 lo hemos puesto en el denominador, ¿vale? 227 00:31:11,190 --> 00:31:19,150 Ahora, ¿qué tendremos que hacer? Tenemos que comparar el valor de esta f que nosotros hemos calculado, 228 00:31:19,150 --> 00:31:31,190 F calculada, con el valor de la tabla, de F tabulada. Lo tenemos que calcular para el número de grados de libertad de numerador y denominador, ¿vale? 229 00:31:31,309 --> 00:31:44,450 Entonces tenemos que n es igual a 10 y los grados de libertad, ¿cuántos son? 9, ¿no? n-1. Y en el denominador, 8-1, 7. 230 00:31:44,450 --> 00:31:56,930 Ok, pues me voy a mi tabla y tengo que buscar en mi tabla al 95% para numerador 9 y denominador 7. 231 00:31:56,930 --> 00:32:17,079 Bien, pues me voy a mi tabla F para numerador 9 y denominador 7, ¿vale? 9 aquí, 7 aquí, ¿vale? 232 00:32:17,079 --> 00:32:35,980 Pues esto se cruza en este valor de aquí que es 3,68. Mi f tabulada, la f de las tablas, es 3,68. ¿Cuáles serán mis hipótesis? Que nos lo hemos saltado. 233 00:32:35,980 --> 00:32:44,980 la hipótesis nula, que la varianza S cuadrado del laboratorio 1 es igual que S cuadrado 234 00:32:44,980 --> 00:32:51,559 del laboratorio 2, ¿vale? Y la hipótesis alternativa es que son diferentes, ¿no? Son 235 00:32:51,559 --> 00:33:01,759 diferentes. Como mi F calculada es menor que mi F tabulada, ¿acepto o rechazo la hipótesis 236 00:33:01,759 --> 00:33:12,809 nula. La acepto. Si lo que yo he calculado es menor que lo que está en la tabla, acepto 237 00:33:12,809 --> 00:33:17,109 la hipótesis nula. Igual que nos pasaba con los ensayos de la Q de Dixon, con los de los 238 00:33:17,109 --> 00:33:24,049 rechazos de resultados dudosos, que si lo que yo he calculado, la Q calculada, la F 239 00:33:24,049 --> 00:33:28,690 calculada, la T calculada, es menor que la de las tablas, acepto la hipótesis nula. 240 00:33:28,690 --> 00:33:35,890 O sea, son iguales. Entonces, asumo que mis métodos tienen unas varianzas homogéneas. 241 00:33:36,150 --> 00:33:42,029 Ya he hecho la primera parte del ejercicio, que es calcular si las varianzas son homogéneas o no. 242 00:33:42,329 --> 00:33:50,890 ¿Qué me dice esto, el resultado de la prueba F? Me dice que los métodos, o sea, que ambos laboratorios son igual de precisos. 243 00:33:51,509 --> 00:33:57,029 Estadísticamente, puedo decir que la precisión del laboratorio 1 es igual que la precisión del laboratorio 2. 244 00:33:58,690 --> 00:34:21,170 Vale, entonces, ya sé que las varianzas son iguales, ahora lo que me decía el ejercicio es que comparase las medias, ¿no? Vale, me dice que compare las medias, yo sé que las varianzas son iguales, pues me tendré que ir a mi fórmula de que las varianzas son iguales. 245 00:34:21,170 --> 00:34:45,980 La voy a copiar y pegar aquí para tener la mano y esta de aquí, ¿vale? Entonces, ¿cuál sería mi siguiente paso? Calcular la TED Student, ¿vale? Tengo todos los datos, ¿no? 246 00:34:45,980 --> 00:35:06,210 Tengo la media del primero, la media del segundo, tengo el número de datos del primero, el número de datos del segundo y luego la S que la calculo con esta fórmula, 247 00:35:06,809 --> 00:35:14,289 el número de datos del primero que lo tengo, la varianza del primero que la tengo, el número de datos del segundo que también lo tengo, 248 00:35:14,289 --> 00:35:20,650 la varianza del segundo, que también la tengo, y dividido entre el número del primero más el número del segundo menos 2, ¿vale? 249 00:35:21,190 --> 00:35:29,190 Entonces, esto es un poco enrevesado, pero os diría que lo vayáis haciendo a la vez que yo para ver si nos da lo mismo, ¿vale? 250 00:35:29,190 --> 00:35:57,409 Vamos a empezar, por ejemplo, con la S. Entonces digo, vale, mi S es igual a n sub 1 menos 1, o sea, 10 menos 1, 9, multiplicado por la varianza del primero, ok, esta de aquí, más n sub 2 menos 1, o sea, 8 menos 1, 7, ¿no? 251 00:35:57,409 --> 00:36:05,929 multiplicado por la varianza del segundo, que es esto de aquí, 0,017. 252 00:36:06,829 --> 00:36:08,550 Ok, ya tengo el numerador. 253 00:36:09,349 --> 00:36:12,449 Ahora, voy a hacer el denominador aparte. 254 00:36:12,449 --> 00:36:19,269 n sub 1 más n sub 2 menos 2, 9, más 7, perdón, 10 más 8 menos 2, ¿no? 255 00:36:19,409 --> 00:36:21,449 18 menos 2, 16. 256 00:36:21,449 --> 00:36:31,969 Entonces, el numerador entre el denominador y de todo ello tengo que hacer la raíz cuadrada 257 00:36:31,969 --> 00:36:41,480 Me dice que la S es este valor de aquí 258 00:36:41,480 --> 00:36:42,940 He calculado esta S 259 00:36:42,940 --> 00:36:48,440 Que daos cuenta que eso es simplemente reemplazado cada uno de los términos por su valor que ya lo tengo calculado 260 00:36:48,440 --> 00:36:55,780 Aquí tengo todos los valores que necesito para poder calcular la S 261 00:36:55,780 --> 00:37:00,380 y para calcular la T lo mismo, tengo aquí todos los valores 262 00:37:00,380 --> 00:37:04,019 ya tengo la S calculada que es esta de aquí, pues calculo la T 263 00:37:04,019 --> 00:37:07,800 y mi T es igual a la media del primero 264 00:37:07,800 --> 00:37:12,280 7,73 menos la del segundo, 8,2 265 00:37:12,280 --> 00:37:16,900 y todo ello en valor absoluto, me dé lo que me dé positivo 266 00:37:16,900 --> 00:37:20,280 valor absoluto de 7,73 267 00:37:21,920 --> 00:37:25,280 menos 8,2 268 00:37:25,280 --> 00:37:46,840 0,47. Y ahora dividido entre esto de aquí, S, que es 0,1325 multiplicado por la raíz de 1 dividido entre n sub 1, 269 00:37:46,840 --> 00:38:08,679 que son 10 más 1 dividido entre n sub 2 que son 8, ¿vale? Y ahora ya tengo el numerador y el denominador porque digo que os recomiendo hacerlo a pasitos para no equivocaros 270 00:38:08,679 --> 00:38:17,019 y me da que el valor de la T que yo he calculado es 7,476. 271 00:38:17,119 --> 00:38:19,340 ¿Alguien más lo ha hecho para decirme si le da lo mismo? 272 00:38:20,059 --> 00:38:22,619 Porque yo me he podido equivocar multiplicando o dividiendo. 273 00:38:25,239 --> 00:38:32,650 7,7... 274 00:38:32,650 --> 00:38:35,510 Nadie. Yo recomiendo que esta clase la hagáis con la calculadora al lado 275 00:38:35,510 --> 00:38:42,150 para que vayáis practicando. 276 00:38:42,309 --> 00:38:48,590 Al final, muchas veces el ejercicio está bien, pero se nos olvida un paréntesis 277 00:38:48,590 --> 00:38:54,730 y entonces nos da mal el resultado, por eso si lo hacemos dos es más fácil ver si nos hemos equivocado, ¿vale? 278 00:38:55,070 --> 00:39:01,630 Aquí en principio es la S multiplicado por la raíz de 1 entre 10 más 1 entre 8. 279 00:39:01,730 --> 00:39:06,869 Bueno, en principio está bien, entonces la T de student que me ha dado es 7,4767. 280 00:39:07,090 --> 00:39:11,329 Ya tengo la T calculada, ahora tengo que compararla con la de las tablas, ¿vale? 281 00:39:11,329 --> 00:39:26,690 Me voy a mi tabla de la T, la voy a dejar abierta en otra pestaña, aquí está, ¿vale? Y me dice que al 95% y me dice que si hay diferencias significativas, simplemente me dice si son iguales o no. 282 00:39:26,690 --> 00:39:44,769 No me dice si una es mayor que la otra. Entonces, tengo que utilizar dos colas, ¿vale? Porque es una hipótesis bilateral, dos colas. Vale, dos colas al 95%, o sea que yo sé que voy a tener que mirar en esta fila de aquí. 283 00:39:44,769 --> 00:39:55,510 Ahora, en esta columna de aquí, tendré que saber, para comparar la tesa que me ha dado de 7 y pico, con qué grados de libertad lo tengo que comparar, ¿no? 284 00:39:56,010 --> 00:40:09,090 Pues acordaos que en mi fórmula me dice que los grados de libertad en este primer caso en el que las varianzas son iguales es n sub 1 más n sub 2 menos 2. 285 00:40:09,090 --> 00:40:18,449 Teníamos que n sub 1 era igual a 10, n sub 2 era igual a 8, 10 más 8, 18 menos 2, 16 286 00:40:18,449 --> 00:40:24,269 ¿Vale? Teníamos 10 más 8 menos 2, 16 287 00:40:24,269 --> 00:40:31,929 Pues en nuestra tabla de la TED Student buscamos dos colas, 95% y 16 288 00:40:31,929 --> 00:40:39,559 Dos colas, alfa 0,05 y 16 289 00:40:39,559 --> 00:40:47,559 Y el valor de la T tabulada es 2,12. 290 00:40:49,320 --> 00:40:51,400 Lo voy a copiar aquí. 291 00:40:52,079 --> 00:40:54,900 Esta es la T calculada. 292 00:40:55,639 --> 00:41:01,880 Y la T tabulada son 2,12. 293 00:41:06,340 --> 00:41:09,199 ¿Qué conclusión saco de esto? 294 00:41:13,510 --> 00:41:17,590 ¿Si son diferentes? ¿Si hay diferencias significativas entre una y la otra? 295 00:41:18,010 --> 00:41:26,829 Efectivamente. Como mi T calculada es mayor que mi T tabulada, rechazo mi hipótesis nula que me decía que eran iguales. Por lo tanto, son diferentes. 296 00:41:27,909 --> 00:41:41,170 Entonces, en este ejercicio lo que hemos calculado es que las precisiones de los dos laboratorios sí que son iguales, las podemos considerar estadísticamente iguales, pero en cambio las medias que nos dan son diferentes. 297 00:41:41,170 --> 00:41:43,130 ¿vale? das cuenta 298 00:41:43,130 --> 00:41:45,469 bueno, esto a ojo 299 00:41:45,469 --> 00:41:47,489 la verdad es que no se saca la mayoría de las veces 300 00:41:47,489 --> 00:41:49,190 pero vemos aquí, bueno, que las varianzas 301 00:41:49,190 --> 00:41:50,590 sí que estábamos casi seguros 302 00:41:50,590 --> 00:41:53,150 de que iba a dar un valor muy muy muy 303 00:41:53,150 --> 00:41:53,989 bajito de f 304 00:41:53,989 --> 00:41:57,230 porque son muy parecidas 305 00:41:57,230 --> 00:41:58,610 ¿no? y como es una entre la otra 306 00:41:58,610 --> 00:42:00,610 pero las medias, bueno, no son tan 307 00:42:00,610 --> 00:42:03,230 distintas así a priori 308 00:42:03,230 --> 00:42:05,050 ¿no? si las vemos a ojo 309 00:42:05,050 --> 00:42:06,929 y sí que nos sale una diferencia 310 00:42:06,929 --> 00:42:09,670 muy grande entre la calculada y la tabulada 311 00:42:09,670 --> 00:42:24,289 O sea, que hemos rechazado la hipótesis nula, aquí no la hemos vuelto, la tenemos que volver a plantear, hipótesis nula, la media del laboratorio 1 es igual que la media del laboratorio 2. 312 00:42:24,289 --> 00:42:34,289 Ahora, hipótesis alternativa. La media del laboratorio 1 es distinta que la media del laboratorio 2. 313 00:42:34,289 --> 00:42:48,329 Como T calculada es mayor que T tabulada, rechazo la hipótesis nula. 314 00:42:48,329 --> 00:43:10,579 Y por lo tanto, digo que sí existen diferencias significativas entre ambos laboratorios, entre la media obtenida en ambos laboratorios, ¿vale? 315 00:43:10,579 --> 00:43:24,300 No así en las precisiones, porque la prueba F, que es lo primero que hemos hecho, acordaos que la F calculada nos ha dado menor que la tabulada y por lo tanto hemos aceptado la hipótesis nula. 316 00:43:24,920 --> 00:43:31,480 Estos ejercicios en los que te piden calcular si hay discrepancia entre las medias, siempre tienen dos partes. 317 00:43:31,960 --> 00:43:39,280 Planteamos primero la hipótesis para ver las varianzas. La hipótesis nula siempre va a ser que son iguales y la alternativa que no. 318 00:43:40,139 --> 00:43:51,400 Y luego, una vez que tenemos esa parte hecha, siempre os digo lo de nos olvidamos de esa parte, nos vamos a la siguiente y lo que hacemos es plantear otra vez hipótesis. 319 00:43:51,400 --> 00:44:02,599 Mi hipótesis nula es que las medias son iguales y mi hipótesis alternativa, en este caso, como me dice, que si son distintas, mi hipótesis alternativa es que son distintas. 320 00:44:03,139 --> 00:44:09,820 Se puede dar el caso en el que me digan que si, por ejemplo, me podrían plantear este mismo ejercicio diciéndome 321 00:44:09,820 --> 00:44:17,380 ¿se puede afirmar que estadísticamente la media del laboratorio 2 es mayor que la del laboratorio 1? 322 00:44:17,380 --> 00:44:31,639 O me pueden plantear directamente, ¿se puede decir estadísticamente que la media de un laboratorio es mayor que la del otro? Siempre va a ser, si me dicen que si una es mayor que la del otro, obviamente es que si la del dos es mayor que la del uno. 323 00:44:31,639 --> 00:44:49,119 En ese caso, mi hipótesis alternativa no sería esta de aquí. Mi hipótesis alternativa sería que la X del laboratorio 1 es menor que la X del laboratorio 2. 324 00:44:50,099 --> 00:45:00,900 En el caso que hemos hecho, la hipótesis alternativa era que son distintos, pero se puede plantear otro tipo de pregunta que nos diga si una es mayor que otra. 325 00:45:00,900 --> 00:45:13,400 En este caso, ¿qué haríamos? Pues lo bueno que tiene esto, por si veis que en el examen os habéis equivocado, os dais cuenta al final de que no habéis hecho una cola, sino dos o viceversa. 326 00:45:13,900 --> 00:45:18,380 Que todo el ejercicio es igual. Quiero decir, todo lo que está hecho hasta aquí nos vale. 327 00:45:19,340 --> 00:45:27,340 Lo único que tendríamos que ver ahora es, imaginaos que os digo que queremos comparar si es mayor en vez de si es distinto. 328 00:45:27,340 --> 00:45:52,239 Pues nuestra T calculada para el 95% y para 16 grados de libertad la tenemos que ver en esta fila de aquí, ¿vale? En la de una cola 0,05 es esto de aquí, 1,75, ¿vale? 329 00:45:52,239 --> 00:46:11,619 Obviamente lo seguimos rechazando porque al final cuando hacemos de una cola es siempre más restrictivo que cuando hacemos de dos. Me refiero, daos cuenta que la diferencia entre una cola y dos colas, lo que es el número es irnos una filita a la izquierda y una filita a la izquierda siempre es un número menor, ¿vale? 330 00:46:11,619 --> 00:46:23,619 Entonces, bueno, a lo que voy es que si lo hemos rechazado en la hipótesis de dos colas, en la de una lo vamos a rechazar también, ¿vale? Pero bueno, lo hacemos, si no se hubiesen dicho. En vez de… 331 00:46:24,239 --> 00:46:25,239 Elena, una pregunta. 332 00:46:25,320 --> 00:46:25,480 Sí. 333 00:46:26,960 --> 00:46:33,619 Si en el momento del examen, digamos, no hacemos de dos colas y hacemos de una, ¿tú penalizarías todo el ejercicio? 334 00:46:33,619 --> 00:46:41,500 ejercicio? Todo el ejercicio no, porque si está bien el plantamiento de las hipótesis y lo que 335 00:46:41,500 --> 00:46:47,739 se ha hecho mal es mirar en la tabla como tal, no tienes un cero en el ejercicio, pero sí penaliza 336 00:46:47,739 --> 00:46:53,539 bastante porque al final lo que os comento de estos ejercicios es que lo que es el procedimiento 337 00:46:53,539 --> 00:46:58,500 son todos bastante iguales, primero calculamos nuestra media, nuestra desviación, nuestra 338 00:46:58,500 --> 00:47:04,179 varianza hacemos la prueba efe entonces lo que tiene ahí más de un poco distinto es ver si 339 00:47:04,179 --> 00:47:11,320 tenemos que buscar de una cola o de dos colas pero quedaos con esto si te dice que si son distintos o 340 00:47:11,320 --> 00:47:16,980 que si existen diferencias siempre va a ser de dos colas y si te dicen podemos decir que es mayor que 341 00:47:16,980 --> 00:47:25,039 podemos decir que es menor que podemos decir que supera este límite podemos decir que excede ese 342 00:47:25,039 --> 00:47:31,900 tipo de nomenclatura va a ser de una cola, ¿vale? Que al final, eso, si lo razonáis, 343 00:47:31,960 --> 00:47:42,440 o sea, luego los nervios del directo te puedes equivocar, pero lo sacáis seguro. Entonces, 344 00:47:42,619 --> 00:47:48,639 este que hemos hecho lo hemos resuelto entero, ¿vale? Los demás, pero voy a subiroslos 345 00:47:48,639 --> 00:47:57,039 ya para que los tengáis. Os los subo aquí en recursos de la unidad de trabajo 5. 346 00:47:59,360 --> 00:48:09,920 Eh, eh, perdonadme, pensé que os los había subido, los he preparado y al final se me 347 00:48:09,920 --> 00:48:12,219 olvidó darle al botón, vale. 348 00:48:13,599 --> 00:48:26,699 Eh, eh, archivo, os los subo como ejercicios, ejercicios y hipótesis. 349 00:48:29,360 --> 00:49:08,340 Aquí está. Ya los tenéis aquí. Hemos resuelto uno entero. El 4, creo que es, sí, el 4. El 3 se hace exactamente igual, solo que, bueno, pues habrá que ver, porque probablemente, no me acuerdo ahora, pero la S lo que nos diga es que las varianzas no son iguales y entonces tendríamos que utilizar la otra fórmula, pero el planteamiento es el mismo, ¿vale? 350 00:49:08,340 --> 00:49:33,719 Y luego, bueno, para recapitular, el 2 es el de comparar con una medida de referencia que este normalmente es siempre una hipótesis de una cola, porque cuando queremos saber si el valor que tenemos máximo aceptable de un contaminante en agua es tanto, pues lo que nosotros queremos calcular es si rebasa ese límite, ¿no? 351 00:49:33,719 --> 00:49:48,460 No si es distinto, si lo está superando. Entonces, en este caso, los de comparar con un valor de referencia, ahí es donde sí que suele ser unilateral. Los otros depende de lo que nos digan. 352 00:49:48,460 --> 00:50:05,539 Y luego el primero, que estos son los más sencillitos, porque cuando nos dicen que comparemos la precisión de dos métodos, la precisión en dos laboratorios, si las varianzas son iguales o no, que eso sería preguntarlo de una manera un poco demasiado obvia, solo tenemos que hacer la prueba F. 353 00:50:05,539 --> 00:50:18,900 ¿Vale? Y hemos hecho ya estos cuatro tipos de problemas y solo nos falta este último que es donde nos quedamos la semana pasada porque ya habíamos visto demasiada información de golpe. 354 00:50:18,900 --> 00:50:43,420 Entonces, vamos a retomar el archivo para nuestro último caso. Nuestro último caso es comparar series de medidas emparejadas. Creo que ya os hice un avance que es el caso más fácil de entender para que os acordéis. 355 00:50:43,420 --> 00:50:59,820 Es el de los estudios clínicos, por ejemplo. Yo voy con otras 10 personas a que me midan la tensión, por ejemplo, luego me inyectan un fármaco que baja la tensión y luego me vuelven a medir la tensión. 356 00:50:59,820 --> 00:51:20,199 Entonces, esos investigadores van a tener de las 10 personas una serie de datos del antes y una serie de datos del después. Por ejemplo, yo he tenido de tensión 7 y luego 6, la siguiente persona ha tenido 12 y luego 11, la tensión mínima, por ejemplo. 357 00:51:20,199 --> 00:51:33,400 Entonces, lo que vamos a hacer es comparar esas series de datos emparejados. No tiene sentido que me compare mi dato antes de la medicina con el dato de otro después, porque no tendríamos una consistencia con la que comparar. 358 00:51:33,400 --> 00:51:49,380 Entonces, lo que hacemos es un estadístico de comparar las dos series de medidas que están emparejadas para ver si el antes y el después hay una diferencia entre ellas. 359 00:51:50,199 --> 00:52:06,340 Entonces, ¿cómo lo hacemos? Lo hacemos calculando otra vez la T, ¿vale? Que es muy sencillito esta vez y ¿cómo lo hacemos? Tenemos que calcular la diferencia media, que es la media de las diferencias, ¿vale? 360 00:52:06,340 --> 00:52:23,039 O sea, por ejemplo, si yo mi valor de antes era, hemos dicho, 7 y el de después 6, la diferencia es 1, ¿no? Para el siguiente, si el valor de antes era 8 y el de después 7, la diferencia es 1 también. 361 00:52:23,039 --> 00:52:31,739 Para el siguiente ponle que la diferencia es 3, para el otro 4. Tengo una nueva serie de valores y de esas diferencias que obtengo hago la media. 362 00:52:33,059 --> 00:52:43,139 De esas diferencias que obtengo también hago la desviación y el valor de n, este de aquí, es el valor del número de participantes que tengo, 363 00:52:43,139 --> 00:52:54,199 el número de muestras que tengo, ¿vale? Calculo mi T y lo de siempre, si mi T calculada es mayor que la tabulada, se rechaza la hipótesis nula, ¿vale? 364 00:52:55,019 --> 00:53:08,000 Entonces, vamos a hacerlo con un ejemplo para que sea más fácil. Vamos a hacerlo, si queréis, de hecho, con el ejemplo este de aquí, que me dicen. 365 00:53:08,000 --> 00:53:13,920 Un investigador quiere evaluar si un tratamiento químico modifica el pH de una muestra de agua. 366 00:53:14,860 --> 00:53:18,880 Mide el pH antes y después del tratamiento en 10 muestras. 367 00:53:19,500 --> 00:53:27,059 Entonces, la muestra 1, antes de darle ese tratamiento, su pH es 7,1 y después de dárselo, su pH es 7,3. 368 00:53:27,820 --> 00:53:34,639 Para la muestra 2, antes del tratamiento es 6,9, después del tratamiento 6,8 y así sucesivamente. 369 00:53:35,519 --> 00:53:39,099 ¿Por qué son medidas emparejadas? Porque estas muestras son independientes. 370 00:53:39,199 --> 00:53:46,420 No tendría sentido que dijera, vale, voy a comparar este 7 con el valor de antes de la muestra 1 con el valor de después de la muestra 5. 371 00:53:46,420 --> 00:53:49,280 No me da ninguna información analítica, ¿vale? 372 00:53:49,440 --> 00:53:56,360 Entonces, lo que hago es hacer la diferencia entre estos pares, ¿vale? 373 00:53:56,840 --> 00:54:03,599 Vamos a poner, por ejemplo, que tenemos aquí una serie de muestras. 374 00:54:04,639 --> 00:54:12,699 Una medida previa y aquí una medida después de un tratamiento, ¿vale? 375 00:54:12,699 --> 00:54:19,980 Que puede ser un tratamiento térmico, puede ser lo que os he dicho, por ejemplo, del caso del ensayo clínico, lo que me dé a mí la gana, ¿vale? 376 00:54:21,320 --> 00:54:28,619 Entonces, imaginaos, tenemos aquí la muestra 1, la muestra 2, la 3, la 4, la 5, la 6 y la 7, por ejemplo. 377 00:54:28,619 --> 00:54:42,300 Y yo he medido concentraciones, pues esta es 75, esta es 78, 79, 78, 73, 74 y 77. 378 00:54:42,300 --> 00:55:01,000 Y ahora, después del tratamiento, esta es 76, esta es 76, esta es 77, esta es 82, 75, 73 y 80. Me lo he inventado estos datos, ¿vale? 379 00:55:01,000 --> 00:55:18,539 Ahora, ¿qué hago? Tengo, pues eso, tenía una serie de concentraciones, bueno, una serie de... me da igual la medida, he hecho algo y ahora veo cuál es el resultado después de mi proceso, pues de aumentar la temperatura, etc. 380 00:55:18,539 --> 00:55:28,880 Para mi muestra 1, antes tenía 75 y ahora tengo 76, entonces aquí me voy a hacer una columna que se llame diferencias, ¿vale? 381 00:55:29,440 --> 00:55:43,139 ¿Y qué voy a hacer? 75 menos 76, que me da menos 1, 78 menos 76, que me da 2, 79 menos 77, que me da 2, 382 00:55:43,139 --> 00:55:59,400 78 menos 82 que me da menos 4, menos 2, 1 y menos 3, ¿no? 77 menos 80 menos 3. Las diferencias son en valor absoluto, ¿vale? En valor absoluto. 383 00:55:59,400 --> 00:56:21,059 O sea que aquí esto en vez de menos 1 es 1, esto en vez de menos 4 es 4, en vez de menos 2 es 2 y en vez de menos 3 es 3, ¿vale? Pues ahora, lo que os digo siempre, si queréis, ignoramos todos estos datos, ya hacemos como si no existieran y nos vamos a quedar con estos de aquí, ¿vale? Para hacer nuestros cálculos. 384 00:56:21,059 --> 00:56:35,300 Entonces, ¿qué es lo que necesitamos? Vamos a poner aquí la formulita, ¿vale? La voy a dejar aquí pegada para que veamos que esto ya no es absolutamente igual. 385 00:56:35,300 --> 00:56:49,320 aquí la pongo, vale, necesito calcular mi t y para calcular mi t necesito el valor absoluto de la media de mis diferencias, ¿vale? 386 00:56:49,739 --> 00:56:57,960 después necesito la desviación y la raíz cuadrada del número de muestras que tengo, ¿vale? 387 00:56:57,960 --> 00:57:29,349 Pues voy a ello, voy a calcular primero la media, la media de estos valores de aquí, de estas diferencias, que es sumar todas y dividirlas entre el número que tengo, que son 7, pues lo hago, hago la media, 1 más 2 más 2 más 4 más 2 más 1 más 3, dividido entre 7, y me da 2,14. 388 00:57:29,349 --> 00:57:50,130 Ok, ya tengo esto de aquí. Ahora necesito la desviación. La S, que es mi desviación estándar o desviación típica. Vale, pues la calculo. Lo mismo la calculo con la calculadora y ya tengo mi desviación estándar. 389 00:57:50,130 --> 00:58:05,989 Nos acordamos de cómo era la fórmula, que era cada valor menos la media elevado al cuadrado dividido entre n y la raíz cuadrada de todo eso, dividido entre n menos 1, pero lo podemos hacer con la calculadora porque es como se hace habitualmente. 390 00:58:05,989 --> 00:58:21,469 Vale, ya tenemos la media y la desviación estándar. Tengo n, ¿no? El número de valores que tengo son 7. 1, 2, 3, 4, 5, 6 y 7. Tengo 7 parejas de valores. 391 00:58:21,469 --> 00:58:46,449 Pues ya puedo calcular la t. Mi t es igual a la media dividido entre la desviación y todo ello multiplicado por raíz de n, por la raíz de 7. 392 00:58:46,449 --> 00:59:02,469 Vale, pues ya tengo mi T calculada. Mi T calculada es 5,30. Ahora, me tengo que ir a la tabla de la TED Student para comparar, ¿no? Entonces voy a buscar el 95%. 393 00:59:02,469 --> 00:59:20,170 Lo que me decía el enunciado es, bueno, este enunciado imaginario, me dice que si mis métodos, si varía el tratamiento, varían los resultados realmente, quiero decir, en el caso de la tensión, ¿el medicamento es realmente efectivo? 394 00:59:20,630 --> 00:59:31,309 Pues será realmente efectivo si la tensión que yo tengo antes es mayor que la tensión que tengo después, ¿no? Si me ha bajado la tensión y eso lo tenemos que analizar estadísticamente, ¿vale? 395 00:59:31,309 --> 00:59:56,969 Pues ¿qué hago? Me voy a buscar en la tabla de la TED Student para, acordaos que ahora tenemos una serie de valores, los grados de libertad son n-1, los grados de libertad aquí van a ser 6, pues tendré que ir a mi tabla de la TED Student al 95% y de dos colas, ¿vale? 396 00:59:56,969 --> 01:00:15,989 Bueno, depende de cómo esté planteado el ejercicio. Pero vamos a ver, por ejemplo, la de dos colas. Para grados de libertad 6 al 95%, ¿vale? 95% grados de libertad 6. 397 01:00:15,989 --> 01:00:36,389 La t tabulada es 2,45. La t tabulada es 2,45. La t calculada es 5,30. ¿Vale? ¿Qué nos dice esto? 398 01:00:36,389 --> 01:00:54,710 Bueno, la T tabulada es menor que la T calculada, o sea, la T que yo he calculado es más grande que la T que está en las tablas, por lo tanto, rechazo la hipótesis nula. O sea, que las medias antes y después no son iguales, ¿vale? 399 01:00:54,710 --> 01:01:12,570 Hay diferencias entre el grupo antes de la modificación y el grupo después. ¿Eso qué significa? Pues en el caso de un medicamento me diría que sí que está siendo efectivo, que el valor de las tensiones antes es distinto que el valor de las tensiones después. 400 01:01:12,570 --> 01:01:50,949 ¿Sí? ¿No? ¿Qué os parece? Esto, si os dais cuenta, es el más fácil de calcular. Puede ser más difícil identificar el tipo de problema que es, pero siempre es que tenemos una serie de muestras, a esa serie de muestras les hacemos algo a todas por igual y volvemos a medir. Entonces, tenemos los valores del antes y del después. 401 01:01:50,949 --> 01:01:52,570 Elena, una pregunta 402 01:01:52,570 --> 01:01:59,219 cuando hiciste la media 403 01:01:59,219 --> 01:02:01,059 se divide con la desviación estándar 404 01:02:01,059 --> 01:02:03,219 y luego ese resultado lo dividís 405 01:02:03,219 --> 01:02:04,880 entre la raíz de 7 406 01:02:04,880 --> 01:02:06,719 es que no me sale el resultado 407 01:02:06,719 --> 01:02:09,360 date cuenta que 408 01:02:09,360 --> 01:02:11,219 en el numerador está 409 01:02:11,219 --> 01:02:13,579 la desviación media 410 01:02:13,579 --> 01:02:15,480 y luego en el denominador 411 01:02:15,480 --> 01:02:15,739 está 412 01:02:15,739 --> 01:02:19,260 la desviación media 413 01:02:19,260 --> 01:02:21,380 y luego en la media 414 01:02:21,380 --> 01:02:24,400 de las diferencias, perdonad que hablo fatal 415 01:02:24,400 --> 01:02:27,599 y luego en el denominador tienes la desviación 416 01:02:27,599 --> 01:02:29,699 típica dividida entre raíz de n 417 01:02:29,699 --> 01:02:32,840 hacer esto es lo mismo que hacer 418 01:02:32,840 --> 01:02:36,719 dividir entre la desviación típica y multiplicar 419 01:02:36,719 --> 01:02:39,500 por raíz de n, porque cuando tenemos en una, o sea lo podéis hacer 420 01:02:39,500 --> 01:02:42,320 con números si queréis, si yo tengo 3 entre 421 01:02:42,320 --> 01:02:45,300 5 entre 3, entre 4 422 01:02:45,300 --> 01:02:49,849 es lo mismo que hacer 423 01:02:49,849 --> 01:02:52,329 3 entre 5 424 01:02:52,329 --> 01:02:54,070 y multiplicarlo por 4 425 01:02:54,070 --> 01:02:55,829 porque ese 4 está dividiendo 426 01:02:55,829 --> 01:02:57,489 el denominador, o sea, que pasa arriba 427 01:02:57,489 --> 01:03:02,500 es una propiedad matemática 428 01:03:02,500 --> 01:03:02,980 si quieres 429 01:03:02,980 --> 01:03:05,880 lo trataré de hacer así 430 01:03:05,880 --> 01:03:07,739 a ver si me da el resultado que a ti te da 431 01:03:07,739 --> 01:03:10,000 igual me he equivocado ya al multiplicar algo 432 01:03:10,000 --> 01:03:11,539 pero lo que digo es que tengáis 433 01:03:11,539 --> 01:03:13,800 mucho cuidado cuando en una fórmula 434 01:03:13,800 --> 01:03:16,039 tenéis algo que está 435 01:03:16,039 --> 01:03:17,579 dividiendo al denominador 436 01:03:17,579 --> 01:03:22,239 porque esto de aquí de desviación media 437 01:03:22,239 --> 01:03:29,079 dividido entre SD dividido entre raíz de N es muy distinto el resultado que si haces desviación media 438 01:03:29,079 --> 01:03:37,000 dividido entre SD y todo ello entre raíz de N, ¿vale? O sea, sería como poner un paréntesis aquí. 439 01:03:38,119 --> 01:03:45,340 Entonces yo por eso os recomiendo en general con estos ejercicios que eso, que las operaciones son suma, resta, multiplicar, 440 01:03:45,340 --> 01:03:55,179 dividir y poco más, pero que tienen mucho cálculo intermedio, entonces yo por eso, sobre todo en el examen, os recomiendo que las hagáis de un par de maneras distintas, 441 01:03:55,559 --> 01:04:05,199 que os vayáis apuntando a trocitos lo que os va dando para comprobar y que lo hagáis un par de veces y con mucha paciencia, porque eso, como te baila un paréntesis, 442 01:04:05,199 --> 01:04:18,019 En esta fórmula, por ejemplo, en la de los grados de libertad, aquí como te baile un paréntesis y no lo pongas aquí o esto no lo eleves al cuadrado, ya te da un número distinto. 443 01:04:18,119 --> 01:04:24,000 Y es una rabia que por meter datos mal en la calculadora sabiendo hacer algo no te dé el resultado. 444 01:04:27,599 --> 01:04:31,940 Pero bueno, esto ya es el último tipo de ejercicio que tenemos. 445 01:04:31,940 --> 01:04:48,940 Entonces, en este archivo tenéis los cinco tipos, que en realidad son cuatro, solo que uno se puede plantear de dos maneras diferentes. Intentad hacerlos para la semana que viene y los corregimos rápidamente. 446 01:04:48,940 --> 01:05:06,380 ¿Vale? Eso, acordaos de hacer, pues eso, hacemos primero la varianza, dividimos una entre la otra, así podemos saber si las precisiones son iguales o no. Tenéis todas las tablas en el aula virtual y estos ejercicios ya tenéis esta tanda subida también en el aula virtual, ¿vale? 447 01:05:06,380 --> 01:05:15,079 Y lo último que os quiero contar, y esto creo que ni os lo he subido ni os lo voy a subir para que no os asustéis, 448 01:05:15,239 --> 01:05:19,940 o sea, quiero decir, lo vamos a dar como teoría pero no vamos a hacer ejercicio sobre ANOVA, ¿vale? 449 01:05:20,639 --> 01:05:25,460 Pero como concepto, o sea, una pregunta tipo test, por ejemplo, sí que podría caer, ¿vale? 450 01:05:25,500 --> 01:05:27,019 Sobre el análisis de la varianza. 451 01:05:27,019 --> 01:05:36,719 Entonces, hemos estado viendo cómo utilizar las tablas de la T de Student para comparar dos series de valores. 452 01:05:37,000 --> 01:05:41,940 Tenemos un laboratorio A y un laboratorio B y vemos si los resultados son iguales. 453 01:05:42,119 --> 01:05:47,539 Utilizamos la T de Student o queremos ver la precisión de los métodos, utilizamos la prueba F. 454 01:05:48,199 --> 01:05:55,019 Queremos comparar un valor de referencia con una serie de datos, utilizamos también una T de Student. 455 01:05:55,019 --> 01:06:17,380 Estamos siempre comparando dos valores. ¿Qué pasa? Que si tenemos más de dos series de datos, no podemos hacerlo con los métodos que hemos visto y se hace con un método, entre otros, pero el método estadístico más utilizado es un método que se llama ANOVA, que tiene del inglés Analysis of Variance, creo, ¿vale? Análisis de la varianza. 456 01:06:17,380 --> 01:06:46,400 ¿Y para qué nos sirve la NOVA? Para poder analizar, comparar las medias de tres o más grupos. Por ejemplo, hemos hecho el laboratorio 1 y el laboratorio 2, pero imaginaos que estamos en un ejercicio de intercomparación de laboratorios y estamos analizando la misma muestra en cinco laboratorios distintos para ver, pues eso, para comparar si la media que nos da es la misma y para evaluar esos laboratorios 457 01:06:46,400 --> 01:06:52,480 o la pureza de esa muestra. No podemos hacerlo con nuestras estadísticas, utilizamos análisis de la varianza. 458 01:06:52,940 --> 01:07:00,619 Para hacer los cálculos de manera manual es un horror, porque es como lo que hemos estado haciendo multiplicado por 100. 459 01:07:01,320 --> 01:07:07,219 Entonces, para hacer el análisis de la varianza se hace con hojas de cálculo, hay software específicos que lo hacen, 460 01:07:07,219 --> 01:07:12,139 entonces solo vamos a verlo conceptualmente, pero no lo vamos a hacer nosotros. 461 01:07:12,139 --> 01:07:39,320 ¿Vale? Entonces, hacemos un poco lo mismo que hemos hecho hasta ahora, pero con tres series de datos, tres, cuatro, cinco, las que sean, ¿vale? La hipótesis nula, que la media de esos datos es igual, que no hay diferencia significativa, o sea, yo tengo mi muestra, la analizo por el método A, por el método B y por el método C, y mi hipótesis nula es que X sub A es igual a X sub B es igual a X sub C, ¿vale? 462 01:07:39,320 --> 01:07:52,380 ¿Mi hipótesis alternativa? Que sí que hay diferencia. Y aquí no puedo afinar mucho, no puedo decir que una es mayor que otra, simplemente digo que una es distinta, una de las que tengo. Sí que hay diferencias significativas. 463 01:07:52,380 --> 01:08:04,139 En la ANOVA hay distintas maneras de hacerlo, es un método relativamente complejo, que tiene muchas variantes, etc. 464 01:08:04,139 --> 01:08:21,720 Pero lo único que tenemos que tener nosotros relativamente claro es que la diferencia que hay entre la prueba ANOVA y la prueba de la TED Student es que la prueba de la TED Student nos sirve para comparar dos grupos y la prueba ANOVA nos sirve para comparar tres o más grupos. 465 01:08:22,380 --> 01:08:40,000 Si yo en un examen os pongo cómo comparo la media y os doy tres series de valores, me tendréis que decir que con el análisis de la varianza no va, por ejemplo, pero repito que no vamos a hacer ningún cálculo, solo conceptualmente saber que es para tres grupos o más. 466 01:08:40,000 --> 01:08:44,180 tienen que cumplir una serie de requisitos 467 01:08:44,180 --> 01:08:46,479 que bueno, es que se haya independencia 468 01:08:46,479 --> 01:08:48,199 homogeneidad en las varianzas 469 01:08:48,199 --> 01:08:49,840 y que la distribución sea normal 470 01:08:49,840 --> 01:08:51,779 pero lo mismo, todo esto 471 01:08:51,779 --> 01:08:53,359 lo dejamos un poco 472 01:08:53,359 --> 01:08:55,439 de lado 473 01:08:55,439 --> 01:08:57,640 y entonces lo que se basa 474 01:08:57,640 --> 01:08:59,680 ANOVA es en 475 01:08:59,680 --> 01:09:01,500 hacer una comparativa entre 476 01:09:01,500 --> 01:09:03,979 la varianza que hay entre cada una 477 01:09:03,979 --> 01:09:06,000 de las series y la varianza 478 01:09:06,000 --> 01:09:08,039 que hay entre las series 479 01:09:08,039 --> 01:09:16,859 entre ellas. Me explico mejor. Imaginaos que tenemos, por ejemplo, aquí yo tengo tres 480 01:09:16,859 --> 01:09:25,420 series de valores. Tengo esta, es una. Esta es otra. Números sin ningún tipo de sentido, 481 01:09:25,760 --> 01:09:33,960 ¿vale? Pero bueno. Y esta de aquí, 7, 8, 6, 7, 44, 6. Esta es otra. Vale, pues lo que 482 01:09:33,960 --> 01:09:42,300 tenemos es tres experimentos, por ejemplo, tres laboratorios, tres métodos y yo voy a ver una 483 01:09:42,300 --> 01:09:50,840 comparativa entre las varianzas intraseries y a su vez las varianzas interseries, solamente para 484 01:09:50,840 --> 01:09:56,039 que lo sepáis. Entonces, haciendo una serie de cálculos en los que no nos vamos a meter, yo voy 485 01:09:56,039 --> 01:10:02,939 a calcular también un parámetro f que luego voy a poder comparar con unas tablas para ver si mi 486 01:10:02,939 --> 01:10:12,100 ¿Mis medias se pueden considerar iguales o no? Solo esto os lo repito como concepto. 487 01:10:12,100 --> 01:10:24,819 El análisis de la varianza ANOVA para tres o más series. Como ejercicios y como cosas que vayamos a aplicar nosotros experimentalmente, vamos a utilizar solo los que hemos visto. 488 01:10:24,819 --> 01:10:49,340 Entonces, tenemos comparar una serie de valores que tengamos, unas medidas con un valor de referencia, comparar precisiones de métodos, prueba F, comparar medias de métodos, que eso tendremos que hacerlo con una T o con otra en función de lo que nos haya dado F, y comparación de medidas emparejadas, ¿vale? 489 01:10:49,340 --> 01:11:11,399 Estos son los cuatro tipos de ejercicios. Para irnos un poco más atrás, tenemos también los ejercicios de ver en una serie de datos si hay algún dato anómalo, que lo podíamos hacer con la Q de Gibson, con groups, o sea, con métodos basados en tablas o métodos basados en intervalos de confianza. 490 01:11:11,399 --> 01:11:26,460 Y un poquito más atrás de eso teníamos ejercicios que habíamos hecho, los que están relacionados con la distribución normal, que nos decían el porcentaje debajo de la curva, el porcentaje de datos que tenemos por encima o por debajo de un determinado valor. 491 01:11:26,460 --> 01:11:39,100 Y luego habíamos hecho ejercicios relacionados con estadística descriptiva, muy facilitos, hacer la media, hacer la moda, hacer la desviación típica, la varianza, etc. 492 01:11:39,579 --> 01:11:51,899 Y calcular intervalos de confianza, que los intervalos de confianza, acordaos que la fórmula es T por S dividido entre la raíz de N. 493 01:11:51,899 --> 01:11:55,159 entonces yo tengo mi media 494 01:11:55,159 --> 01:11:57,380 y a mi media le sumo esto 495 01:11:57,380 --> 01:11:58,699 y le resto esto 496 01:11:58,699 --> 01:12:00,520 y así tengo mi intervalo de confianza 497 01:12:00,520 --> 01:12:01,359 a mi más menos 498 01:12:01,359 --> 01:12:06,149 vale 499 01:12:06,149 --> 01:12:07,750 ¿dudas hasta aquí? 500 01:12:09,270 --> 01:12:10,670 supongo que tendréis que verlo 501 01:12:10,670 --> 01:12:12,149 igual con un poco más de calma 502 01:12:12,149 --> 01:12:14,510 y probar vosotras hacerlo 503 01:12:14,510 --> 01:12:19,350 pero si alguien tiene alguna pregunta 504 01:12:19,350 --> 01:12:24,229 cuando se hacen ya despacito 505 01:12:24,229 --> 01:12:25,210 repitiéndolo 506 01:12:25,210 --> 01:12:26,289 es mucho más fácil 507 01:12:26,289 --> 01:12:28,770 vale, intentadlo 508 01:12:28,770 --> 01:12:31,369 y ya veréis que esto sí que aturulla 509 01:12:31,369 --> 01:12:33,630 un poco porque es mucha información 510 01:12:33,630 --> 01:12:35,229 mucho número y mucha cosa 511 01:12:35,229 --> 01:12:36,590 que tener en cuenta pero de verdad 512 01:12:36,590 --> 01:12:39,170 que luego eso, hay estos cinco tipos 513 01:12:39,170 --> 01:12:40,590 que tenéis y es que no hay más 514 01:12:40,590 --> 01:12:43,670 entonces si entendéis bien 515 01:12:43,670 --> 01:12:44,869 cómo lo estáis haciendo 516 01:12:44,869 --> 01:12:46,529 sabéis hacer todos 517 01:12:46,529 --> 01:12:48,750 aunque aturulla un poco 518 01:12:48,750 --> 01:12:51,109 y esta 519 01:12:51,109 --> 01:12:52,010 es 520 01:12:52,010 --> 01:12:54,770 lo que quería terminar hoy 521 01:12:54,770 --> 01:13:24,670 Creo que lo pusimos aquí. Hoy terminar con los test estadísticos y plantear ejercicios y las dos siguientes sesiones o tres van a ser ya las últimas de esta parte, de la parte más compleja, la unidad de trabajo 5, que es toda la relacionada con cálculos de incertidumbres, de test estadísticos, etc. 522 01:13:24,770 --> 01:13:26,569 la despresión de los resultados, ¿no? 523 01:13:27,250 --> 01:13:32,529 Entonces, lo último que nos queda, os lo voy a plantear hoy, 524 01:13:34,029 --> 01:13:39,810 pero no vamos a avanzar mucho, porque ya supongo que también es mucha información. 525 01:13:39,810 --> 01:13:44,810 A ver, la distancia es... 526 01:13:50,119 --> 01:13:52,260 Este archivo no es... 527 01:13:52,260 --> 01:13:54,239 Es este de aquí, perdonadme. 528 01:13:55,220 --> 01:13:55,560 Vale. 529 01:13:55,560 --> 01:14:19,119 Bien, y lo que vamos a ver son los métodos de calibración analítica y expresión de los resultados, ¿vale? Bueno, tenemos una serie de parámetros estadísticos, de parámetros de calidad, perdonadme que yo creo que ya definimos uno a uno, no estoy segura, si no el próximo día les damos otro repaso a todos, ¿vale? 530 01:14:19,119 --> 01:14:33,319 Los parámetros que nos miden la calidad de un método analítico, ¿no? La exactitud y la precisión lo tenemos todos claro porque lo hemos repetido hasta la saciedad, pero igual los demás no los tenemos tan trabajados, ¿no? 531 01:14:33,319 --> 01:14:36,159 Entonces, bueno, el próximo día vamos a empezar hablando de esto. 532 01:14:39,539 --> 01:14:57,880 Cuando los errores sí que los hemos visto, vale, os quiero llegar aquí, vale, a la calibración, que la calibración todos tenemos, claro, una acepción, un significado, porque lo hemos visto en este mismo módulo, 533 01:14:57,880 --> 01:15:05,760 porque lo habréis visto más veces y cuando habéis venido al laboratorio, etcétera, que la calibración tiene una acepción, un significado, 534 01:15:06,159 --> 01:15:13,279 que son las operaciones que lo que nos establecen es la relación entre los valores que nos da un instrumento y el valor real de una medida. 535 01:15:13,659 --> 01:15:20,539 Por ejemplo, el hecho de que una balanza esté calibrada significa que un kilo pesa un kilo. Eso es la calibración instrumental. 536 01:15:20,539 --> 01:15:39,300 Ahora, la calibración analítica es establecer una relación entre un parámetro y una señal de un instrumento. Es la relación entre los valores indicados por un instrumento y valores conocidos de una magnitud química. 537 01:15:39,300 --> 01:15:53,119 Nos establece una correspondencia entre la respuesta del equipo, la señal que nos da el equipo y el resultado analítico, que es la concentración del analito, la sustancia que estamos analizando. 538 01:15:53,779 --> 01:16:01,380 Entonces, la recta de calibrado es una de las herramientas más utilizadas en el laboratorio. 539 01:16:01,380 --> 01:16:15,359 Y el objetivo que tiene, bueno el objetivo, el funcionamiento es relativamente sencillo de entender. Nosotros, a ver si tengo aquí, vale aquí, nosotros hacemos una serie de patrones en el laboratorio. 540 01:16:15,359 --> 01:16:42,359 Yo cojo, por ejemplo, vamos a pensar en sal común o en cualquier sustancia que queráis, pero imaginaos en sal. Yo hago mis cálculos y calculo qué cantidad de sal tengo que pesar y en qué volumen lo tengo que diluir para hacer unas disoluciones de concentración al 1% masa de sal, al 5%, al 10%, al 15% y al 20%, por ejemplo. 541 01:16:42,359 --> 01:16:50,039 Pues yo me hago estas disoluciones, yo las hago en el laboratorio y tengo una cantidad perfectamente conocida. 542 01:16:50,140 --> 01:16:58,539 Yo sé qué concentración exacta tiene cada una de mis disoluciones, que tengo cada una en un matraz aforado, mía son. 543 01:16:59,239 --> 01:17:08,819 Luego cojo un instrumento que me mida, como estoy pensando en sal, pues por ejemplo, yo cojo un conductímetro y me pongo a medir la conductividad de mis disoluciones. 544 01:17:08,819 --> 01:17:26,220 ¿Vale? Entonces, para cada una de mis disoluciones voy a obtener un valor, ¿no? Tengo, pues que para mi disolución al 1% mi conductividad es 15, para la del 2% es 32, etc. ¿No? 545 01:17:26,220 --> 01:17:31,579 Entonces, yo voy a tener una serie de puntos XY y voy a poder representarlos gráficamente. 546 01:17:32,199 --> 01:17:37,100 Para aquí, imaginaos que para concentración 0, la señal que me da es 0. 547 01:17:37,500 --> 01:17:41,340 Para mi concentración 1, la señal que me da es 1, algo. 548 01:17:41,619 --> 01:17:43,819 Pues hago aquí mi cruz, mi representación. 549 01:17:44,460 --> 01:17:47,399 Para 2, me da 2 con lo que sea. 550 01:17:47,739 --> 01:17:50,720 La represento todo esto de una manera precisa. 551 01:17:51,439 --> 01:17:54,840 Aquí, para 4, me da que es 3 con 8. 552 01:17:54,840 --> 01:18:13,819 Pues hago esta cruz de aquí, ¿vale? Entonces tengo una serie de puntos que, si os dais cuenta, los puntos azules que son los experimentales se asemejan bastante a una línea recta, ¿no? Yo esto lo puedo unir y se parece mucho, mucho a una línea recta. 553 01:18:13,819 --> 01:18:28,180 Tenemos distintas formas, podríamos tener, por ejemplo, si los puntos fuesen así, podría ser algo exponencial, podríamos tener puntos que no tuviesen ningún sentido, pero estos de aquí tienen una relación bastante lineal. 554 01:18:28,180 --> 01:18:44,399 Pues yo matemáticamente puedo calcular la ecuación que une estos puntos, que lo que hace es hacerme la recta más parecida posible a todos los puntos que tengo yo experimentalmente. 555 01:18:45,420 --> 01:18:56,760 Yo tengo estos puntos de mis concentraciones conocidas, tengo la recta que he calculado, que ya veremos cómo con la calculadora, no os preocupéis, que es con un modo regresión. 556 01:18:56,760 --> 01:19:15,300 Entonces, calculo mis datos y ahora digo, vale, pues yo ahora estoy en el laboratorio, tengo un matraz con una concentración de sal que yo no sé cuál es y le mido la conductividad, ¿vale? Y esa conductividad me dice que es 3,5, ¿vale? 557 01:19:15,300 --> 01:19:28,380 Pues entonces yo tengo una conductividad de 3,5 y me puedo ir a interpolar en mi recta y me dice que la concentración es 3,5, ¿vale? 558 01:19:28,600 --> 01:19:31,600 Entonces, ¿por qué es tan tan tan tan importante el calibrado? 559 01:19:31,600 --> 01:19:41,319 Porque nos permite, gracias a hacer unos patrones, unas disoluciones de concentración conocida y medir una señal, establecemos una relación 560 01:19:41,319 --> 01:19:43,899 y luego yo puedo, con una muestra desconocida 561 01:19:43,899 --> 01:19:46,220 de la que no tengo idea de la concentración, 562 01:19:47,060 --> 01:19:49,720 averiguar qué concentración tiene 563 01:19:49,720 --> 01:19:53,319 gracias a estos datos de aquí, ¿vale? 564 01:19:53,600 --> 01:19:57,579 Entonces, bueno, esto es el calibrado analítico. 565 01:19:58,000 --> 01:20:00,159 Hay distintos tipos, que es lo que vamos a ir viendo, 566 01:20:00,720 --> 01:20:03,720 pero bueno, ya os lo dejo presentado hoy 567 01:20:03,720 --> 01:20:06,180 y eso que avanzamos, ¿vale? 568 01:20:07,100 --> 01:20:10,079 Así que voy a parar ya la...