1 00:00:00,000 --> 00:00:10,300 Pues tenemos el punto número 6 de la unidad de trabajo 5, la validación de los métodos analíticos. 2 00:00:10,300 --> 00:00:22,300 Y os recuerdo que esta parte de validación ya la vimos en la unidad de trabajo número 3, cuando hablamos de las normas de competencia técnica, concretamente de la 17.025. 3 00:00:22,300 --> 00:00:37,619 Y es un requisito que es fundamental, exigible a todo tipo de laboratorio para poder proporcionar datos que sean fidedignos, lo que se entiende por datos significativos. 4 00:00:37,619 --> 00:01:00,840 Lo único que se pretende con la validación es demostrar, lógicamente soportado por pruebas documentales, que un método analítico va a cumplir todos los estándares o requisitos necesarios para aquella aplicación para la cual se ha diseñado, para una aplicación específica concreta. 5 00:01:00,840 --> 00:01:10,459 Por ejemplo, un método oficial para la determinación, por ejemplo, se me ocurre de nitritos en agua o para determinar la dureza del agua. 6 00:01:11,239 --> 00:01:29,819 Entonces, los métodos que se validan dentro del ámbito de aplicación de la norma 17.025 son básicamente los que tenéis en este cuadrado que aparece en la diapositiva. 7 00:01:29,819 --> 00:01:34,700 ¿Cuándo se validaría un método dependiendo de los casos? 8 00:01:34,700 --> 00:01:52,700 Los métodos normalizados, que normalmente suelen ser métodos de carácter oficial, se validan para determinar si el laboratorio tiene un dominio del ensayo completo y lo utiliza correctamente. 9 00:01:52,700 --> 00:02:14,520 En este sentido, lo que hace el laboratorio es validar o verificar los principales parámetros de repetibilidad, exactitud, precisión y límite de detección, que ahora veremos cuál es la principal definición de todas estas características, desde el punto de vista de un método que ya está normalizado. 10 00:02:14,520 --> 00:02:36,659 Otro caso de validación de métodos es cuando un método que está normalizado se modifica. En este caso el método modificado se tiene que validar y el alcance de esa validación va a depender de las modificaciones que se le hagan a ese método. 11 00:02:36,659 --> 00:02:52,539 En ese sentido, el laboratorio es el que establece los parámetros, sobre todo de fiabilidad, que ahora veremos cuáles son, qué tipo de parámetros son los que va a validar en función del alcance de esa modificación. 12 00:02:52,539 --> 00:03:13,919 Y por último, los métodos que no son normalizados, normalmente suelen ser métodos de carácter interno de un laboratorio, estos métodos deben de ser validados siempre y se deben de chequear todos los parámetros estadísticos de acuerdo a la funcionalidad del propio método de validación. 13 00:03:14,699 --> 00:03:38,620 Entonces, una vez que ya sabemos cómo o qué tipo de métodos se validan, esto también viene especificado en la norma 17.025, en la unidad de trabajo número 3, la tarea que os planteé de análisis de la norma, una de las preguntas estaba relacionada con la validación de los métodos. 14 00:03:38,620 --> 00:03:42,159 cuando un laboratorio tenía que validar un método analítico. 15 00:03:42,719 --> 00:03:47,439 Estos son fundamentalmente un resumen de los casos en los que el laboratorio lo tiene que hacer. 16 00:03:48,000 --> 00:03:50,860 ¿En qué consisten los criterios de validación? 17 00:03:51,199 --> 00:03:54,680 Se clasifican fundamentalmente en dos grandes bloques. 18 00:03:55,280 --> 00:04:00,979 Los criterios de fiabilidad, que son propiedades analíticas de carácter cuantitativo, 19 00:04:00,979 --> 00:04:04,939 es decir, las podemos expresar de una forma numérica, 20 00:04:04,939 --> 00:04:15,439 nos van a permitir establecer cómo de eficaz es el método en sí para poder resolver un problema analítico, 21 00:04:15,699 --> 00:04:21,920 mientras que los criterios de practicabilidad son más bien criterios de carácter cualitativo. 22 00:04:21,920 --> 00:04:26,920 No son imprescindibles, no es obligatorio chequearlos absolutamente todos, 23 00:04:27,899 --> 00:04:34,199 pero sí debe de tenerse en cuenta, sobre todo a la hora de elegir entre uno u otro método. 24 00:04:34,939 --> 00:04:56,259 Fundamentalmente, los criterios de fiabilidad de los cuales ya hemos ido avanzando algunas definiciones a lo largo de esta unidad de trabajo, estos criterios son fundamentalmente la precisión, la exactitud, la linealidad y relacionada con esa linealidad cuál es el intervalo de linealidad o intervalo de trabajo, 25 00:04:56,259 --> 00:05:07,420 Los límites de detección y límites de cuantificación, que ya hablamos de ellos en la videoconferencia anterior, cuando estuvimos abordando las rectas de calibrado. 26 00:05:08,120 --> 00:05:18,839 La sensibilidad y selectividad de un método y su robustez. Estos son todos los criterios fundamentales de fiabilidad. 27 00:05:18,839 --> 00:05:40,060 Los criterios de practicabilidad se basan sobre todo a la hora de chequear más bien la velocidad o el tiempo del proceso analítico, cuál es el coste del proceso y también el coste de la disponibilidad de los equipos instrumentales que yo voy a necesitar, 28 00:05:40,060 --> 00:05:57,879 El coste por muestra, si el método es simple o es complejo a la hora de aplicarlo, porque eso va a estar también muy relacionado con la necesidad de tener un personal formado en un mayor o menor nivel de complejidad. 29 00:05:57,879 --> 00:06:05,620 la habilidad y la pericia del personal técnico es también importante y luego ya pues tener en 30 00:06:05,620 --> 00:06:09,959 cuenta todos los parámetros que afectan a las medidas de seguridad que se deben de tener en 31 00:06:09,959 --> 00:06:14,639 cuenta en el laboratorio para desarrollar ese método analítico y sobre todo el nivel de 32 00:06:14,639 --> 00:06:20,660 toxicidad de los reactivos a utilizar por si se deben de tener en cuenta pues algún tipo de 33 00:06:20,660 --> 00:06:27,680 medida de protección adicional que pueda influir sobre todo en parámetros de coste, en parámetros 34 00:06:27,680 --> 00:06:35,779 de, por ejemplo, tiempo o de velocidad a la hora de la preparación de la muestra o de realizar el método, en fin. 35 00:06:35,899 --> 00:06:42,199 En definitiva, todos estos criterios que, como podéis ver, en comparación con los que tenéis a la izquierda, 36 00:06:42,639 --> 00:06:49,100 pues son de carácter más, digamos, cualitativo. Es más difícil cuantificarlos. 37 00:06:49,319 --> 00:06:54,399 Lógicamente, el coste por muestra o el coste por disponibilidad, si se suele cuantificar, 38 00:06:54,399 --> 00:06:58,180 y muchos laboratorios suelen tener realizados estos estudios de costes. 39 00:06:59,000 --> 00:07:05,680 Entonces, lo que vamos a ver ahora en las siguientes diapositivas es la definición de los criterios de fiabilidad 40 00:07:05,680 --> 00:07:11,339 que, insisto, muchas de ellas las hemos visto a lo largo de la unidad de trabajo número 5 41 00:07:11,339 --> 00:07:21,620 cuando empezamos a hablar de los principales parámetros estadísticos que intervenían en la expresión de los resultados analíticos 42 00:07:21,620 --> 00:07:24,899 cuando hablábamos de incertidumbres, de precisión, de exactitud. 43 00:07:25,379 --> 00:07:29,319 Ahora lo vamos a referir al término del método analítico. 44 00:07:30,000 --> 00:07:39,060 Entonces, tenemos el concepto de exactitud, cuyo principal parámetro hectorístico de medida es el error relativo, 45 00:07:39,060 --> 00:07:41,379 que se expresa en tanto por ciento. 46 00:07:41,379 --> 00:07:54,660 la exactitud lo que a nosotros nos muestra es el nivel de concordancia entre el valor que obtenemos en una medida de una magnitud 47 00:07:54,660 --> 00:08:03,819 y su valor de referencia. Este valor de referencia es el que está aceptado por convenio y el que se considera su valor real. 48 00:08:03,819 --> 00:08:21,819 Por tanto, el valor de referencia no está afectado de ningún tipo de error. Sin embargo, el valor que nosotros hemos obtenido en nuestro resultado analítico se encuentra afectado por la presencia de errores. 49 00:08:21,819 --> 00:08:30,860 errores que pueden ser de origen sistemático o de origen aleatorio. Y una vez que ya hemos 50 00:08:30,860 --> 00:08:37,200 determinado el error relativo, se suele establecer a nivel general, aunque no existe como tal un 51 00:08:37,200 --> 00:08:44,919 consenso, digamos, adoptado por todos, pero se suele tomar como regla de decisión en cuanto a 52 00:08:44,919 --> 00:08:53,379 exactitud un 2% de error relativo como valor aceptado. Pero insisto que no he encontrado en 53 00:08:53,379 --> 00:09:01,759 ninguna bibliografía un digamos un consenso que sea que sea aceptado por todos. Esto normalmente 54 00:09:01,759 --> 00:09:08,379 también los laboratorios lo establecen en sus procedimientos normalizados de trabajo como regla 55 00:09:08,379 --> 00:09:14,860 de decisión. Tal y como vimos, por ejemplo, en la práctica que realizamos el día 25 sobre la 56 00:09:14,860 --> 00:09:22,100 calibración de micropipetas, ahí establecimos una regla de decisión basada en un error máximo 57 00:09:22,100 --> 00:09:28,480 aceptable del 3%. Por eso insisto que este suele ser un valor genérico que se suele tomar en la 58 00:09:28,480 --> 00:09:34,860 inmensa mayoría de los casos, pero a veces el laboratorio, dependiendo del tipo de análisis o 59 00:09:34,860 --> 00:09:40,779 de circunstancias que sean más restrictivas suele fijar ese error en un porcentaje menor o en un 60 00:09:40,779 --> 00:09:49,279 porcentaje mayor. La precisión por su parte está relacionada con el grado de concordancia entre los 61 00:09:49,279 --> 00:09:56,580 resultados de una serie de medidas. Aquí entra en juego lo que se denominan los parámetros de 62 00:09:56,580 --> 00:10:04,799 dispersión. La precisión se encuentra digamos afectada de los errores aleatorios, precisión 63 00:10:04,799 --> 00:10:10,379 también incertidumbre, y los principales parámetros de dispersión con la que se suele 64 00:10:10,379 --> 00:10:15,960 cuantificar. El fundamental de todos y el que más utilizamos nosotros es la desviación 65 00:10:15,960 --> 00:10:21,600 estándar y la desviación estándar relativa. La varianza, recordemos que es la desviación 66 00:10:21,600 --> 00:10:27,519 estándar al cuadrado, también se suele utilizar, pero básicamente desviación estándar y 67 00:10:27,519 --> 00:10:32,039 desviación estándar relativa, que aquí tenéis la fórmula, que también es el coeficiente 68 00:10:32,039 --> 00:10:38,340 de variación son los parámetros de dispersión más usados dentro del ámbito de la validación 69 00:10:38,340 --> 00:10:44,860 de los métodos. El coeficiente de variación porcentual, también denominado desviación 70 00:10:44,860 --> 00:10:50,419 estándar relativa, se suele establecer con un mínimo de 10 réplicas de una muestra 71 00:10:50,419 --> 00:10:56,240 analítica. Una vez que ya tenemos clara la definición de lo que es exactitud y de lo 72 00:10:56,240 --> 00:11:03,340 que es precisión con respecto al concepto de precisión. Es necesario que tengamos clara la 73 00:11:03,340 --> 00:11:11,480 diferencia entre lo que es repetibilidad y lo que es reproducibilidad. La repetibilidad está 74 00:11:11,480 --> 00:11:21,539 referida al grado de dispersión que yo tengo en una serie de réplicas de la misma cantidad. En 75 00:11:21,539 --> 00:11:29,019 este caso, las experiencias o los ensayos los lleva a cabo un mismo analista, un mismo técnico 76 00:11:29,019 --> 00:11:35,820 de laboratorio, el tiempo es relativamente corto, no cambia de instrumento ni de material de 77 00:11:35,820 --> 00:11:41,659 laboratorio y utiliza las mismas disoluciones. Fijaros cuando hablamos de reproducibilidad cómo 78 00:11:41,659 --> 00:11:49,019 cambia el concepto, porque en este caso la dispersión se mide entre series de resultados, 79 00:11:49,019 --> 00:11:55,639 no dentro de una misma cantidad, una serie de medidas o de réplicas. 80 00:11:55,639 --> 00:12:02,600 En el caso de la reproducibilidad, como bien su nombre indica, de reproducir, 81 00:12:02,940 --> 00:12:10,100 estas experiencias se realizan con disoluciones distintas y con material de laboratorio distinto. 82 00:12:10,700 --> 00:12:17,279 Entonces, teniendo en cuenta las diferentes facetas, se puede calcular la reproducibilidad de distintas formas. 83 00:12:17,279 --> 00:12:46,600 Es importante que tengamos en cuenta que la precisión que hace referencia a la dispersión de los resultados no es una garantía de exactitud, pero sí es necesario que las medidas sean lo más precisas posible, es decir, que el nivel de dispersión sea el menor posible para poder conseguir un mayor nivel de exactitud, es decir, poder acotar ese intervalo de confianza del que siempre hemos hablado a la hora de hablar de la expresión de los resultados analíticos. 84 00:12:47,279 --> 00:13:00,539 Continuando con los criterios de validación, llega el turno al concepto de linealidad y del intervalo de linealidad o intervalo de concentración. 85 00:13:00,539 --> 00:13:17,840 Mira, la linealidad es la capacidad que tiene un método para obtener una señal instrumental directamente proporcional a la concentración real o verdadera del analito. 86 00:13:17,840 --> 00:13:23,320 Cuando hablamos de una proporcionalidad directa, estamos hablando de una recta. 87 00:13:23,700 --> 00:13:30,840 Es decir, la relación matemática que existe entre la señal del instrumento y la concentración del analito es una recta. 88 00:13:31,879 --> 00:13:40,460 Entonces, nosotros, para poder establecer este intervalo de linealidad, normalmente a nivel de laboratorio, 89 00:13:40,460 --> 00:13:49,879 lo que se suelen preparar es una serie de muestras patrón que tienen diferentes concentraciones de analito previamente conocidas 90 00:13:49,879 --> 00:13:57,460 y se determina experimentalmente las concentraciones mediante el método que queremos validar. 91 00:13:58,580 --> 00:14:05,379 Representamos gráficamente las señales analíticas frente a los valores de los patrones 92 00:14:05,379 --> 00:14:13,580 Y para hablar de una, digamos, relación directa o de una relación directamente proporcional, 93 00:14:14,220 --> 00:14:16,580 debemos de obtener una recta. 94 00:14:17,019 --> 00:14:23,480 El coeficiente de correlación R, que ya lo vimos en la videoconferencia pasada, 95 00:14:23,899 --> 00:14:26,159 cuando hablamos de las rectas de calibrado, 96 00:14:26,320 --> 00:14:31,179 ese coeficiente de correlación tiene que ser lo más cercano a la unidad. 97 00:14:31,759 --> 00:14:38,179 Generalmente se considera que un método es lineal si tiene un ajuste que es muy bueno, 98 00:14:38,399 --> 00:14:45,779 un ajuste en el cual R es mayor o igual de 0,9990. 99 00:14:45,779 --> 00:14:56,659 El intervalo de linealidad o intervalo de concentración viene determinado por el límite de cuantificación 100 00:14:56,659 --> 00:15:01,820 y por el límite superior de respuesta lineal. 101 00:15:01,820 --> 00:15:07,860 El límite de cuantificación, os recuerdo que lo vimos en la videoconferencia anterior, 102 00:15:08,299 --> 00:15:15,960 el límite de cuantificación es la concentración de analito más pequeña 103 00:15:15,960 --> 00:15:20,620 que se encuentra en una muestra que se puede determinar 104 00:15:20,620 --> 00:15:24,419 con un nivel aceptable de exactitud y de precisión. 105 00:15:24,419 --> 00:15:47,360 El nivel de detección era un nivel más de carácter cualitativo porque nos proporcionaba una concentración mínima donde obteníamos una señal que era aceptable a nivel significativo proporcionada por el aparato, pero no tenía que ser necesariamente cuantificada. 106 00:15:47,360 --> 00:16:01,220 Cuando hablamos de intervalo de linealidad estamos ya hablando de magnitudes que yo voy a cuantificar y entonces entra en juego el límite de cuantificación. Esa sí es la concentración mínima de analito. 107 00:16:01,220 --> 00:16:20,740 Y el límite superior dentro del intervalo de linealidad, ese límite superior, perdonad que lo tenemos aquí, el límite de respuesta lineal es el valor de concentración por encima del cual se pierde ese carácter de linealidad. 108 00:16:20,740 --> 00:16:27,379 Es decir, ya las variables de concentración y señal no se pueden representar mediante una recta. 109 00:16:27,759 --> 00:16:31,480 Tienen un tipo de relación entre sí que no es directamente proporcional. 110 00:16:32,360 --> 00:16:42,759 Entonces, en este intervalo de linealidad es donde se trabaja con un nivel aceptable de exactitud y de precisión. 111 00:16:42,759 --> 00:17:03,240 Este intervalo de linealidad, como veis aquí en esta gráfica, es lo que a mí me permite, sobre todo en el ámbito de las técnicas instrumentales de análisis, poder determinar tres tipos de zonas dentro del propio método analítico. 112 00:17:03,240 --> 00:17:06,680 cuando yo hago la determinación, o sea, la representación gráfica. 113 00:17:07,099 --> 00:17:11,920 Distinguimos la zona muerta, la zona de trabajo y la zona de saturación. 114 00:17:12,339 --> 00:17:18,500 La zona muerta es la que corresponde a concentraciones que son muy bajas 115 00:17:18,500 --> 00:17:23,720 y la respuesta que da el aparato o el instrumento no es una respuesta lineal. 116 00:17:24,180 --> 00:17:27,960 El límite de saturación es justamente el opuesto. 117 00:17:27,960 --> 00:17:40,400 Es decir, la zona de saturación es aquella zona o aquel intervalo en el cual las señales superan el límite superior de respuesta lineal. 118 00:17:40,500 --> 00:17:44,960 Como veis aquí en la gráfica, ya deja de ser una recta. 119 00:17:45,940 --> 00:17:54,099 Ya no podemos decir que entre la señal del instrumento y la concentración del analito exista una relación directamente proporcional. 120 00:17:54,099 --> 00:18:08,299 Luego nuestra zona de trabajo es precisamente la quilla en la que la señal del instrumento y la concentración del analito obedecen a una relación directa. 121 00:18:08,500 --> 00:18:23,480 Como veis aquí la respuesta del aparato es directamente proporcional a la concentración del analito y podemos obtener su ecuación mediante una ecuación de primer grado o una recta que es la famosa recta de calibrado. 122 00:18:23,480 --> 00:18:29,940 El límite inferior es el límite de cuantificación y el límite superior es el límite de respuesta lineal. 123 00:18:30,940 --> 00:18:40,140 A continuación, el siguiente criterio de fiabilidad es el concepto de sensibilidad. 124 00:18:40,700 --> 00:18:46,380 La sensibilidad que tiene un instrumento o la sensibilidad que tiene un método analítico 125 00:18:46,380 --> 00:18:57,940 es la capacidad para poder distinguir o poder discriminar entre pequeñas diferencias en la concentración del analito. 126 00:18:58,480 --> 00:19:10,759 Mirad, en una técnica instrumental la sensibilidad es la relación que existe entre el incremento en la señal del instrumento 127 00:19:10,759 --> 00:19:15,720 y el incremento de la concentración del analito. 128 00:19:16,380 --> 00:19:32,859 A nivel gráfico, la sensibilidad es la pendiente de la recta de calibrado, el parámetro B, que vimos cuando hablamos del ajuste de la recta por mínimos cuadrados. 129 00:19:32,859 --> 00:19:38,900 Luego, cuanto mayor sea la sensibilidad, mayor será la pendiente. 130 00:19:38,900 --> 00:19:58,980 Mira, si volvemos a una diapositiva anterior donde hablamos de la recta de calibrado, vamos a entender un poquito mejor. Mira, aquí tenemos la señal y aquí tenemos la concentración. 131 00:19:58,980 --> 00:20:05,799 el parámetro b la pendiente de la recta de calibrado es una medida cuantitativa de lo que 132 00:20:05,799 --> 00:20:13,500 es la sensibilidad de un método mirar cuanto mayor sea la pendiente es decir mayor sea el ángulo 133 00:20:13,500 --> 00:20:20,019 porque este parámetro b a nivel matemático lo que nos indica es el ángulo que existe entre la 134 00:20:20,019 --> 00:20:26,119 recta de calibrado y el eje horizontal vosotros imaginaros una recta que tenga un ángulo mayor 135 00:20:26,119 --> 00:20:42,420 Una recta que tenga una pendiente mayor. Al tener una pendiente mayor, variaciones pequeñitas en la concentración en el eje X me van a dar unas variaciones grandes en el eje Y. 136 00:20:42,420 --> 00:20:52,079 Es decir, voy a tener una respuesta alta de mi instrumento con variaciones pequeñitas de la concentración de analito. 137 00:20:52,519 --> 00:20:56,880 Eso es lo que me determina a mí la sensibilidad de un método. 138 00:20:57,400 --> 00:21:04,740 Cuanto más plana sea la recta, cuanto menor sea su pendiente, menos sensible será el método. 139 00:21:04,740 --> 00:21:14,200 Es decir, necesitaré variaciones grandes de concentración para obtener una variación en la señal que sea, digamos, apreciable o significativa. 140 00:21:14,359 --> 00:21:23,740 Ese es básicamente el concepto de pendiente de la recta de calibrado y el concepto de sensibilidad de un método o sensibilidad de un instrumento. 141 00:21:26,259 --> 00:21:30,339 Regresando a nuestra diapositiva. 142 00:21:30,640 --> 00:21:32,359 Perdonad que voy un poquito más rápido. 143 00:21:32,359 --> 00:21:58,809 Bien, este es el concepto de sensibilidad. Así que recordad que cuando se os pida en algún problema la sensibilidad de un método, pues una vez que ya hayáis calculado la recta de calibrado, el parámetro B o su pendiente es lo que nos cuantifica a nivel numérico la sensibilidad. 144 00:21:58,809 --> 00:22:15,049 Pero el concepto de sensibilidad es básicamente la relación entre el incremento de la señal, es decir, cuánto me varía la señal en el eje vertical, con respecto a variaciones en el eje horizontal. 145 00:22:15,730 --> 00:22:26,849 Si mi variación en el eje horizontal es pequeña y me da una variación en el eje vertical muy grande, yo tendré mucha sensibilidad en el método y mi pendiente será mayor. 146 00:22:26,849 --> 00:22:34,630 matemáticamente se suele representar por el incremento de y partido por incremento de x 147 00:22:34,630 --> 00:22:39,289 eso es en definitiva la definición matemática de lo que es la pendiente de una recta 148 00:22:39,289 --> 00:22:44,329 entonces continuamos con el concepto de selectividad 149 00:22:44,329 --> 00:22:47,789 ¿cómo de selectivo es un método analítico? 150 00:22:47,789 --> 00:22:52,430 en este caso la selectividad está relacionada con la capacidad que tiene ese método 151 00:22:52,430 --> 00:23:02,630 para poder determinar el analito que yo quiero cuantificar de un modo específico en presencia de otros componentes. 152 00:23:02,849 --> 00:23:14,150 Esos componentes que forman parte de una matriz o de una mezcla compleja que pueden ser sustancias interferentes o pueden ser compuestos similares al analito. 153 00:23:14,150 --> 00:23:30,069 Ese es el concepto de selectividad. La robustez lo que nos describe es la resistencia que ofrece un método analítico cuando se varían ligeramente determinadas condiciones experimentales. 154 00:23:30,069 --> 00:23:37,589 A veces son condiciones de carácter ambiental, condiciones de pH, condiciones de densidad, de temperatura, etc. 155 00:23:38,049 --> 00:23:45,009 Los límites de detección a nivel cualitativo, os lo recuerdo, los límites de cuantificación a nivel cuantitativo, 156 00:23:45,450 --> 00:23:54,910 en lo que respecta a concentraciones mínimas de analito que nos proporcionan una señal en el aparato, una señal instrumental, 157 00:23:54,910 --> 00:24:00,529 ya lo comentamos en las diapositivas anteriores y lo tenéis en la videoconferencia de la semana 158 00:24:00,529 --> 00:24:08,230 pasada. Bien, una vez que ya tenemos claro cuáles son, o sea, qué es lo que realmente se persigue 159 00:24:08,230 --> 00:24:15,869 con la validación de los métodos y la verificación de estos parámetros de fiabilidad, vamos a abordar 160 00:24:15,869 --> 00:24:22,069 una de las partes fundamentales del trabajo en el laboratorio que está relacionada con el 161 00:24:22,069 --> 00:24:27,509 tratamiento de un conjunto de datos o un conjunto de resultados analíticos que son los ensayos de 162 00:24:27,509 --> 00:24:32,750 significación o ensayos de significancia, que también podéis verlo escrito de las dos formas. 163 00:24:33,750 --> 00:24:44,170 Y estas técnicas comparativas son prácticas habituales para validar métodos analíticos 164 00:24:44,170 --> 00:24:51,410 o en la acreditación de los laboratorios. Un ensayo de significación o de contraste de 165 00:24:51,410 --> 00:25:00,750 hipótesis, lo que se trata es de comparar si el valor del parámetro medido, que normalmente suele 166 00:25:00,750 --> 00:25:09,289 ser la concentración de un analito, difiere significativamente, este concepto es el que es 167 00:25:09,289 --> 00:25:15,930 importante tener en cuenta, de un valor que se considera, digamos, como verdadero o un valor de 168 00:25:15,930 --> 00:25:21,250 referencia. Normalmente este valor verdadero suele ser un límite establecido por una normativa, suele 169 00:25:21,250 --> 00:25:27,369 ser, por ejemplo, un material de referencia que está certificado. Entonces, cuando yo voy a comparar 170 00:25:27,369 --> 00:25:34,289 un resultado que yo he obtenido con un valor de referencia, para yo poder establecer esa comparación 171 00:25:34,289 --> 00:25:46,140 y luego tomar una decisión, yo tengo que establecer unas hipótesis. Sobre esas hipótesis yo calcularé 172 00:25:46,140 --> 00:25:54,960 un parámetro estadístico. Ese parámetro estadístico suele ser el parámetro de T de Student, ya os lo adelanto, 173 00:25:54,960 --> 00:26:03,319 o el parámetro de la F de Fisher. Ahora veremos en qué caso se aplica uno u otro. Ese parámetro que yo calculo 174 00:26:03,319 --> 00:26:11,099 lo comparo con un valor que se encuentra tabulado, con un nivel de confianza que ya está establecido. 175 00:26:11,099 --> 00:26:18,039 que os recuerdo que normalmente en los ensayos analíticos estaba en el 95% salvo que el problema 176 00:26:18,039 --> 00:26:25,819 en sí os determine un nivel de confianza superior, ¿de acuerdo? Y entonces una vez que ya he calculado 177 00:26:25,819 --> 00:26:31,200 yo mi parámetro estadístico, tengo mi valor tabulado, establezco la comparación en base a 178 00:26:31,200 --> 00:26:37,420 las hipótesis. ¿Cuáles son las hipótesis o conjeturas que se suelen establecer en estos 179 00:26:37,420 --> 00:26:44,599 ensayos de comparación o de contraste, normalmente son dos tipos de hipótesis. La hipótesis nula, 180 00:26:45,160 --> 00:26:52,819 que se denomina H0 siempre, y la hipótesis alternativa H1. Son hipótesis excluyentes. 181 00:26:53,140 --> 00:26:59,559 ¿Eso qué quiere decir? Una hipótesis, dos hipótesis son excluyentes cuando el rechazar 182 00:26:59,559 --> 00:27:06,220 la hipótesis nula implica la aceptación de la hipótesis alternativa. Eso es el concepto de 183 00:27:06,220 --> 00:27:12,220 excluyente. Es decir, yo voy a fijar en mi ensayo de significación, yo voy a fijar una hipótesis nula, 184 00:27:12,859 --> 00:27:20,200 voy a calcular mi parámetro estadístico, lo voy a comparar con el valor tabulado y en función de 185 00:27:20,200 --> 00:27:25,960 esa comparación yo voy a tomar una decisión. Esa decisión será de aceptación de la hipótesis nula 186 00:27:25,960 --> 00:27:33,779 o si la hipótesis nula se rechaza, se acepta la hipótesis alternativa. Ese es el concepto de lo 187 00:27:33,779 --> 00:27:43,000 que significa hipótesis excluyentes. Entonces, la hipótesis nula establece que los parámetros que 188 00:27:43,000 --> 00:27:51,880 se van a comparar son iguales, siempre. Esto supone aceptar que la diferencia entre los valores que 189 00:27:51,880 --> 00:27:57,819 se comparan no es significativa. Si son iguales, yo no tengo diferencias significativas entre esos 190 00:27:57,819 --> 00:28:06,380 valores. La hipótesis alternativa que se acepta cuando se rechaza la hipótesis nula es lo que me 191 00:28:06,380 --> 00:28:12,420 viene a mí a decir pues que la diferencia entre los valores que se comparan si es significativa 192 00:28:12,420 --> 00:28:19,960 es decir ya no son iguales y quedaros con lo que con lo que acabo de decir si no son iguales puede 193 00:28:19,960 --> 00:28:29,119 ocurrir que sean diferentes, nada más, o mayor o menor. Y a partir de ahí es lo que entramos 194 00:28:29,119 --> 00:28:34,400 nosotros a definir los ensayos de una cola o de dos colas. Vamos a verlo con más calma. 195 00:28:35,859 --> 00:28:46,619 Mirad, la decisión de aceptar o rechazar la hipótesis nula se toma de acuerdo a los 196 00:28:46,619 --> 00:28:56,119 siguientes puntos que tenéis aquí. Si el parámetro estadístico que yo he calculado es menor que el 197 00:28:56,119 --> 00:29:00,920 valor tabulado, el valor tabulado en algunos manuales podéis verlo como valor crítico también. 198 00:29:01,640 --> 00:29:08,480 A mí me gusta llamarlo valor calculado y valor tabulado porque así de esta forma da menos error. 199 00:29:08,599 --> 00:29:13,980 En otros manuales podéis ver el estadístico calculado como estadístico cero y el estadístico 200 00:29:13,980 --> 00:29:20,920 tabulado como estadístico crítico, pero insisto que yo los voy a llamar calculado y tabulado. Si 201 00:29:20,920 --> 00:29:27,779 el estadístico calculado es más pequeño que el tabulado, se acepta la hipótesis nula. La 202 00:29:27,779 --> 00:29:33,759 diferencia entre los parámetros que se comparan no es significativa. Si el valor calculado es 203 00:29:33,759 --> 00:29:41,279 mayor que el tabulado, rechazamos la hipótesis nula y aceptamos la hipótesis alternativa. Es 204 00:29:41,279 --> 00:29:46,640 Es decir, los parámetros que se comparan sí difieren significativamente. 205 00:29:46,839 --> 00:29:54,539 Esto tenéis que tenerlo claro para poder luego establecer y calcular los ensayos de significación. 206 00:29:54,539 --> 00:30:02,619 Es muy importante que tengáis claro cómo establecemos la hipótesis nula, la hipótesis alternativa, 207 00:30:03,319 --> 00:30:05,259 cuándo se acepta y cuándo se rechaza. 208 00:30:06,440 --> 00:30:10,160 ¿Qué tipos de ensayos de significación vamos a estudiar? Existen muchos. 209 00:30:10,160 --> 00:30:28,279 Los más usuales, los que más vais a trabajar suelen ser la comparación de un resultado analítico, es decir, yo tomo una serie de muestras y tengo una serie de resultados, la media de esos resultados la voy a comparar con un valor de referencia. 210 00:30:28,279 --> 00:30:44,660 Ese es un tipo de ensayo. En este caso, como voy a ver la diferencia que existe entre el resultado analítico, mi media del resultado analítico y el valor de referencia, lo que estoy, de alguna manera, comparando es la exactitud. 211 00:30:45,500 --> 00:30:52,759 Segundo método, cuando vamos a comparar dos desviaciones estándar o dos varianzas. 212 00:30:53,279 --> 00:30:59,759 En este caso, como estamos comparando parámetros de dispersión, estamos comparando la precisión. 213 00:31:00,220 --> 00:31:05,700 Y al utilizar dos desviaciones estándar estoy comparando dos métodos analíticos. 214 00:31:05,700 --> 00:31:13,039 Y el tercer caso es cuando voy a comparar dos medias experimentales. 215 00:31:13,039 --> 00:31:22,599 Dos medias experimentales vuelven a ser dos métodos analíticos, pero al trabajar con medias experimentales voy a comparar la exactitud de dos métodos. 216 00:31:23,440 --> 00:31:29,960 Estos son los tres tipos de ensayos que vamos a estudiar, pero insisto que existen varios tipos de ensayos. 217 00:31:30,099 --> 00:31:37,220 Luego se encuentra también el método ANOVA, que es un método que en la actualidad se lleva a cabo mediante programas informáticos, 218 00:31:37,220 --> 00:31:44,519 porque ya vamos a comparar las varianzas de varios métodos analíticos, no nos vamos a mover con dos. 219 00:31:44,519 --> 00:31:55,579 Y se realizan comparaciones intraseries, entre series y es un método largo y tedioso que no lo vamos a ver de forma analítica 220 00:31:55,579 --> 00:32:02,819 porque es larguísimo y en la actualidad se lleva a cabo mediante agua de cálculo o procedimientos informáticos. 221 00:32:03,819 --> 00:32:14,160 Entonces, una vez que tenemos esto claro, os he preparado aquí unos diagramas que creo que lo vais a entender mejor de cómo funcionan los ensayos de significación. 222 00:32:14,819 --> 00:32:19,400 Mirad, ¿cómo vamos a trabajar? Siempre se formulan las hipótesis de trabajo. 223 00:32:19,779 --> 00:32:25,920 En función del enunciado que a mí me van a dar, yo voy a formular mi hipótesis nula y mi hipótesis alternativa. 224 00:32:25,920 --> 00:32:36,099 Una vez que yo he formulado mis hipótesis de trabajo, voy a tener unos datos experimentales y luego tengo unos datos tabulados, unas tablas. 225 00:32:36,640 --> 00:32:45,920 Con los datos experimentales yo voy a calcular un parámetro estadístico, que puede ser un parámetro de exactitud o un parámetro de precisión. 226 00:32:47,480 --> 00:32:51,000 Ahora lo veremos en el diagrama de flujo de la derecha. 227 00:32:51,000 --> 00:32:59,720 Los datos tabulados me permiten calcular ese parámetro estadístico, ya sea exactitud o precisión, crítico o tabulado. 228 00:32:59,720 --> 00:33:15,579 Y una vez que tengo los dos, lo que hago es que los comparo y establezco la decisión de aceptación o rechazo de mi hipótesis de trabajo y saco las conclusiones que son las que me van a afectar a mí a la validación de mi método. 229 00:33:15,579 --> 00:33:26,559 Entonces, una vez que ya sabemos cuál es el procedimiento general, queda perdonar, ¿qué parámetros estadísticos se eligen en cada caso? 230 00:33:26,559 --> 00:33:44,619 Pues, como os he comentado anteriormente, los tres estadísticos que vamos a manejar en estos tres tipos de ensayos son, por una parte, la precisión, que el parámetro estadístico es la F de Fisher y la exactitud, el parámetro estadístico es la T de Student. 231 00:33:44,619 --> 00:33:59,859 Cuando nosotros vamos a, digamos, a comparar la precisión, estamos comparando las varianzas de dos métodos. Os recuerdo que la varianza es la desviación estándar al cuadrado, ¿vale? 232 00:33:59,859 --> 00:34:16,019 Y luego cuando yo estoy comparando la exactitud puedo tener dos tipos de ensayos. O comparo una serie de datos con un valor de referencia o comparo las medias aritméticas de dos series de datos. 233 00:34:16,019 --> 00:34:30,480 En ambos casos utilizaré la T de Student. Tanto el parámetro F de Fisher calculado como el parámetro T de Student calculado yo lo voy a comparar con el dato tabulado correspondiente. 234 00:34:30,480 --> 00:34:50,800 La TED Student ya la conocemos, ya hemos hablado de ella, de una cola y de dos colas y ahora nos quedaría la F de Fisher. Este parámetro también se encuentra tabulado, tiene tablas a una cola y tiene tablas a dos colas y entonces una vez que ya tenemos nuestros datos calculados y nuestros datos tabulados, 235 00:34:50,800 --> 00:35:01,659 lo que hacemos es sacar nuestras conclusiones previa comparación de esos datos y aceptación o rechazo de mis hipótesis. 236 00:35:01,840 --> 00:35:11,059 Esto es básicamente la forma en la que se procede en los ensayos de significación que vamos a ver ahora con ejemplos prácticos. 237 00:35:11,059 --> 00:35:22,380 Entonces, vamos a empezar con el primero de todos donde vamos a comparar un resultado analítico con un valor de referencia. 238 00:35:22,880 --> 00:35:31,679 Este tipo de ensayo se da cuando nosotros tenemos una serie de medidas y tenemos un valor de referencia. 239 00:35:31,840 --> 00:35:43,300 Este valor de referencia, como he hablado anteriormente, puede ser un valor que viene dado por una normativa, un límite legal, un valor indicado en el certificado de un material, etc. 240 00:35:44,059 --> 00:35:47,719 Este valor es el que vamos a considerar como valor de referencia. 241 00:35:47,719 --> 00:35:52,039 Es un valor fijo, no está sujeto a incertidumbre. 242 00:35:52,380 --> 00:35:57,099 Nuestro valor de referencia siempre se suele simbolizar con la letra griega mu. 243 00:35:57,800 --> 00:35:59,619 ¿Cuál es nuestra hipótesis nula? 244 00:36:00,039 --> 00:36:04,079 Hemos dicho que la hipótesis nula, lo hemos comentado aquí anteriormente, 245 00:36:04,860 --> 00:36:09,519 los parámetros que se van a comparar son iguales, siempre. 246 00:36:10,099 --> 00:36:13,380 Luego, en este tipo de ensayo, ¿qué parámetros voy yo a comparar? 247 00:36:13,699 --> 00:36:17,019 Pues voy a comparar mi valor de referencia con qué valor. 248 00:36:17,019 --> 00:36:21,820 Cuando yo tengo una serie de medidas, su valor representativo en términos de exactitudes, 249 00:36:21,820 --> 00:36:29,139 la media aritmética. Pues mi hipótesis nula establece que el valor medio es igual al valor 250 00:36:29,139 --> 00:36:41,039 de referencia. La hipótesis alternativa, como os he puesto aquí, se puede, digamos, formular de dos 251 00:36:41,039 --> 00:36:51,239 maneras. La podemos formular de una forma en la cual el valor medio es distinto del valor de 252 00:36:51,239 --> 00:36:58,420 referencia distinto, pero no digo si es mayor o es menor, solamente digo que es distinto. Son valores 253 00:36:58,420 --> 00:37:04,159 que son significativamente diferentes. En este caso, como yo no estoy acotando ni estoy dando 254 00:37:04,159 --> 00:37:11,019 un sentido en si es mayor o es menor, la T de student que yo voy a utilizar es la de dos colas. 255 00:37:11,780 --> 00:37:17,719 Pero yo puedo formular la hipótesis alternativa estableciendo un sentido, estableciendo una 256 00:37:17,719 --> 00:37:23,579 dirección. Puedo decir que el valor medio es más pequeño que el valor de referencia o puedo decir 257 00:37:23,579 --> 00:37:30,000 que es mayor que el valor de referencia. En este caso yo estaré utilizando la T de student de una 258 00:37:30,000 --> 00:37:39,019 cola y os estaréis preguntando cuándo sé yo si es, digamos, significativamente diferente o cuándo 259 00:37:39,019 --> 00:37:45,119 es mayor o cuándo es menor. Eso me lo va a determinar el enunciado de mi ensayo de significación. Ahora 260 00:37:45,119 --> 00:37:50,360 cuando veamos los ejemplos nos quedará un poco más claro. Entonces, una vez que yo tengo mis 261 00:37:50,360 --> 00:37:57,739 hipótesis establecidas, la hipótesis nula y mi hipótesis alternativa, ya sea de dos colas o de 262 00:37:57,739 --> 00:38:04,940 una cola, el siguiente paso es calcular el parámetro estadístico. En este tipo de ensayos, cuando 263 00:38:04,940 --> 00:38:11,880 comparo un resultado analítico con un valor de referencia, siempre voy a utilizar esta fórmula 264 00:38:11,880 --> 00:38:20,460 de cálculo. Mi parámetro de cálculo se calcula con la diferencia, esto sería el 265 00:38:20,460 --> 00:38:27,440 error absoluto, que existe entre mi media aritmética y mi valor de referencia, la raíz 266 00:38:27,440 --> 00:38:33,380 cuadrada de mi número de datos y la desviación estándar. Aquí tenéis lo que significa 267 00:38:33,380 --> 00:38:43,340 cada variable. Una vez que yo ya he calculado mi parámetro t, sabiendo si voy a utilizar 268 00:38:43,340 --> 00:38:51,300 una cola, o perdonad, dos colas o una cola, calculo mediante la tabla t de student, calculo 269 00:38:51,300 --> 00:38:58,039 el parámetro tabulado y establezco la comparación. El parámetro tabulado, pues necesito saber 270 00:38:58,039 --> 00:39:06,880 si el ensayo es unilateral o es bilateral. Entonces, mirad, cuando hablamos de los intervalos 271 00:39:06,880 --> 00:39:14,599 de confianza, fue la primera vez que os introduje un poco lo que significaba la tabla de TED 272 00:39:14,599 --> 00:39:22,280 Student de una cola o de dos colas, utilizando el nivel de significación alfa. Es verdad 273 00:39:22,280 --> 00:39:29,159 que yo os he subido aquí al aula virtual la tabla de TED Student de dos colas y de una cola. 274 00:39:29,699 --> 00:39:50,519 Se puede calcular, perdonad que la tengo casi al principio, disculpadme que es que no la encuentro, aquí. 275 00:39:50,940 --> 00:39:58,199 Mira, yo puedo utilizar la tabla de TED Student de una cola o bien la de dos colas, 276 00:39:58,199 --> 00:40:11,619 Pero también se puede calcular la TED-STUDEN de una cola utilizando la tabla de dos colas. Se puede calcular también de esa forma. ¿Cómo se calcularía? 277 00:40:11,619 --> 00:40:25,739 Pues la tabla, digamos, el parámetro estadístico a una cola utilizando la tabla de dos colas lo tenéis explicado aquí. 278 00:40:30,019 --> 00:40:42,380 Cuando yo estoy en un ensayo de una cola y utilizo la tabla de dos colas, teniendo en cuenta mi nivel de significación, 279 00:40:42,980 --> 00:40:50,159 lo que tengo que considerar es que el nivel de significación no es el nivel de confianza. 280 00:40:51,119 --> 00:40:57,320 El nivel de confianza suele ser el 95% y el nivel de significación el 5%. 281 00:40:57,320 --> 00:41:01,260 El nivel de significación suele darse con la letra alfa. 282 00:41:01,760 --> 00:41:09,780 Mirad, en un ensayo de dos colas, el nivel de significación alfa yo lo tengo repartido a la derecha y a la izquierda. 283 00:41:10,019 --> 00:41:14,320 Y concentro todos los resultados de mi intervalo de confianza aquí. 284 00:41:15,360 --> 00:41:16,719 Esto sería de dos colas. 285 00:41:16,719 --> 00:41:37,639 Si yo voy a hacer un ensayo de una cola, lo que yo estoy concentrando es mi intervalo de confianza, lo estoy concentrando desde este punto hacia la izquierda o bien desde este punto hacia la derecha, porque yo me puedo encontrar un ensayo de una cola a izquierda o a derecha. 286 00:41:37,639 --> 00:41:57,780 Luego, si yo voy a concentrar el 0,05 en un lado y yo en la de dos colas sé que lo tengo concentrado en dos lados y es a la mitad, pues multiplico alfa por 2 y lo concentro en un lado. 287 00:41:57,780 --> 00:42:13,079 Es verdad que al multiplicarlo por 2 no sé si es a derecha o a izquierda, eso ya lo veré yo con el enunciado del problema, pero si entro en la tabla de dos colas, en lugar de con 0, con 0,5 entraría con 0,1. 288 00:42:13,079 --> 00:42:21,800 Sería la forma de calcular el parámetro de TED-STUDEN de una cola utilizando la tabla de dos colas. 289 00:42:21,800 --> 00:42:47,139 Este tipo de ensayo lo podéis aplicar a situaciones reales, por ejemplo, cuando se os pide que comprobéis si existe un error sistemático o una prueba del sesgo que afecta a la exactitud en una medida experimental que habéis obtenido con un método analítico determinado o en unas condiciones dadas. 290 00:42:47,139 --> 00:42:59,099 Os recuerdo que, no sé si fue en la primera o en la segunda videoconferencia, cuando hablamos de la prueba del sesgo, una forma de calcular la prueba del sesgo era con el intervalo de confianza. 291 00:42:59,539 --> 00:43:05,440 La otra forma de calcularla es mediante un ensayo de significación, que el ensayo de significación es este. 292 00:43:05,980 --> 00:43:15,280 Normalmente, en los problemas, el enunciado se os puede dar pidiéndoos el intervalo de confianza, por tanto, me iría a calcularlo mediante el intervalo de confianza, 293 00:43:15,280 --> 00:43:26,699 O bien, si no os pide intervalo de confianza y os pide si hay error sistemático o prueba del sesgo, aplicaríais el ensayo de significación. Eso se os queda claro en el enunciado del problema. 294 00:43:28,340 --> 00:43:43,360 Entonces, mirad, vuelvo un poquito para atrás para deciros que la parte, esta de, digamos, el intervalo de confianza y el parámetro estadístico lo tenéis aquí. 295 00:43:43,360 --> 00:44:01,039 Y cuando hablamos de la evaluación del error experimental y hablamos de la prueba del sesgo, esta forma de calcularlo, como yo os hice en los problemas resueltos, aplico el método del intervalo cuando os pide el intervalo de confianza. 296 00:44:01,039 --> 00:44:21,579 Otra forma de calcularlo es con el parámetro estadístico y esto es un ensayo de significación, que es el que estamos viendo ahora. Pero que os insisto que en el enunciado del problema se os quedará claro si os pide que determinéis si existe una prueba de sesgo con un intervalo de confianza o aplicando el parámetro estadístico. 297 00:44:21,579 --> 00:44:48,210 Por tanto, imaginaros que tenéis un problema donde os piden que determinéis si existe error sistemático, una forma de preguntar por un ensayo de significación, 298 00:44:48,210 --> 00:44:57,889 que determináis si hay sesgo en una media experimental o os pueden preguntar si se ha sobrepasado o no un límite legal. 299 00:44:57,889 --> 00:45:07,969 Son tres formas de preguntar por este tipo de ensayo de significación, que es básicamente lo que os he puesto aquí, 300 00:45:08,510 --> 00:45:15,829 que son las situaciones reales en las que vosotros tendríais que aplicar este ensayo de significación. 301 00:45:15,829 --> 00:45:28,989 Mirad, en el ejemplo que tenéis aquí resuelto, tenemos que la legislación establece un límite de 50 miligramos por litro para la concentración de nitratos en agua de consumo humano. 302 00:45:29,809 --> 00:45:42,829 Entonces, realizáis un análisis de las muestras obtenidas en cinco puntos distintos de la red de abastecimiento, que arrojan los resultados que tenéis en esta tabla. 303 00:45:42,829 --> 00:45:56,230 Y os pregunto el problema. ¿Existen evidencias de que se haya sobrepasado el límite legal? Mirad que os he puesto sobrepasado con negrita. 304 00:45:56,230 --> 00:46:07,030 Si se ha sobrepasado el límite legal, me está preguntando si los resultados que yo he obtenido son mayores de 50 miligramos. 305 00:46:07,550 --> 00:46:18,849 Si ya me está preguntando que son mayores, ya me está diciendo que mi hipótesis alternativa va en una dirección, va a una cola. 306 00:46:18,849 --> 00:46:35,210 Es decir, yo establecería mi hipótesis nula, como siempre, el valor medio igual al valor de referencia, nuestro valor de referencia son 50, ¿y cuál es mi hipótesis alternativa? Mi valor medio supera al valor de referencia. 307 00:46:35,829 --> 00:46:43,449 Por tanto, como estoy marcando aquí una dirección, estoy diciendo que es mayor, que va en un sentido, el ensayo es a una cola. 308 00:46:44,050 --> 00:46:52,630 Mi tabla de TED Students será de una cola y si no tengo la de una cola y tengo la de dos colas, tengo que multiplicar alfa por dos. 309 00:46:54,050 --> 00:46:58,929 Ese sería el primer aspecto clave que tenemos que tener en cuenta en este problema. 310 00:47:01,329 --> 00:47:02,590 ¿Cuáles son mis datos? 311 00:47:02,590 --> 00:47:14,090 El valor de referencia son 50 y obtengo la media aritmética de los resultados analíticos, bueno, de los resultados que yo he obtenido en mi punto de muestreo. 312 00:47:15,110 --> 00:47:18,989 Calculo la desviación estándar y el valor de la media. 313 00:47:19,710 --> 00:47:22,670 La fórmula de cálculo que yo voy a utilizar es esta. 314 00:47:23,469 --> 00:47:31,849 Insisto que yo en el examen os daré las tablas para que podáis calcular los parámetros estadísticos y os daré las fórmulas. 315 00:47:31,849 --> 00:47:49,809 Pero no os diré qué tipo de fórmula es, es decir, yo os puedo poner esta fórmula con el resto de fórmulas en una hoja aleatoriamente distribuidas, pero vosotros tenéis que identificar en cada problema qué tipo de fórmula es la que se va a poner, es decir, no tenéis que saber las fórmulas de memoria, ¿vale? 316 00:47:49,809 --> 00:47:58,309 Porque la fórmula de los parámetros de la recta de regresión, esta fórmula no es relativamente difícil, pero las que vamos a ver a continuación ya son más complejas. 317 00:47:58,869 --> 00:48:05,909 Entonces, yo os las voy a dar, pero vosotros tenéis que identificar el tipo de ensayo de significación y el tipo de fórmula. 318 00:48:06,269 --> 00:48:14,230 Lógicamente, también la tabla que yo voy a utilizar, si es a una cola, si es a dos colas, si es la T de Student o la F de Fisher, ¿vale? 319 00:48:14,230 --> 00:48:31,369 Entonces, calculo mi parámetro estadístico, aplico la fórmula y sustituyo los valores como veis aquí. Mi número de datos o mi número de muestras son 5, 1, 2, 3, 4 y 5 y la desviación estándar. 320 00:48:31,369 --> 00:48:52,730 Este es mi parámetro de cálculo. Ahora me voy a la tabla de TED-STUDENT de una cola y calculo el parámetro estadístico tabulado. Vamos a hacer la prueba, perdonad, la tabla de TED-STUDENT la teníamos atrás. 321 00:48:52,730 --> 00:49:08,989 Aquí el parámetro sale 2,132. Mirad, seguro que, no sé si alguno de vosotros se está preguntando, el nivel de confianza es 0,95. Como el problema no me dice nada, vuelvo a insistir, sin ánimo de repetirme mucho, 322 00:49:08,989 --> 00:49:34,829 que en caso de que el enunciado del problema o mi procedimiento normalizado de trabajo no me establezca un nivel de confianza 95, 97 o 99%, en casos de técnicas analíticas, que son las que vais a manejar prácticamente en el futuro, vais a considerar el 95%. 323 00:49:34,829 --> 00:49:46,230 Si mi nivel de confianza es 95%, mi alfa, mi nivel de significación es 0,05, es decir, el 5%. 324 00:49:46,230 --> 00:49:54,170 Nos vamos a las tablas de TED-STUDENT que las teníamos aquí al principio y vamos a comprobarlo. 325 00:49:54,469 --> 00:49:56,329 ¿Cuántos datos tengo? Tengo 5. 326 00:49:57,150 --> 00:50:02,369 Esta es de una cola. Como estoy en una cola, me voy al 95 directamente. 327 00:50:03,309 --> 00:50:06,710 ¿Veis? 2,0105. 328 00:50:07,130 --> 00:50:09,449 Vamos a comprobarlo con la de dos colas. 329 00:50:09,449 --> 00:50:11,510 En la de dos colas, ¿yo qué tenía que hacer? 330 00:50:11,789 --> 00:50:20,670 Multiplicar 0,05 por 2, porque tengo aquí el alfa dividido entre la cola izquierda y la derecha. 331 00:50:20,909 --> 00:50:23,710 Al multiplicarlo por 2 me voy a 0,01. 332 00:50:24,150 --> 00:50:28,090 Tendría que hacer mi lectura aquí para un valor de 5. 333 00:50:28,090 --> 00:50:38,949 Mirad, 2,015 que coincide con 2,015 al 95 en una cola y en dos colas, ¿vale? 334 00:50:38,949 --> 00:50:45,349 Hay que tener cuidado con eso en función de la tabla que tengáis, ¿de acuerdo? 335 00:50:45,969 --> 00:50:51,909 Vale, entonces ya tengo mi parámetro tabulado y mi parámetro calculado. 336 00:50:52,090 --> 00:51:02,360 ¿Ahora qué hago? Compararlos, ¿vale? 337 00:51:03,360 --> 00:51:05,079 Entonces, me vengo aquí. 338 00:51:05,599 --> 00:51:17,019 Ah, bueno, disculpadme porque en el parámetro de la T de Student no es 5, es n-1, que son los grados de libertad, 5-1. 339 00:51:17,659 --> 00:51:19,460 ¿Vale? Perdonadme que aquí he cometido yo el error. 340 00:51:19,860 --> 00:51:21,780 Entraría en la T de Student con 4. 341 00:51:22,500 --> 00:51:28,340 ¿Vale? La fórmula de la T de Student la tenemos al principio cuando hablamos de los intervalos de confianza. 342 00:51:28,340 --> 00:51:33,719 entonces el parámetro calculado de la misma forma es 2,132 343 00:51:33,719 --> 00:51:37,239 perdonadme que aquí me he equivocado, es 5 menos 1 344 00:51:37,239 --> 00:51:39,260 me he equivocado yo al entrar en la tabla 345 00:51:39,260 --> 00:51:42,340 entonces, ¿cuál es mi parámetro de cálculo? 346 00:51:42,639 --> 00:51:47,119 mi parámetro de cálculo por esta fórmula es 3,836 347 00:51:47,119 --> 00:51:52,800 que veo que supera al parámetro crítico, el parámetro tabulado 348 00:51:52,800 --> 00:51:56,619 como lo supera, rechazamos la hipótesis nula 349 00:51:56,619 --> 00:52:17,280 Luego, el valor de referencia y mi media no son iguales. Si la rechazo, acepto la hipótesis alternativa que ya la había fijado como mayor que el valor de referencia. Por tanto, al aceptarla, ¿qué concluyo? Concluyo que se supera el límite legal. 350 00:52:17,280 --> 00:52:30,639 Este sería el primer ensayo de significación. El segundo ensayo de significación es cuando vamos a comparar dos desviaciones estándar. 351 00:52:30,639 --> 00:52:42,340 Este tipo de ensayo de significación os lo vais a encontrar cuando queremos saber si un método es más preciso que otro. 352 00:52:42,340 --> 00:52:52,599 En este caso vamos a comparar las desviaciones estándar de los dos métodos o sus varianzas y el parámetro estadístico es el parámetro f de Fischer. 353 00:52:53,179 --> 00:53:07,699 La hipótesis nula la vamos a plantear haciendo las dos varianzas iguales, es decir, las varianzas no son significativamente diferentes. 354 00:53:07,699 --> 00:53:22,380 La hipótesis alternativa, al igual que os he comentado anteriormente, puede ser unilateral. Una de las varianzas es mayor que la otra o menor, depende de lo que me pida el problema, o bilateral. Las dos varianzas son distintas. 355 00:53:23,239 --> 00:53:32,059 Entonces, cuando queremos probar si el método A, por ejemplo, es más preciso que el método B, ¿cómo sería el contraste? 356 00:53:32,059 --> 00:53:38,760 Si estoy diciendo que uno es más preciso que el otro, el contraste es esa una cola. 357 00:53:39,940 --> 00:53:45,219 En este caso, la hipótesis alternativa, ¿cómo sería? 358 00:53:45,219 --> 00:53:55,739 La desviación estándar de A es menor que la de B, porque estoy diciendo que el método A es más preciso que el método B. 359 00:53:55,940 --> 00:54:01,159 Tened cuidado con esto. Si un método es más preciso, su desviación estándar es más pequeña. 360 00:54:03,199 --> 00:54:09,119 Es un poco un galimatía, es un juego de palabras, pero es un poco tenerlo en cuenta a nivel de razonamiento. 361 00:54:09,119 --> 00:54:15,260 entonces cuando yo estoy haciendo el ensayo a una cola 362 00:54:15,260 --> 00:54:17,599 estoy comparando un método con otro 363 00:54:17,599 --> 00:54:20,039 estoy diciendo que es más preciso o menos preciso 364 00:54:20,039 --> 00:54:25,659 voy a utilizar la tabla A3 para buscar la F de Fisher 365 00:54:25,659 --> 00:54:27,500 en este caso mucho más fácil 366 00:54:27,500 --> 00:54:31,139 porque para la F de Fisher hay una tabla para una cola y una tabla para dos colas 367 00:54:31,139 --> 00:54:34,760 si yo lo que quiero probar es 368 00:54:34,760 --> 00:54:37,900 si el método A y B difieren en su precisión 369 00:54:37,900 --> 00:54:40,719 pero yo no quiero saber si uno es más preciso que otro 370 00:54:40,719 --> 00:54:43,500 el contraste como es a dos colas 371 00:54:43,500 --> 00:54:46,880 porque lo que voy a ver es si sus desviaciones estándar 372 00:54:46,880 --> 00:54:48,760 son significativamente diferentes 373 00:54:48,760 --> 00:54:52,000 luego en este caso la hipótesis alternativa 374 00:54:52,000 --> 00:54:54,860 como sería que las desviaciones estándar 375 00:54:54,860 --> 00:54:57,340 son distintas, mayor o menor 376 00:54:57,340 --> 00:54:59,940 no voy a entrar en eso, sencillamente diferentes 377 00:54:59,940 --> 00:55:02,079 el ensayo a dos colas 378 00:55:02,079 --> 00:55:06,440 para calcular el parámetro F utilizo la tabla A4 379 00:55:06,440 --> 00:55:11,519 entonces ahora vamos a ver las tablas 380 00:55:11,519 --> 00:55:15,280 el primer paso en este tipo de ensayos 381 00:55:15,280 --> 00:55:18,480 consiste en calcular el parámetro F 382 00:55:18,480 --> 00:55:20,539 y ¿cómo se calcula? 383 00:55:20,579 --> 00:55:22,920 se calcula utilizando las varianzas 384 00:55:22,920 --> 00:55:25,960 que son objeto de contraste u objeto de comparación 385 00:55:25,960 --> 00:55:29,260 y para ello se supone que las poblaciones 386 00:55:29,260 --> 00:55:31,300 de donde se extraen esas muestras 387 00:55:31,300 --> 00:55:34,199 responden a una distribución normal 388 00:55:34,199 --> 00:55:35,440 a una campana de Gauss 389 00:55:35,440 --> 00:55:50,400 ¿Vale? La f de cálculo siempre es la varianza de un método al cuadrado dividido por la varianza del otro método, pero tener cuidado en una cosa, la f de cálculo siempre tiene que ser mayor que 1, ¿vale? 390 00:55:50,400 --> 00:56:06,920 Es decir, yo he puesto aquí S1 partido por S2, pero no tiene por qué ser siempre así, puede ser S2 partido por S1, eso lo tengo que decidir yo sabiendo que F es mayor que 1 siempre, ¿vale? 391 00:56:06,920 --> 00:56:16,940 Tener cuidado con esto, F siempre es mayor que 1, por eso yo dispondré las varianzas de forma que se cumpla esta condición, ¿de acuerdo? 392 00:56:16,940 --> 00:56:41,059 Luego, el número de grados de libertad del numerador y del denominador se va a calcular como n1-1 y n2-1, siendo n1 y n2 el número de datos que tengo yo en mi método 1 y en mi método 2, para poder operar con las tablas A3 y A4. 393 00:56:42,000 --> 00:56:48,320 Entonces, una vez que yo ya tengo esto claro y calculo mi parámetro F, 394 00:56:49,400 --> 00:56:57,539 si la F de cálculo supera a la F tabulada, rechazo la hipótesis nula y si no la supera, la acepto. 395 00:56:58,360 --> 00:57:03,559 Rechazar la hipótesis nula implica aceptar la hipótesis alternativa. 396 00:57:03,559 --> 00:57:06,500 Si acepto la hipótesis nula, se acepta y ya está. 397 00:57:06,500 --> 00:57:27,059 ¿Vale? Aquí tenéis la tabla A3, veis que es para el contraste de una cola con un 95% de nivel de confianza y aquí tenemos V1 y V2 que son V1 los grados de libertad del numerador, que los leeríamos aquí. 398 00:57:27,059 --> 00:57:41,000 O sea, perdonad, una vez que yo los calcule, que ya sabéis que es n sub 1 menos 1 o n sub 2 menos 1, dependiendo de cómo yo fije esto, teniendo en cuenta de que siempre es mayor que 1, ¿vale? 399 00:57:41,000 --> 00:58:00,980 Una vez que yo he calculado mi grado de libertad del numerador y los del denominador cruzo y en el punto donde se cruzan ese sería mi parámetro tabulado. Mi parámetro tabulado, perdonad, mi parámetro de cálculo se calcularía así y siempre tiene que ser mayor que 1. 400 00:58:00,980 --> 00:58:08,789 Aquí tenéis la tabla para el ensayo de dos colas que funcionan de la misma forma 401 00:58:08,789 --> 00:58:13,150 Bueno, vamos a ver un ejemplo resuelto 402 00:58:13,150 --> 00:58:18,469 Aquí tenéis la comparación de dos desviaciones estándar 403 00:58:18,469 --> 00:58:21,070 Vamos a ver cómo se compara la precisión 404 00:58:21,070 --> 00:58:30,130 Mirad, se desea comparar la precisión que presentan dos métodos de análisis diferentes para determinar fluoruros en agua 405 00:58:30,130 --> 00:58:45,969 Las medidas obtenidas son las que tenéis aquí en esta tabla. Para el método A se han tomado 1, 2, 3, 4, 5, 6 y 7 medidas y para el método B se han tomado 5 medidas. 406 00:58:47,230 --> 00:58:56,809 Mirad lo que nos pregunta el enunciado. ¿Es significativamente diferente la precisión de ambos métodos? 407 00:58:56,809 --> 00:59:16,030 Entonces, ¿cómo es el ensayo? A dos colas, porque no me está diciendo, ¿es el método A más preciso que el método B? ¿Es el método B más preciso que el A? ¿Es la desviación estándar del método A mayor que la del método B? 408 00:59:16,030 --> 00:59:22,849 o viceversa. Estas son distintas formas en las que se os puede preguntar este tipo de ensayos. 409 00:59:22,849 --> 00:59:30,349 En este caso es dos colas. En el momento que yo diga, ¿es la precisión de un método mayor o menor que otro? 410 00:59:30,769 --> 00:59:41,389 Una cola. Entonces establezco mi hipótesis nula y luego el análisis es a dos colas, es bilateral, 411 00:59:41,389 --> 00:59:50,989 la hipótesis alternativa se plantea de esta forma. Calculo mi F de cálculo. Para calcular la F de 412 00:59:50,989 --> 00:59:57,469 cálculo pues tengo que calcular la desviación estándar del método A y la del método B y 413 00:59:57,469 --> 01:00:06,289 disponerlas de forma que sea la F mayor que 1. Aquí tenéis en el método A S1 al cuadrado sale 414 01:00:06,289 --> 01:00:18,510 0,025, S2 al cuadrado sale 0,013. Luego, en este caso, sería S2 partido de S1. Aquí, disculpadme, 415 01:00:18,610 --> 01:00:24,489 he cometido yo un error, no me he dado cuenta. Entonces, como tiene que ser mayor que 1, 416 01:00:24,969 --> 01:00:33,510 4,52 es mayor que 1. Ya tengo mi F de cálculo. Ahora voy a calcular la F tabulada. ¿Cómo es 417 01:00:33,510 --> 01:00:43,010 el ensayo? A dos colas. Pues me voy a la tabla A4, que es el ensayo a dos colas. ¿Qué F 418 01:00:43,010 --> 01:00:49,590 tengo yo en el numerador? El método B. ¿Cuáles son los grados de libertad del numerador? 419 01:00:50,409 --> 01:00:59,670 Pues 1, 2, 3, 4, 5, menos 1, 4. Y en los grados de libertad del numerador, del denominador, 420 01:00:59,670 --> 01:01:13,809 7 menos 1, 6. ¿Vale? ¿Qué es lo que tenéis aquí? Vamos a verlo. Los grados de libertad del denominador son 6 que se cruzan con los de libertad del numerador que son 4. 421 01:01:13,809 --> 01:01:22,909 Pues yo me vengo aquí y tengo en el denominador, que veis aquí que es v2, tengo 6 y los cruzo con 4. 422 01:01:24,809 --> 01:01:30,809 Perdonad, aquí, 6,227. 423 01:01:34,710 --> 01:01:36,210 Aquí tengo mi f tabulada. 424 01:01:36,750 --> 01:01:44,050 Cuando yo establezco la comparación, la f de cálculo es menor que la f tabulada, luego acepto la hipótesis nula. 425 01:01:44,050 --> 01:02:01,000 Al aceptar la hipótesis nula, la precisión de ambos métodos, la precisión de ambos métodos, que la tenemos aquí, mi hipótesis nula, pues no es significativamente diferente, es igual. 426 01:02:01,000 --> 01:02:20,679 Y luego el tercer método que tenemos es la comparación de las medias aritméticas de dos series de datos o de dos métodos distintos. 427 01:02:20,920 --> 01:02:33,940 Este test que me va a evaluar, me evalúa la exactitud entre dos series de datos con un nivel de confianza establecido, normalmente insisto el 95%. 428 01:02:33,940 --> 01:02:38,320 si aparece una diferencia que sea significativa 429 01:02:38,320 --> 01:02:43,679 las dos series de datos corresponden a poblaciones que son diferentes 430 01:02:43,679 --> 01:02:46,860 con valores medios que son diferentes 431 01:02:46,860 --> 01:02:50,579 los resultados de un método analítico nuevo 432 01:02:50,579 --> 01:02:54,639 por ejemplo en este caso lo podemos contrastar 433 01:02:54,639 --> 01:02:58,340 con los resultados que se obtienen con un segundo método 434 01:02:58,340 --> 01:03:00,500 ese segundo método es un método de referencia 435 01:03:00,500 --> 01:03:10,800 Luego, en este caso, yo aplicaría, por ejemplo, este tipo de ensayo de significación, cuando yo voy a comparar un método mío interno con un método de referencia. 436 01:03:12,280 --> 01:03:17,780 Entonces, ¿cuáles son los principales ejemplos? Uno ya os lo he comentado. 437 01:03:18,780 --> 01:03:26,900 Y este ensayo de significación lo podéis aplicar, por ejemplo, cuando vais a comparar los valores obtenidos por el mismo analista 438 01:03:26,900 --> 01:03:33,440 utilizando métodos diferentes sobre la misma muestra sería un caso, el segundo caso cuando 439 01:03:33,440 --> 01:03:40,639 hacéis un estudio de calidad de un determinado técnico y comparáis los valores obtenidos por 440 01:03:40,639 --> 01:03:48,320 dos analistas sobre la misma muestra, empleáis el mismo método y los mismos equipos, estudio de 441 01:03:48,320 --> 01:03:55,440 fiabilidad y constancia de una serie de datos comparando los valores que os da un mismo técnico, 442 01:03:55,440 --> 01:04:02,880 muestra y método, pero en periodos de tiempo diferentes. Estos son los tres casos en los que 443 01:04:02,880 --> 01:04:08,539 se suele aplicar el ensayo de significación, incluso el que os he comentado anteriormente. 444 01:04:08,920 --> 01:04:15,219 ¿Qué es lo que hacemos? ¿Cómo fijamos la hipótesis nula? Pues en este caso lo que hacemos es igualar 445 01:04:15,219 --> 01:04:22,380 las medias muestrales de las dos series de datos, que las puedo obtener en cada una de estas 446 01:04:22,380 --> 01:04:29,739 circunstancias que yo os he comentado anteriormente. Vale, entonces para contrastar la hipótesis nula 447 01:04:29,739 --> 01:04:36,019 el parámetro estadístico de cálculo se calcula mediante esta fórmula. Veis que ya comienza a 448 01:04:36,019 --> 01:04:42,519 tomar un poco más de complejidad y la desviación estándar la vamos a calcular a través de esta 449 01:04:42,519 --> 01:04:50,820 otra fórmula donde n1 y n2 es el número de datos que yo voy a obtener en mi primera serie y en mi 450 01:04:50,820 --> 01:04:58,980 segunda serie. Los grados de libertad que yo voy a utilizar para entrar en la tabla de T de 451 01:04:58,980 --> 01:05:05,199 Student, porque como estoy con el parámetro T y al hacer un ensayo de exactitud voy a trabajar con 452 01:05:05,199 --> 01:05:12,579 la T de Student, el número de grados de libertad es este. Este es el único caso en el que el número 453 01:05:12,579 --> 01:05:19,760 de grados de libertad no es n-1. Este es el único, tenerlo en cuenta. Entonces, una vez que yo he 454 01:05:19,760 --> 01:05:26,719 calculado primero el valor de la S. Lo que quiero aquí hacer es hincapié en una cosa que suele ser 455 01:05:26,719 --> 01:05:33,800 un error que cometéis mucho en los exámenes. Yo esta fórmula me calcula la varianza, es decir, 456 01:05:33,900 --> 01:05:40,280 me calcula la S al cuadrado y yo tengo aquí la S. Tener cuidado porque es muy común con la tensión 457 01:05:40,280 --> 01:05:46,940 del examen y las prisas que el valor que yo tengo de S lo meto aquí y eso está mal. Este valor que 458 01:05:46,940 --> 01:05:52,980 yo obtengo de esta fórmula, tengo que calcularle la raíz cuadrada para calcular la S. Así que 459 01:05:52,980 --> 01:06:00,940 tener cuidado con eso. Una vez que os he hecho este inciso, cuando yo he calculado la T, ¿qué 460 01:06:00,940 --> 01:06:07,440 es lo que hago? Vuelvo a la T de Student. La T de Student, como ya sé si es a una cola o es a dos 461 01:06:07,440 --> 01:06:14,340 colas, ya hemos visto el enunciado cómo puede venir planteado, pues lo que hago es calculo el 462 01:06:14,340 --> 01:06:20,500 valor de la T de Student con el nivel de significación y los grados de libertad que son estos. Tener 463 01:06:20,500 --> 01:06:27,019 cuidado aquí, insisto, que ya no es n-1 como ha pasado anteriormente. En este caso los grados de 464 01:06:27,019 --> 01:06:34,420 libertad se calculan de esta forma. Si yo calculo aquí n-1 vuelvo a meter la pata. n-1 es cuando yo 465 01:06:34,420 --> 01:06:40,360 estoy siempre con una única serie de datos. Cuando yo estoy comparando dos series de datos y estoy 466 01:06:40,360 --> 01:06:46,400 utilizando dos medias distintas en los grados de libertad tengo que tener en cuenta el número 467 01:06:46,400 --> 01:06:54,440 de datos de mi primera serie y de la segunda. Para ello utilizo esta fórmula. Y ahora una vez 468 01:06:54,440 --> 01:07:01,679 que ya tengo mi parámetro calculado y mi parámetro tabulado los comparo. Si es menor el calculado del 469 01:07:01,679 --> 01:07:10,599 tabulado acepto la hipótesis nula, las muestras son estadísticamente iguales, ¿vale? Si es mayor 470 01:07:10,599 --> 01:07:17,500 la rechazo y acepto la hipótesis alternativa, funciona igual. El parámetro tabulado es la T 471 01:07:17,500 --> 01:07:25,659 de Sturden con una o dos colas en función del tipo de ensayo, ¿vale? Y aquí volvemos a tener un ejemplo 472 01:07:25,659 --> 01:07:33,619 lo resuelto. Tenemos dos métodos de análisis a una misma muestra problema. Este es un caso 473 01:07:33,619 --> 01:07:39,420 en el que se puede aplicar este ensayo de significación. Los resultados en tanto por 474 01:07:39,420 --> 01:07:44,440 ciento los tenéis aquí. Aquí tenéis para el método 1. En el método 1 hemos tomado 475 01:07:44,440 --> 01:07:51,719 cuatro réplicas y en el método número 2 hemos tomado tres. Determinar si hay diferencia 476 01:07:51,719 --> 01:08:03,190 de exactitud entre los dos métodos. Luego en este caso el ensayo me voy a adelantar 477 01:08:03,190 --> 01:08:12,409 sería a dos colas porque no me está preguntando si un método es diferente al otro o si la 478 01:08:12,409 --> 01:08:18,189 exactitud de un método es mayor o menor que la del otro. En ese caso sería una cola. 479 01:08:18,189 --> 01:08:26,810 Entonces, cuando yo estoy comparando dos métodos y me pide la exactitud, ¿qué es lo que tengo que calcular? 480 01:08:27,409 --> 01:08:35,670 Tengo que calcular los parámetros estadísticos de la media, la desviación estándar y el número de datos de los dos métodos 481 01:08:35,670 --> 01:08:39,949 que son los datos que yo tengo que introducir en mi fórmula 482 01:08:39,949 --> 01:08:45,329 Luego, ¿cuál es la hipótesis nula? 483 01:08:45,329 --> 01:08:56,050 La hipótesis nula es siempre la misma. Las medias de los dos métodos son iguales y en este caso la hipótesis alternativa son distintas. 484 01:08:56,510 --> 01:08:58,970 Por tanto, el ensayo es a dos colas. 485 01:09:00,369 --> 01:09:10,829 Lo que hacemos es calcular la varianza S al cuadrado de las series 1 y 2 y el parámetro T de cálculo. 486 01:09:10,829 --> 01:09:15,130 Lo que yo he hecho aquí ha sido aplicar esta fórmula. 487 01:09:15,329 --> 01:09:19,399 ¿Vale? Esta fórmula de aquí. 488 01:09:20,279 --> 01:09:31,789 Entonces, ¿veis? He calculado con esta fórmula, se calcula S al cuadrado, este valor de 0,037S al cuadrado. 489 01:09:31,890 --> 01:09:39,630 Luego el valor de S en la raíz cuadrada. Insisto, tener cuidado con esto, que suele ser un error muy común en los exámenes. 490 01:09:40,350 --> 01:09:46,350 Este valor de S es el que meto en mi fórmula de cálculo. 491 01:09:46,350 --> 01:10:00,250 ¿Vale? Como veis, se calcula siempre en valor absoluto. Yo estoy aquí comparando valores absolutos, no me puede dar un valor negativo. Aplico la fórmula de cálculo y obtengo el parámetro de cálculo. 492 01:10:00,250 --> 01:10:18,630 Me voy a la tabla de T de Student de dos colas con un nivel de significación de 0,05 porque el problema no me dice nada, luego mi nivel de confianza es del 95%, pero ojo, con los grados de libertad que se calculan con esta fórmula. 493 01:10:18,630 --> 01:10:23,869 ¿Vale? Entonces sería 4 más 3 menos 2 494 01:10:23,869 --> 01:10:29,510 Y entrando en la tabla de T de Student, que ya sabemos manejarla, obtendría este valor 495 01:10:29,510 --> 01:10:37,470 Como veo que mi valor de cálculo es menor que el valor tabulado, aceptamos la hipótesis nula 496 01:10:37,470 --> 01:10:51,439 Al aceptar la hipótesis nula, no existe diferencia significativa. 497 01:10:51,600 --> 01:10:57,500 Es lo mismo que decir que los valores medios son significativamente iguales. 498 01:10:58,000 --> 01:11:08,020 Los dos métodos son igualmente exactos y proporcionan los mismos valores con el nivel de confianza del 95%. 499 01:11:08,020 --> 01:11:29,550 Vale. Estos son los tres tipos de ensayos más usuales con los que vais a trabajar. Dos de ellos, perdonad, lo que digamos comparan es la exactitud. Por tanto, cuando yo comparo exactitud, mi parámetro estadístico es la T de Student y ahí puedo trabajar a una cola o dos colas. 500 01:11:29,550 --> 01:11:33,649 y cuando comparo precisión estoy comparando valores de dispersión, 501 01:11:33,789 --> 01:11:36,470 luego estoy comparando desviaciones estándar o varianzas 502 01:11:36,470 --> 01:11:39,409 y el parámetro es la f de Fischer, ¿vale? 503 01:11:39,590 --> 01:11:41,470 También a una cola o dos colas. 504 01:11:42,090 --> 01:11:45,989 Hipótesis nula siempre, los parámetros que se comparan son iguales 505 01:11:45,989 --> 01:11:49,390 y mi hipótesis alternativa pueden ser diferentes, 506 01:11:49,770 --> 01:11:53,149 dos colas, mayor o menor, una cola, ¿vale? 507 01:11:54,109 --> 01:11:55,109 A modo de resumen. 508 01:11:55,630 --> 01:11:57,689 El último ensayo de significación, 509 01:11:57,689 --> 01:12:04,869 que también se suele utilizar mucho es el ensayo ANOVA cuando estamos comparando series en las 510 01:12:04,869 --> 01:12:10,510 que intervienen más de dos medias. Bueno, puedo comparar más de dos medias, ya sean referentes 511 01:12:10,510 --> 01:12:17,970 a muchas tomas de muestras o a varios métodos analíticos, etcétera. Algunas de las situaciones 512 01:12:17,970 --> 01:12:24,970 posibles en las que se realiza una ANOVA pueden ser, por ejemplo, cuando comparamos los resultados 513 01:12:24,970 --> 01:12:30,810 que se obtienen entre varios laboratorios cuando se analiza una misma muestra en los ejercicios 514 01:12:30,810 --> 01:12:37,470 de intercomparación, cuando comparamos los resultados que obtiene un laboratorio por más 515 01:12:37,470 --> 01:12:45,149 de dos métodos o por más de dos analistas distintos, o cuando comparamos resultados que se 516 01:12:45,149 --> 01:12:52,329 obtienen cuando se cambian condiciones de trabajo. Por ejemplo, cambiamos temperatura, pH, tiempos y 517 01:12:52,329 --> 01:12:58,529 Y esto nos va a afectar o nos va a, digamos, a permitir decidir cuando aplico un método u otro. 518 01:12:58,710 --> 01:13:03,170 En todos estos casos utilizaremos un ensayo ANOVA. 519 01:13:03,489 --> 01:13:12,270 A ver, como os he comentado antes, desde un punto de vista analítico, este tipo de ensayo es un ensayo muy largo, muy tedioso. 520 01:13:12,810 --> 01:13:18,729 Y desde el punto de vista práctico, ya se suele, en la vida real, se suele realizar o bien con una hoja Excel, 521 01:13:18,729 --> 01:13:23,729 o bien también mediante software de software de cálculo. 522 01:13:24,590 --> 01:13:33,189 En la hipótesis nula de un ensayo ANOVA, se establece que las poblaciones que se comparan tienen las mismas medias. 523 01:13:33,310 --> 01:13:37,590 Lo que pasa es que yo no voy a comparar dos medias, yo puedo comparar varias medias. 524 01:13:37,989 --> 01:13:43,510 Cuantas más medias compare, más complejo, lógicamente, es el ensayo. 525 01:13:43,510 --> 01:14:05,810 ¿Vale? Entonces, hasta aquí la parte de los ensayos de significación. Os he subido al aula virtual en los ejercicios para practicar. Tenéis subidos los ensayos de significación donde vais a trabajar con estos tres tipos de ensayos que hemos visto, 526 01:14:05,810 --> 01:14:14,930 ya sea la comparación de un valor con un valor de referencia, la precisión de dos métodos o la exactitud de dos métodos 527 01:14:14,930 --> 01:14:21,090 y también os he metido el discriminar un valor anómalo utilizando la Q de Dixon. 528 01:14:21,710 --> 01:14:26,710 Para que también os manejéis con ella que normalmente es siempre el ensayo que más se utiliza. 529 01:14:27,170 --> 01:14:32,850 Vimos que había el Q de Dixon, la R de groups y luego los ensayos basados en el método del intervalo 530 01:14:32,850 --> 01:14:38,369 pero el que más vais a utilizar suele ser el de la Q de Dixon, que es el menos preciso, pero es el que más se utiliza. 531 01:14:38,970 --> 01:14:46,649 Y tenéis también la solución. La solución la tenéis explicada y desarrollada aquí en este PDF. 532 01:14:47,829 --> 01:14:54,670 Entonces, no me voy a detener mucho. Fijaros que os he puesto con negrita el planteamiento de las hipótesis 533 01:14:54,670 --> 01:15:00,930 y también cuando el ensayo es a una cola o es a dos colas, fijaros en lo que os he marcado con negrita 534 01:15:00,930 --> 01:15:07,890 para que podáis deducir vosotros la hipótesis alternativa y si es a una o dos colas, ¿vale? 535 01:15:07,909 --> 01:15:14,090 Yo en el examen no lo voy a marcar en negrita, pero normalmente los enunciados van a ser siempre similares, 536 01:15:14,090 --> 01:15:20,289 siempre se van a mover así, ¿vale? Aquí lo tenéis completamente detallado y entonces, pues bueno, 537 01:15:20,409 --> 01:15:27,270 yo lo que os aconsejo es que intentéis resolverlo con las explicaciones que os he dado por vuestra cuenta 538 01:15:27,270 --> 01:15:30,250 y luego lo comparáis con las soluciones. 539 01:15:30,409 --> 01:15:33,689 Si tenéis algún tipo de duda, escribidme, ¿vale? 540 01:15:33,729 --> 01:15:37,710 Pero es prácticamente una repetición de lo que os he explicado 541 01:15:37,710 --> 01:15:40,489 con los tres tipos de ensayo y los ejemplos resueltos. 542 01:15:41,350 --> 01:15:42,289 Bien, cierro aquí. 543 01:15:43,210 --> 01:15:47,010 Y también quería comentaros, perdonad, me salgo de aquí. 544 01:15:48,510 --> 01:15:49,670 Me voy para atrás. 545 01:15:49,670 --> 01:15:54,779 Que los ensayos de significación 546 01:15:54,779 --> 01:16:00,079 también se pueden resolver con la hoja Excel. 547 01:16:00,079 --> 01:16:07,960 Os he puesto también, aquí tenéis un ejemplo práctico resuelto, 548 01:16:08,399 --> 01:16:13,659 el mismo que hemos comentado en la diapositiva de los nitratos, 549 01:16:15,500 --> 01:16:23,359 pues os he puesto aquí explicado cómo vais a ir calculando los distintos parámetros. 550 01:16:23,359 --> 01:16:37,779 Voy a abrir la hoja Excel. Como ya me he detenido antes en las videoconferencias anteriores para meteros las fórmulas y cómo se calculan las fórmulas estadísticas con la hoja Excel, aquí no me voy a detener tanto. 551 01:16:37,779 --> 01:17:03,680 Esto lo pongo un poco por si alguno de vosotros queréis un poco profundizar en el manejo de la hoja Excel. El examen no va a ser en el aula de informática. Yo no os voy a preguntar por los parámetros o por las funciones estadísticas en la hoja de cálculo, pero como ya prácticamente todo se resuelve a nivel informático, no vais a utilizar los métodos analíticos con calculadora ya prácticamente en ningún sitio, 552 01:17:03,680 --> 01:17:13,460 pues me ha parecido interesante subiros estas hojas de estos ejercicios resueltos para que os vayáis familiarizando con la hoja Excel. 553 01:17:13,960 --> 01:17:22,680 Entonces voy a abrir el LibreOffice para que veáis un poquito por encima cómo se calcula. 554 01:17:46,449 --> 01:17:55,489 Bien, entonces aquí tenéis resuelta en este mismo archivo, tenéis la comparación de una serie de medidas con un valor de referencia 555 01:17:55,489 --> 01:18:06,109 que es el ejemplo que hemos visto con los nitratos, la comparación de dos desviaciones estándar y la comparación de dos medias aritméticas. 556 01:18:06,350 --> 01:18:13,270 Son los tres mismos ejemplos que os he explicado en la diapositiva, los tenéis aquí resueltos con la hoja Excel. 557 01:18:13,750 --> 01:18:22,310 Entonces veis que el valor de referencia es 50, la media aritmética, veis aquí la función promedio, no me voy a detener mucho, 558 01:18:22,310 --> 01:18:42,029 La desviación estándar se calcula con su fórmula, el número de datos que yo tengo son 5, mi nivel de significación es 0,05, porque yo cuando voy a calcular la T de Student con la función que tiene la hoja de cálculos trabajo con alfa, no trabajo con 0,95. 559 01:18:42,029 --> 01:18:59,750 La T de cálculo, aquí he aplicado yo la fórmula que tenéis en la diapositiva, es decir, la T de cálculo se calcula con esta formulita que tenéis aquí. 560 01:19:04,039 --> 01:19:14,340 Esta formulita es la que yo he aplicado aquí, pero claro, lógicamente pinchando cada valor en su celda correspondiente. 561 01:19:15,319 --> 01:19:27,939 Y la T tabulada, veis que la calcula la hoja Excel con la fórmula distri.t.inv y fijaros aquí. 562 01:19:29,399 --> 01:19:34,979 La hoja Excel tiene metida la tabla de T de student de dos colas, no tiene la de una cola. 563 01:19:35,579 --> 01:19:41,079 Luego, si algún día tenéis que hacer este tipo de ensayo con la hoja Excel y estáis en el ensayo de una cola, 564 01:19:41,079 --> 01:19:43,220 tenéis que multiplicar alfa 565 01:19:43,220 --> 01:19:44,859 que está en la E5 566 01:19:44,859 --> 01:19:46,340 tenéis que multiplicarlo por 2 567 01:19:46,340 --> 01:19:48,119 así que tener cuidado con esto 568 01:19:48,119 --> 01:19:49,720 porque para hacerlo con la hoja Excel 569 01:19:49,720 --> 01:19:53,460 si tenéis que utilizar 570 01:19:53,460 --> 01:19:54,439 lo que os he explicado 571 01:19:54,439 --> 01:19:56,319 de multiplicar alfa por 2 572 01:19:56,319 --> 01:19:58,680 si estamos en un método analítico 573 01:19:58,680 --> 01:19:59,560 con lápiz y papel 574 01:19:59,560 --> 01:20:01,100 y yo os doy la tabla de una cola 575 01:20:01,100 --> 01:20:01,779 y de dos colas 576 01:20:01,779 --> 01:20:02,520 pues ya sabéis 577 01:20:02,520 --> 01:20:04,819 en función de que estéis en un caso o en otro 578 01:20:04,819 --> 01:20:06,439 utilizaréis una o la otra 579 01:20:06,439 --> 01:20:08,079 pero en la hoja Excel no 580 01:20:08,079 --> 01:20:10,640 entonces una vez que lo habéis calculado 581 01:20:10,640 --> 01:20:19,039 hacéis la comparación y establecéis la conclusión, ¿vale? Con la f de Fisher, pues pasa lo mismo. 582 01:20:19,500 --> 01:20:26,399 La f de cálculo se calcula, pues básicamente con las dos varianzas, siempre y cuando sea mayor que 1, 583 01:20:26,840 --> 01:20:38,020 aquí veis que la i3 es esta y la i2 es la de arriba, entonces mi f de cálculo es i3 partido por i2 584 01:20:38,020 --> 01:20:46,460 para que salga mayor que 1 y la f tabulada se calcula con la hoja excel mediante esta fórmula 585 01:20:46,460 --> 01:21:04,340 distri.f.inv y se pone la b7, b7 es el nivel de significación y luego vamos a poner b7 partido 586 01:21:04,340 --> 01:21:13,909 de 2, porque en este caso es partido de 2. En este caso hemos hecho la inversa de lo 587 01:21:13,909 --> 01:21:22,989 que habíamos hecho aquí multiplicando alfa por 2 para transformarla de dos colas a una 588 01:21:22,989 --> 01:21:31,029 cola. Con la f de Fisher nos pasa lo mismo. En este caso la f tabulada la estoy dividiendo 589 01:21:31,029 --> 01:21:38,350 por dos, la estoy pasando a dos colas. Tener cuidado con esto si lo vais a 590 01:21:38,350 --> 01:21:45,609 hacer con la aguja excel, veis que os he puesto aquí la fórmula j3 y j2 son los 591 01:21:45,609 --> 01:21:53,829 grados de libertad que los tenéis puestos aquí y la comparación de dos 592 01:21:53,829 --> 01:22:00,189 medias aritméticas pues se hace, os he puesto aquí las fórmulas para poder ir 593 01:22:00,189 --> 01:22:05,630 las poniendo en la hoja excel por ejemplo aquí tenéis el parámetro de 594 01:22:05,630 --> 01:22:10,310 cálculo veis esta fórmula se corresponde con esta tenéis que tener 595 01:22:10,310 --> 01:22:14,970 cuidado cuando manejáis la hoja excel de poner los paréntesis en el sitio 596 01:22:14,970 --> 01:22:19,850 correcto porque de lo contrario puede interpretar la jerarquía de la 597 01:22:19,850 --> 01:22:24,010 operación matemática mal vale esta es una de las cosas un poquito que tenéis 598 01:22:24,010 --> 01:22:28,750 que tener en cuenta cuando utilizáis la hoja excel el parámetro de cálculo el 599 01:22:28,750 --> 01:22:43,130 El tabulado se calcula con la distribución inversa, en este caso estamos a dos colas, número de colas dos, aquí tenéis las hipótesis, y luego nivel de significación, grados de libertad y establecemos la comparación. 600 01:22:43,510 --> 01:22:50,149 He creado esta tabla y aquí el valor medio, desviación estándar con sus fórmulas y los números de datos. 601 01:22:50,149 --> 01:23:12,350 Lo único que he hecho ha sido en la hoja Excel seguir la misma explicación que en la diapositiva, pero que no obstante aquí la tenéis explicada en la hoja que os he subido en el PDF para que intentéis vosotros realizar el cálculo en la hoja Excel. 602 01:23:12,350 --> 01:23:30,550 Lo tenéis paso a paso. No me voy a detener mucho porque ya son las seis y media y vamos a dejarlo aquí. Se me ha hecho un poco larga la videoconferencia porque lo que nos queda por ver es la parte de los gráficos de control. 603 01:23:30,550 --> 01:23:40,750 el gráfico de SheWorks, que es el que más se utiliza, y ya un poquito comentar cómo vais a trabajar en el mundo real 604 01:23:40,750 --> 01:23:46,989 con todo el manejo de información que conlleva los sistemas de gestión de calidad, que es el sistema LIMS, 605 01:23:47,050 --> 01:23:52,010 lo que pasa es que no sé si el sistema LIMS en los laboratorios, si alguno de vosotros estáis trabajando, 606 01:23:52,510 --> 01:23:59,470 lo tiene implementado o seguís con registros manuales o no, y ya con eso terminaríamos. 607 01:23:59,470 --> 01:24:19,869 Entonces, yo la semana que viene acabo el tema 5, quería haberlo acabado hoy, pero me he entretenido un poco más de la cuenta y os habilitaré el test de repaso del tema 5 y ya voy a habilitaros todos los tests de todas las unidades para que lo utilicéis para practicar. 608 01:24:19,869 --> 01:24:38,010 Yo hasta ahora he hecho un seguimiento de aquellas personas que han ido siguiendo la videoconferencia de forma habitual, pero yo ya a partir de ahora os voy a abrir los textos para que practiquéis a medida que ya vais estudiando y las siguientes sesiones van a ser para resolver dudas. 609 01:24:38,010 --> 01:24:48,970 Entonces es ya lo único que me queda por explicar. Os voy a detener la videoconferencia.