1 00:00:01,070 --> 00:00:22,809 Buenas tardes. Comenzamos la videoconferencia de hoy repasando la última parte que vimos en la videoconferencia de la semana pasada, correspondiente a la propagación de incertidumbres y a los ejercicios que os he subido al aula virtual que se encuentran resueltos. 2 00:00:22,809 --> 00:00:29,850 que tenéis tanto los enunciados como las soluciones. Bien, un breve inciso referente a la propagación de 3 00:00:29,850 --> 00:00:36,630 incertidumbres, pues bueno, ya vimos que la incertidumbre está relacionada con todo el proceso 4 00:00:36,630 --> 00:00:43,270 de medida y en dicho proceso de medida intervienen los instrumentos de medición. Todo este tipo de 5 00:00:43,270 --> 00:00:51,390 instrumental que veis aquí, ya sean balanzas, buretas, pipetas, termómetros, todos ellos están 6 00:00:51,390 --> 00:01:00,090 caracterizados por una sensibilidad y una precisión. Es decir, a mayor sensibilidad, más preciso será 7 00:01:00,090 --> 00:01:06,090 el instrumento. Luego, por tanto, cuando nosotros, a medida que hacemos las operaciones en el 8 00:01:06,090 --> 00:01:14,230 laboratorio y luego trasladamos esas operaciones a una serie de cálculos matemáticos, igualmente 9 00:01:14,230 --> 00:01:20,829 tenemos que tener en cuenta esa sensibilidad y esa precisión en los cálculos. La propagación de 10 00:01:20,829 --> 00:01:26,989 nuestras incertidumbres se va a realizar no sólo a medida que nosotros vamos realizando una operación 11 00:01:26,989 --> 00:01:33,010 a continuación de la otra, sino que también la vamos a propagar de manera matemática o analítica 12 00:01:33,010 --> 00:01:40,310 cuando vamos realizando nuestros cálculos. De esta forma, cuando vamos a realizar las operaciones con 13 00:01:40,310 --> 00:01:49,030 nuestros datos experimentales y vamos a estimar la propagación y la incertidumbres, nuestro resultado 14 00:01:49,030 --> 00:01:58,109 final, no puede exceder de la precisión que está referida al instrumento de medición que se ha 15 00:01:58,109 --> 00:02:06,590 utilizado en ese cálculo experimental. Es decir, si nosotros hemos realizado una operación de pesada, 16 00:02:07,569 --> 00:02:14,389 por ejemplo, la diferencia del peso después en un filtro. Imaginaros, por ejemplo, que hemos 17 00:02:14,389 --> 00:02:20,509 realizado una toma de muestra de aire en un filtro y hemos realizado la pesada del filtro antes y 18 00:02:20,509 --> 00:02:26,409 después de realizar el ensayo pues lógicamente cuando nosotros demos el resultado final que va 19 00:02:26,409 --> 00:02:32,729 a ser la diferencia entre el peso final del filtro y el peso inicial nosotros ese resultado final lo 20 00:02:32,729 --> 00:02:39,729 vamos a acompañar de una incertidumbre pues esa incertidumbre tiene que tener el mismo número de 21 00:02:39,729 --> 00:02:45,310 cifras significativas que tiene la precisión del aparato. Es decir, como veis en el ejemplo 22 00:02:45,310 --> 00:02:54,330 de la diapositiva, no tiene sentido que yo dé un resultado de 0,0234234 gramos cuando 23 00:02:54,330 --> 00:03:03,169 la precisión de mi balanza llega hasta, por ejemplo, los miligramos. A eso es a lo que 24 00:03:03,169 --> 00:03:11,210 se refiere con la, digamos, incertidumbre en el resultado final. Entonces, lo que tenemos que 25 00:03:11,210 --> 00:03:17,629 tener en cuenta es que todos los errores sean aleatorios o sistemáticos a medida que se van 26 00:03:17,629 --> 00:03:24,270 a ir propagando en las operaciones que yo realice en el laboratorio, también los voy a ir arrastrando 27 00:03:24,270 --> 00:03:31,810 en mis operaciones matemáticas y tenemos que tenerlos en cuenta a la hora de realizar dichos 28 00:03:31,810 --> 00:03:38,389 cálculos. Para ello, lo que se van a seguir son una serie de reglas como las que tenéis 29 00:03:38,389 --> 00:03:46,210 precisamente en esta tabla. Es decir, aquí vemos que para sumas o restas nosotros siempre 30 00:03:46,210 --> 00:03:54,009 en nuestro resultado final de nuestro problema se va a dar como una cifra que corresponde 31 00:03:54,009 --> 00:04:00,389 al resultado de la operación matemática, ya sea una resta, una suma, por ejemplo una 32 00:04:00,389 --> 00:04:07,710 división, si estoy calculando una concentración, que va a ir acompañada de la incertidumbre del 33 00:04:07,710 --> 00:04:15,370 resultado final. Y en esta incertidumbre es donde yo voy a tener en cuenta esta fórmula o bien esta 34 00:04:15,370 --> 00:04:24,350 otra en función de que mi operación matemática sea suma o resta o bien multiplicación y o división. 35 00:04:24,350 --> 00:04:44,129 Aquí tenemos un ejemplo resuelto en el cual se realiza una valoración en el laboratorio y se efectúa una lectura inicial de la bureta donde nos marca 3,51 mililitros y una lectura final de 15,67 mililitros. 36 00:04:44,129 --> 00:04:53,410 Y ambas lecturas tienen una desviación estándar o una incertidumbre de 0,02 mililitros. 37 00:04:53,769 --> 00:05:01,050 Nos pregunta cuál es el volumen devalorante utilizado y la desviación estándar de la medición. 38 00:05:01,689 --> 00:05:09,050 Bien, el volumen utilizado se resuelve mediante una resta entre el volumen final menos el volumen inicial. 39 00:05:09,470 --> 00:05:13,209 Luego tenemos un resultado de 12,16 mililitros. 40 00:05:13,209 --> 00:05:33,430 Nuestra operación matemática que hemos realizado en este cálculo es la correspondiente a una resta. Luego la incertidumbre que vamos a utilizar para calcular la incertidumbre del resultado corresponde a esta expresión que veis aquí. 41 00:05:33,430 --> 00:05:58,730 En una suma y o resta la incertidumbre del resultado es la raíz cuadrada, cuando yo elevo un número a un medio es lo mismo que una raíz cuadrada, de la suma al cuadrado de las distintas incertidumbres que acompañan a cada uno de los elementos o a cada uno de los sumandos de mi operación principal. 42 00:05:58,730 --> 00:06:13,949 Luego en el ejemplo que estamos viendo la desviación estándar del resultado va a ser igual a la raíz cuadrada de la suma de los cuadrados de las distintas desviaciones estándar. 43 00:06:13,949 --> 00:06:33,209 Como aquí estamos utilizando únicamente un labureta como único instrumento de medida, la desviación estándar es la misma, pero afecta a las dos lecturas, es decir, afecta a la lectura de 15,67 más la lectura de 3,51. 44 00:06:33,209 --> 00:06:44,750 De ahí que la desviación estándar o incertidumbre del resultado se calcule como la raíz cuadrada de la suma al cuadrado de las distintas incertidumbres. 45 00:06:45,509 --> 00:07:00,449 Aquí vemos una cosa que tenemos que tener en cuenta cuando nos enfrentamos a este tipo de problemas y es que tanto la unidad de medida, la medida principal como de la desviación estándar son concordantes. 46 00:07:00,449 --> 00:07:13,410 Tengo mis lecturas en mililitros y la desviación estándar viene dada en mililitros. Es importante que las unidades siempre sean concordantes cuando yo aplico la fórmula. 47 00:07:13,410 --> 00:07:20,290 Por tanto, vemos que la desviación estándar, el resultado es 0,028. 48 00:07:21,449 --> 00:07:29,290 Como la desviación estándar que viene dada de las, digamos, lecturas originales, 49 00:07:29,790 --> 00:07:35,870 viene dada con una cifra significativa, pero el nivel de apreciación es las centésimas, 50 00:07:35,870 --> 00:07:44,889 vamos a redondear nuestra desviación estándar con una cifra significativa y a las centésimas. 51 00:07:45,470 --> 00:07:54,529 Luego, por tanto, nuestro resultado final será 12,20, estamos redondeando, más menos 0,03. 52 00:07:56,269 --> 00:08:01,490 Vemos aquí que la última cifra significativa en el valor de una magnitud física 53 00:08:01,490 --> 00:08:06,970 y en su error o incertidumbre debe de corresponder al mismo orden de magnitud. 54 00:08:06,970 --> 00:08:19,970 Si la incertidumbre está dada en las centésimas, el redondeo en el resultado final en cuanto a cifra significativa debe de ser también en las centésimas 55 00:08:19,970 --> 00:08:32,590 Y aquí vemos que concuerdan, en este sentido, tanto el resultado de la medida como el resultado de la incertidumbre. 56 00:08:32,590 --> 00:08:50,970 ¿Vale? Bueno, antes de pasar a la siguiente diapositiva, en los ejercicios para practicar del aula virtual os subí unos problemas de propagación de incertidumbres, tanto los enunciados como la solución. 57 00:08:50,970 --> 00:09:10,909 Bien, entonces analizando los problemas que tenemos resueltos tenemos en el problema número 9 que tenemos. En el primero vamos a realizar la pesada de un precipitado por diferencia, luego nosotros ya sabemos que nuestra operación matemática principal va a ser una resta. 58 00:09:10,909 --> 00:09:25,490 Tenemos que expresar el resultado de la masa del precipitado y la incertidumbre asociada a ese resultado si la desviación estándar de las pesadas que proporciona la balanza es 0,2 miligramos. 59 00:09:26,370 --> 00:09:34,549 Entonces, tenemos el peso de la cápsula con el precipitado dado en gramos, es la cifra que tenéis aquí. 60 00:09:34,549 --> 00:09:46,370 La incertidumbre de la balanza, si yo tengo el peso del precipitado en gramos, voy a expresar la incertidumbre en la misma unidad. 61 00:09:46,850 --> 00:09:53,049 Aquí en el enunciado la tenéis dada en miligramos, nosotros la vamos a expresar en gramos. 62 00:09:53,190 --> 00:10:00,149 La incertidumbre en gramos es la que tenéis aquí, 0,0002 gramos. 63 00:10:00,149 --> 00:10:07,029 Tenemos una cifra significativa en la posición de las diez milésimas. 64 00:10:07,429 --> 00:10:14,129 El peso de la cápsula sin el precipitado sería el que tenéis dado aquí en el problema 65 00:10:14,129 --> 00:10:20,889 y su incertidumbre asociada a ese peso vuelve a ser la misma porque estamos utilizando el mismo aparato. 66 00:10:20,889 --> 00:10:49,429 Luego por una parte vamos a calcular el resultado del peso del precipitado que es el peso final menos el peso inicial, luego realizamos la diferencia y la desviación estándar del resultado como hemos visto anteriormente al tratarse de una resta en la operación matemática nosotros vamos a calcular la incertidumbre aplicando esta fórmula. 67 00:10:49,429 --> 00:11:04,730 Es decir, la desviación estándar del resultado, su incertidumbre, será la raíz cuadrada de las incertidumbres asociadas a cada pesada al cuadrado. 68 00:11:04,730 --> 00:11:11,429 Siguiendo con las reglas del redondeo y el número de cifras significativas 69 00:11:11,429 --> 00:11:19,929 La incertidumbre del resultado tiene una cifra significativa en la posición de las diez milésimas 70 00:11:19,929 --> 00:11:31,610 Por tanto el resultado final vendrá dado como 0,5709 más menos 0,0003 71 00:11:31,610 --> 00:11:49,870 En el siguiente problema vamos a tener que calcular la concentración expresada en normalidad y la incertidumbre asociada a esa concentración de una disolución patrón que se ha preparado de la siguiente manera. 72 00:11:49,870 --> 00:12:10,870 Vamos a disolver 4,8496 más menos 0,1 miligramos de dicromato potásico, con este peso equivalente, que se disuelve en 250 más menos 0,5 mililitros de agua desionizada. 73 00:12:12,330 --> 00:12:15,909 No se considera el peso del error equivalente. 74 00:12:16,330 --> 00:12:18,529 Bien, vamos a ver qué quiere decir esto. 75 00:12:18,529 --> 00:12:25,929 cuando nosotros vamos a calcular la normalidad en el caso que nos describe el problema, las 76 00:12:25,929 --> 00:12:32,750 principales fuentes de incertidumbre que nos vamos a encontrar son, por una parte, la incertidumbre 77 00:12:32,750 --> 00:12:39,629 que va asociada a la operación de la pesada de la sustancia, donde nosotros vamos a pesar una 78 00:12:39,629 --> 00:12:46,169 determinada cantidad de dicromato potásico y vamos a utilizar una balanza. Una balanza cuya 79 00:12:46,169 --> 00:12:55,950 precisión es 0,1 miligramo. Como nosotros estamos trabajando en gramos, en lo que respecta a mi 80 00:12:55,950 --> 00:13:02,649 cantidad de sustancia a pesar, la incertidumbre transformada en gramos es la que tenéis reflejada 81 00:13:02,649 --> 00:13:08,610 aquí en el problema. En la siguiente fuente de incertidumbre, en la siguiente operación que 82 00:13:08,610 --> 00:13:16,149 nosotros hacemos después de pesar la masa de dicromato potásico que necesitamos es disolverla 83 00:13:16,149 --> 00:13:26,590 en una determinada cantidad de agua, enrasar a 250 mililitros. Luego, la siguiente fuente de 84 00:13:26,590 --> 00:13:36,049 incertidumbre es el enrase del matraz aforado. El matraz tiene una incertidumbre de 0,5 mililitros. 85 00:13:36,049 --> 00:13:47,409 ¿A qué significa o qué quiere decir que no se considera el error del peso equivalente? Que esa sería otra fuente de incertidumbre asociada. 86 00:13:47,409 --> 00:14:00,210 El peso equivalente está relacionado, como ya habéis estudiado en otros módulos como análisis químico, con los pesos atómicos de los determinados elementos que forman parte de ese compuesto químico. 87 00:14:00,210 --> 00:14:19,230 Cada uno de esos pesos atómicos lleva asociada una incertidumbre. Las incertidumbres asociadas a los pesos atómicos son anualmente revisadas o periódicamente, disculpadme, por la IUPAC y además dichas revisiones se van publicando con la periodicidad en la que se revisan. 88 00:14:19,230 --> 00:14:28,409 En este caso el propio problema nos dice que no se van a considerar el error del peso equivalente, a eso es a lo que se refiere. 89 00:14:28,830 --> 00:14:38,730 En caso de que dicho error se considerase la incertidumbre asociada al mismo debería de calcularse e incluirse, pero no se va a considerar en este caso. 90 00:14:38,730 --> 00:14:49,710 Luego, una vez que hemos identificado nuestras fuentes de incertidumbre, que son la balanza y el matraz, vamos a calcular la normalidad de la disolución. 91 00:14:50,090 --> 00:15:00,110 Una disolución de dicromato potásico, su normalidad viene dada por el número de equivalentes de soluto partido por el volumen de disolución en litros. 92 00:15:00,110 --> 00:15:24,169 La masa molar del dicromato potásico la tenéis dada como dato en el problema, el peso equivalente también. Luego, realizando una simple operación, la normalidad se calcula como la masa partido por el volumen en litros y multiplicando, utilizando factores de conversión por el peso equivalente. 93 00:15:24,169 --> 00:15:38,610 No me voy a detener en esta operación de cálculo porque ya es un tipo de operación en el que estáis familiarizados en los cálculos de las concentraciones molares, normales, etcétera, que habéis visto en otros módulos. 94 00:15:38,610 --> 00:15:47,009 Aquí vemos que el resultado de la normalidad es 0,3956 equivalentes litro. 95 00:15:47,549 --> 00:15:55,889 Ya hemos realizado nuestro cálculo principal, es decir, lo que hace referencia a la RF en la diapositiva. 96 00:15:56,049 --> 00:15:58,029 La RF es el resultado principal. 97 00:15:58,570 --> 00:16:06,230 Nuestro resultado principal viene dado por una división, puesto que es una concentración, es una masa partido por un volumen. 98 00:16:06,230 --> 00:16:13,149 Luego la incertidumbre del resultado asociado a una división se calcula mediante esta fórmula. 99 00:16:13,230 --> 00:16:30,230 La incertidumbre es igual al resultado final, a este Rg que ya he calculado, que multiplica a la raíz cuadrada de la relación que existe entre la incertidumbre asociada a cada factor de medida al cuadrado. 100 00:16:30,230 --> 00:16:47,620 Es decir, perdonad, aquí tenéis la fórmula. La incertidumbre partido por el resultado final es lo mismo que cuando yo me llevo este Rf que está aquí multiplicando, me lo llevo aquí dividiendo. 101 00:16:47,620 --> 00:16:55,779 es igual a la raíz cuadrada de la incertidumbre asociada 102 00:16:55,779 --> 00:17:00,940 digamos al resultado de medidas A 103 00:17:00,940 --> 00:17:05,400 la incertidumbre de A partido por el resultado de A elevado al cuadrado 104 00:17:05,400 --> 00:17:08,160 pues me vengo aquí, igual tengo 105 00:17:08,160 --> 00:17:13,440 tengo por una parte la incertidumbre asociada a la balanza 106 00:17:13,440 --> 00:17:20,400 En gramos, puesto que la medida está realizada en gramos, pongo las unidades concordantes. 107 00:17:20,839 --> 00:17:30,359 Su incertidumbre es 0,0001 dividido por su resultado y todo ello elevado al cuadrado más. 108 00:17:31,119 --> 00:17:35,759 ¿Cuál es la siguiente incertidumbre que yo tengo? La asociada al matraz. 109 00:17:35,759 --> 00:17:54,000 Aquí, en este caso, he realizado el resultado en mililitros porque coincide, en este caso, la medida de la incertidumbre de 250, tal y como viene expresado aquí, 250 más menos 0,5 mililitros. 110 00:17:54,000 --> 00:18:12,920 Tanto 250 como 0,5 están expresados en mililitros. Aquí, sin embargo, no existe esa concordancia. 4,8496 son gramos, pero 0,1 son miligramos y deben de estar tanto la incertidumbre como su medida en la misma unidad. 111 00:18:12,920 --> 00:18:22,819 Aquí, en este caso, al estar expresada en la misma unidad, puedo utilizar 0,5, que es la incertidumbre, dividido entre 250 y elevado al cuadrado. 112 00:18:23,259 --> 00:18:30,460 Es decir, esta fórmula que tenéis aquí es nada más y nada menos que la aplicación de esta otra que tenéis aquí. 113 00:18:30,460 --> 00:18:42,779 Lo que ocurre es que, en lugar de poner raíz cuadrada, lo que está poniendo es todos los elementos que forman los distintos sumandos que están dentro de la raíz cuadrada los eleva a un medio. 114 00:18:42,920 --> 00:18:46,980 Una raíz cuadrada es una potencia que está elevada a un medio. 115 00:18:48,839 --> 00:18:59,480 Entonces calculamos este resultado que sale 0,002, luego despejando la incertidumbre asociada a la medida, 116 00:18:59,480 --> 00:19:07,480 será igual al resultado que me sale por el RF, que es el valor que yo he calculado anteriormente. 117 00:19:07,480 --> 00:19:29,599 Y procedo de la misma forma que os he explicado en el apartado anterior, es decir, yo voy a redondear, en este caso el resultado, disculpadme, sale 0,0008, luego tiene una cifra significativa en la posición de la diez milésimas 118 00:19:29,599 --> 00:19:44,220 Y voy a realizar, cuando voy a expresar el resultado, el resultado de la medida lo voy a expresar también con el mismo orden de, digamos, precisión en las cifras decimales. 119 00:19:44,400 --> 00:19:53,619 Milésimas, o sea, décimas, centésimas, milésimas y diez milésimas, más menos 0,0008. 120 00:19:53,619 --> 00:20:10,049 Es cierto que aquí se podría haber redondeado el 56 y poner 0,3960 más menos 0,0008. También sería correcto. 121 00:20:10,049 --> 00:20:25,970 ¿De acuerdo? Y entonces, el último problema, lo tenéis resuelto, es una combinación de los dos anteriores, combinación en el sentido de las operaciones matemáticas que se realizan, o sea, es un problema completamente distinto, 122 00:20:25,970 --> 00:20:35,190 pero para llegar a su resultado final tenemos que realizar primero una resta, la cual lleva asociada su desviación estándar, 123 00:20:35,529 --> 00:20:44,789 y luego tenemos que realizar una división, donde utilizamos la masa del residuo seco previamente calculada y la dividimos por su volumen. 124 00:20:45,369 --> 00:20:54,549 Luego, por tanto, en este caso, la desviación estándar será aplicada con esta fórmula de la misma forma que os he explicado anteriormente. 125 00:20:55,970 --> 00:21:17,490 Es únicamente tener en cuenta las distintas operaciones que yo voy a ir realizando y ir arrastrando su incertidumbre a medida que voy operando con las distintas, digamos, unidades, o sea, con los distintos valores que me va dando el problema. 126 00:21:17,490 --> 00:21:41,490 Bueno, pues entonces, una vez que ya hemos repasado las cifras significativas, vamos a continuar con la siguiente parte de nuestra diapositiva dentro de la evaluación experimental, que es la determinación de los datos anómalos o los datos sospechosos. 127 00:21:41,490 --> 00:22:03,170 En este caso, cuando se está realizando un mismo análisis en varias veces repetidas, puede ocurrir que obtengamos algún dato que se aleje demasiado del resto de datos de la serie y estos datos pueden considerarse poco representativos. 128 00:22:04,069 --> 00:22:12,529 Los datos que son poco representativos deben de eliminarse, pero no se pueden eliminar porque a mí a simple vista me parezca un poco representativo. 129 00:22:12,529 --> 00:22:18,490 Se deben de eliminar a través de unos criterios lógicos de una manera objetiva. 130 00:22:19,009 --> 00:22:28,569 Entonces, cuando nosotros en una serie de medidas repetidas queremos detectar un valor sospechoso, se pueden proceder de dos formas. 131 00:22:29,349 --> 00:22:40,430 Primero, una forma fácil de visualizar ese valor sospechoso consiste en ordenar los valores de la serie de menor a mayor y calculamos el valor medio. 132 00:22:40,430 --> 00:22:52,730 A continuación, lo que hacemos es calcular el error absoluto o la distancia que hay entre cada extremo de la serie y el valor medio. 133 00:22:52,730 --> 00:23:14,529 El valor que presente una distancia superior respecto al valor medio será el valor sospechoso y la forma en la que normalmente se procede en los laboratorios es aplicando métodos matemáticos, ya sea basados en intervalos de confianza o basados en tablas. 134 00:23:14,529 --> 00:23:19,250 Esta es la forma que normalmente vais a utilizar en el mundo real. 135 00:23:20,490 --> 00:23:25,529 Esto se suele aplicar cuando tenemos una serie de datos muy pequeño y vamos un poquito rápido, 136 00:23:25,710 --> 00:23:29,869 pero lo más normal es que apliquéis métodos matemáticos. 137 00:23:30,369 --> 00:23:34,970 Bien, entonces, cuando nosotros vamos a determinar datos anómalos, 138 00:23:35,230 --> 00:23:42,809 desde el punto de vista matemático, existen cinco formas de determinar los datos sospechosos 139 00:23:42,809 --> 00:23:49,529 Y las vamos a agrupar en dos bloques diferentes, como veis en la diapositiva que tenemos en pantalla. 140 00:23:50,369 --> 00:23:56,490 Los métodos que están basados en tablas o métodos estadísticos son dos. 141 00:23:56,630 --> 00:24:05,269 El método de groups, basado en el parámetro R, o el método de Dixon, que está basado en el parámetro Q. 142 00:24:05,269 --> 00:24:14,710 El que más se suele utilizar es el método de Dixon, es el menos restrictivo, pero es, como os acabo de comentar, el más habitual. 143 00:24:15,690 --> 00:24:23,109 Tanto el método de Grubbs como el método de Dixon se suelen utilizar cuando tenemos tres o más resultados. 144 00:24:23,609 --> 00:24:34,349 Por ejemplo, en el método de Grubbs, el parámetro estadístico que calculamos es la media aritmética y la desviación estándar. 145 00:24:34,349 --> 00:24:53,490 Y lo que hacemos es calcular un parámetro R de cálculo que luego vamos a comparar con su valor correspondiente tabulado y al realizar la comparación decidimos si se rechaza o se acepta de acuerdo al criterio que tenéis aquí. 146 00:24:53,490 --> 00:25:18,910 Es decir, la R de cálculo o la R experimental, que veis aquí, esta RE es R experimental, en otros manuales podéis verla como RC, R de cálculo, es igual al valor absoluto del dato sospechoso, este dato que yo he considerado sospechoso, menos la media aritmética, dividido por la desviación estándar. 147 00:25:18,910 --> 00:25:31,829 Una vez que yo he calculado este parámetro, voy a la tabla de R de groups, que ahora lo veremos con una serie de ejemplos, que lo entenderemos mejor, y comparo la R experimental con la R tabulada. 148 00:25:32,170 --> 00:25:41,150 Si la R experimental supera a la R tabulada, rechazamos este valor que hemos considerado sospechoso. 149 00:25:41,150 --> 00:25:52,650 ¿De acuerdo? Y una vez que el valor sospechoso se rechaza, se elimina de nuestra serie de datos y continuamos el resto de nuestras operaciones con los datos que nos quedan. 150 00:25:52,650 --> 00:26:10,789 La Q de Dixon, por su parte, veis que el parámetro Q de cálculo o Q experimental es el valor absoluto de la diferencia entre el valor sospechoso y el dato de nuestra serie que es más cercano a ese valor sospechoso. 151 00:26:11,150 --> 00:26:19,829 Esta diferencia en valor absoluto la divido por el rango del intervalo en el cual se enmarca mi serie de datos. 152 00:26:20,349 --> 00:26:29,569 Recordemos que el rango de un intervalo de datos es el valor menor, el valor máximo menos el valor mínimo. 153 00:26:29,569 --> 00:26:41,460 Esto lo vimos en una videoconferencia anterior cuando estuvimos hablando de los errores aleatorios y experimentales. 154 00:26:41,460 --> 00:26:46,359 experimentales. Entonces vemos que el rango de un intervalo es la diferencia entre su valor máximo y 155 00:26:46,359 --> 00:26:54,619 su valor mínimo. Pues cuando vamos a calcular la Q de Dixon vamos a utilizar el rango, mientras que 156 00:26:54,619 --> 00:27:00,700 en la R de Groups utilizamos la desviación estándar. Procedemos de la misma manera que con la R de 157 00:27:00,700 --> 00:27:09,220 Groups. Comparamos nuestro valor Q experimental o Q de cálculo con el valor tabulado. Si el valor 158 00:27:09,220 --> 00:27:16,059 de cálculo supera el valor tabulado rechazamos nuestro valor sospechoso y lo eliminamos de 159 00:27:16,059 --> 00:27:21,819 nuestra serie de datos. Esto es la forma de proceder con los métodos que están basados 160 00:27:21,819 --> 00:27:28,359 en tablas estadísticas. Pero luego tenemos tres métodos que están basados en intervalos 161 00:27:28,359 --> 00:27:40,799 de confianza. Estos tres métodos son los métodos del 4D, 2,5D y 2S. Estos tres métodos se suelen 162 00:27:40,799 --> 00:27:49,140 aplicar cuando nos encontramos, por ejemplo, el método 4D y 2,5D se suelen aplicar en series de 163 00:27:49,140 --> 00:27:58,640 cuatro o más resultados y el 2s cuando tenemos series de muchos datos. Es verdad que no nos dice 164 00:27:58,640 --> 00:28:08,920 cuál, porque por ejemplo cuando yo tengo 10 datos, yo tengo más de tres datos y también tengo más de 165 00:28:08,920 --> 00:28:16,119 cuatro, es decir, ahora mismo podría aplicar cualquiera de estos parámetros, digamos de estos 166 00:28:16,119 --> 00:28:22,299 métodos para determinar el valor sospechoso. En este caso, tendríamos que utilizar o que recurrir 167 00:28:22,299 --> 00:28:27,160 a nuestro procedimiento normalizado de trabajo en nuestro laboratorio, en el cual se debería 168 00:28:27,160 --> 00:28:34,259 de especificar cuál es el procedimiento a seguir para calcular nuestro valor sospechoso. Aquí 169 00:28:34,259 --> 00:28:41,039 tenéis en este cuadro resumen dentro de los, digamos, métodos que os estoy explicando cuáles 170 00:28:41,039 --> 00:28:50,140 son más restrictivos que otros, pero no existe ningún valor o ningún corte en el cual se diga 171 00:28:50,140 --> 00:28:56,119 cuál se tiene que utilizar en cada caso u otro. En este caso tendríamos que recurrir a lo especificado 172 00:28:56,119 --> 00:29:04,740 en nuestro PNT con el que estamos trabajando. Entonces vemos que de los métodos basados en el intervalo 173 00:29:04,740 --> 00:29:13,819 de confianza, el que es el más restrictivo de todos es el 2,5D porque está basado, tanto el 4D 174 00:29:13,819 --> 00:29:21,880 como el 2,5D, está basado en la desviación media. Tener cuidado que no es la desviación estándar y 175 00:29:21,880 --> 00:29:28,759 el 2S está basado en un intervalo de confianza que considera la desviación estándar. En el método 176 00:29:28,759 --> 00:29:35,799 basado en el intervalo de confianza 4D, lo que vamos a realizar es un cálculo de un intervalo 177 00:29:35,799 --> 00:29:43,640 de confianza donde el valor central es la media aritmética y los extremos del intervalo viene 178 00:29:43,640 --> 00:29:51,559 dado por cuatro veces la desviación media. El 2,5D se procede de la misma forma, aquí faltaría el 179 00:29:51,559 --> 00:29:58,839 valor de la x media aquí que no ha salido más menos 2,5 veces la desviación media y en el 180 00:29:58,839 --> 00:30:07,359 método de 2s mi intervalo de confianza viene dado por la media aritmética y los extremos dos veces 181 00:30:07,359 --> 00:30:16,420 el intervalo de confianza. Cuando rechazamos nuestro valor sospechoso, cuando ese valor que 182 00:30:16,420 --> 00:30:22,839 nosotros hemos detectado como sospechoso queda fuera de este intervalo de conciencia. 183 00:30:24,440 --> 00:30:30,819 Bien, vamos a analizar cada uno de estos datos con unos ejemplos resueltos que os he puesto 184 00:30:30,819 --> 00:30:40,680 en la... Aquí tenemos la tabla del parámetro R de groups para calcular el parámetro tabulado. 185 00:30:40,680 --> 00:30:49,140 Este es nuestro número de datos que tenemos en la serie y aquí tenemos nuestros niveles de confianza. 186 00:30:49,240 --> 00:31:04,519 Luego, en función del nivel de confianza que nuestro enunciado del problema nos diga, y os recuerdo que en caso de análisis químicos será el 95%, nosotros calcularemos nuestra R o nuestro parámetro tabulado. 187 00:31:04,519 --> 00:31:16,799 Por ejemplo, si yo estoy en un nivel de confianza del 95% y tengo una serie de seis datos, mi parámetro R de groups tabulado sería 1,822. 188 00:31:17,460 --> 00:31:28,359 La siguiente diapositiva os muestra la tabla de Dixon, la Q de Dixon, que sigue el mismo, digamos, orden que la R de groups. 189 00:31:28,359 --> 00:31:35,700 aquí tenéis el nivel de confianza dado por probabilidad y debajo os pone el nivel de 190 00:31:35,700 --> 00:31:41,299 significación que ya lo hemos explicado en videoconferencias anteriores. Procedemos de la 191 00:31:41,299 --> 00:31:46,940 misma manera para un número de datos de 6 y un nivel de significación. Imaginaros que nos dice 192 00:31:46,940 --> 00:31:56,000 el problema que nuestro nivel alfa es 0,05. Yo sé que estoy en un 95% de nivel de confianza. Mi Q 193 00:31:56,000 --> 00:32:07,019 de Dixon sería 0,560. Bien, y ahora vamos a analizar un ejemplo resuelto. Nos dan una serie 194 00:32:07,019 --> 00:32:15,599 de datos que son los que tenéis aquí, 10, 15, 20, 50 y 70. Y tenemos que decidir los valores que se 195 00:32:15,599 --> 00:32:22,579 rechazan cuando aplicamos cada uno de los criterios de determinación de datos anómalos que acabamos 196 00:32:22,579 --> 00:32:27,880 deber, es decir, cuando lo aplicamos todos, los métodos basados en tablas y los basados 197 00:32:27,880 --> 00:32:34,480 en el intervalo de confianza. Comenzamos con la Q de Dixon, que nos dice el problema que 198 00:32:34,480 --> 00:32:42,700 nuestro nivel de confianza es del 95%. Cuando nosotros tenemos nuestros datos que aparecen 199 00:32:42,700 --> 00:32:49,380 ordenados, vemos que el valor sospechoso, digamos el que se aleja más en este caso, 200 00:32:49,380 --> 00:32:58,220 es el 70. Este es nuestro valor sospechoso y como vamos a aplicar el criterio de Dixon la fórmula 201 00:32:58,220 --> 00:33:07,319 de cálculo era el valor considerado como sospechoso menos el valor más cercano en la serie dividido 202 00:33:07,319 --> 00:33:16,220 por el rango. Aplicando la fórmula de Dixon mi valor sospechoso es 70, el más cercano 50 y el 203 00:33:16,220 --> 00:33:19,599 Rango es el valor más grande menos el más pequeño. 204 00:33:20,180 --> 00:33:26,279 Cuando yo aplico la fórmula, la Q de cálculo es 0,33. 205 00:33:27,799 --> 00:33:38,839 Si yo me voy a la tabla de la Q de Dixon, hemos dicho que tenemos, en este caso, tenemos 5 datos. 206 00:33:39,519 --> 00:33:42,400 1, 2, 3, 4 y 5. 207 00:33:42,400 --> 00:33:50,400 Y nuestro nivel de significación es 0,05 o del 95%. 208 00:33:51,180 --> 00:34:03,400 Pues entonces, con 5 datos y 0,95, nuestra Q de cálculo es 0,642. 209 00:34:04,440 --> 00:34:09,639 Aquí hemos apreciado una cifra más, pero sería 0,642. 210 00:34:09,639 --> 00:34:27,860 Al comparar los dos valores, veo que mi Q de cálculo 0,33 es menor que 0,642. Como es menor, aceptamos el valor de 70 y el resto de valores. 211 00:34:27,860 --> 00:34:51,440 Si nosotros realizamos el mismo criterio pero aplicando la R de Gruss, nuestro valor sospechoso es 70 y la R experimental o R de cálculo se calculaba, perdonadme que me repito, como el valor absoluto entre mi valor sospechoso menos la media aritmética partido por la desviación estándar. 212 00:34:51,440 --> 00:35:02,179 Calculo la media aritmética de mi serie de datos, que es 23,75, calculo la desviación estándar y aplico la fórmula de cálculo. 213 00:35:02,719 --> 00:35:06,039 Mi valor de cálculo es 1,429. 214 00:35:07,260 --> 00:35:20,000 Me voy a la tabla de la, digamos, aquí os he puesto Q de cálculo, ha sido un error por mi parte, es R de cálculo, porque la Q es de Dixon. 215 00:35:20,000 --> 00:35:37,679 He copiado y he pegado para ir corrigiendo los datos y se me ha olvidado cambiaros. Esta es R, ¿vale? Disculpadme. Entonces, me voy a la tabla que os he mostrado anteriormente al 95% con 5 datos y vemos el valor. 216 00:35:37,679 --> 00:36:03,750 Como estamos en la R de groups, 95% con 5 datos es 1,672. ¿Veis? Entonces, lo que hacemos es comparar la R de cálculo con la R tabulada y vemos que la R de cálculo es más pequeña, aceptamos el valor sospechoso igual que nos pasaba con el criterio de Dixon. 217 00:36:03,750 --> 00:36:15,469 A continuación, vamos a hacer, a repetir el mismo proceso, pero ahora en lugar de aplicar los métodos tabulados, vamos a aplicar los métodos basados en el intervalo de confianza. 218 00:36:16,389 --> 00:36:23,849 Comenzamos con el criterio de 2,5D. Nuestro valor sospechoso sigue siendo 70. 219 00:36:23,849 --> 00:36:38,690 La única diferencia que tenemos aquí es que el valor medio lo vamos a calcular sin considerar nuestro valor sospechoso, cosa que sí considerábamos en los parámetros tabulados. 220 00:36:38,690 --> 00:36:54,250 La desviación media se calcula como el sumatorio de la diferencia entre xy menos el valor medio partido por n. 221 00:36:54,650 --> 00:36:59,289 Y aquí lo xy, en este caso, es el valor sospechoso. 222 00:36:59,289 --> 00:37:07,949 Y n, nuestro número de datos, sin considerar mi valor sospechoso porque tampoco lo he considerado al calcular la media. 223 00:37:10,449 --> 00:37:14,590 Tengo un resultado de 13,125. 224 00:37:15,889 --> 00:37:28,010 Una vez que ya he calculado mi desviación media, el intervalo de confianza es igual al valor medio más menos 2,5 veces esa desviación media. 225 00:37:28,550 --> 00:37:38,150 Pues sustituyo mi valor medio y luego 2,5 por 13,125 que es el valor que me ha salido de desviación media. 226 00:37:38,150 --> 00:37:46,050 Mi intervalo de confianza es 23,75 más menos 32,81. 227 00:37:46,050 --> 00:38:05,590 Si este intervalo de confianza yo lo traduzco a sus límites, es decir, al límite inferior, menos 9,06, el límite superior, veo que mi valor sospechoso 70 está fuera porque el límite superior es 55,56. 228 00:38:05,590 --> 00:38:14,230 Como se queda fuera del intervalo de confianza se rechaza dicho valor y entonces no se considera. 229 00:38:14,369 --> 00:38:29,869 Entonces vemos que en este caso aplicando el método del 2,5D rechazamos el valor sospechoso mientras que si aplicábamos los criterios basados en tablas dicho valor era aceptado. 230 00:38:29,869 --> 00:38:46,170 Veis aquí, a la hora de comparar la aplicación matemática, vemos que el método 4D y 2,5D son bastante más restrictivos que los de la R de Crookes o la Q de Dixon. 231 00:38:46,170 --> 00:39:13,780 Seguimos con el método del 4D que en este caso sigue el mismo criterio que el que os acabo de explicar con los mismos parámetros estadísticos y el mismo cálculo y nos resulta que el intervalo de confianza es menos 28,75 y el valor superior 76,25. 232 00:39:13,780 --> 00:39:25,480 En este caso, nuestro valor sospechoso 70 está dentro del intervalo. Luego, en este caso, de acuerdo al criterio 4D, aceptaríamos dicho valor. 233 00:39:25,480 --> 00:39:49,280 Y por último, tenemos el criterio 2S. El criterio 2S, basado en un intervalo de confianza en el que vamos a considerar la desviación estándar, nuestros parámetros estadísticos van a ser la media aritmética y la desviación estándar, pero sin considerar el valor que hemos considerado como sospechoso. 234 00:39:49,280 --> 00:40:05,880 Aquí vamos a hacer un inciso. Aquí tenemos una serie de pocos datos, tenemos cinco datos y aunque no siguen una distribución estándar, dicho criterio no sería de aplicación, lo vamos a aplicar para que veáis cómo se calcula. 235 00:40:05,880 --> 00:40:18,719 Pero en este caso no sería de aplicación puesto que tenemos una serie con muy poquitos datos que no siguen una distribución, digamos, distribución normal o una distribución normal estandarizada. 236 00:40:19,280 --> 00:40:36,900 Lo vamos a aplicar entonces, aplicamos la fórmula del intervalo de confianza igual al valor medio más menos dos veces la desviación estándar, sustituimos los distintos valores y calculo los límites superior e inferior. 237 00:40:36,900 --> 00:40:59,380 El valor sospechoso 70 queda fuera del intervalo porque el límite es superior a 59,69. Luego este valor sería rechazado. Pero insisto que en esta serie de datos no se podría aplicar este criterio porque el número de datos es pequeño. Lo he aplicado para que veáis cómo se calcula. 238 00:40:59,380 --> 00:41:14,340 Aquí tenéis otro ejemplo resuelto donde solamente se pide que determinéis si existe un valor dudoso según el contraste de Dixon. 239 00:41:14,340 --> 00:41:32,900 Y entonces aquí vemos que los números de nuestra serie de datos se encuentran desordenados. Yo los puedo ordenar de menor a mayor y veo que el valor que se considera como sospechoso en nuestro caso es el 85, porque es el que más se aleja. 240 00:41:32,900 --> 00:42:00,119 Porque tengo 72, 73, 73, 75, 77 y automáticamente saltamos a 85. También, si nosotros tenemos un número de datos muy alto, en lugar de ordenarlos y ver cuál es el valor sospechoso, podemos utilizar en la hoja de cálculo la identificación del dato dudoso mediante su función estadística adecuada. 241 00:42:00,119 --> 00:42:21,480 En este caso, nosotros, como es una serie de datos pequeñita, aplicamos la fórmula de cálculo de la Q de Dixon y vemos que nuestro valor sospechoso 85, el valor más cercano a 85 en mi serie de datos es 77, lo divido por el rango y me sale que la Q de Dixon de cálculo es 0,615. 242 00:42:22,039 --> 00:42:33,639 Mi Q tabulada, como no me dice nada, yo voy a considerar el 95% de nivel de confianza y mi número de datos va a ser 6. 243 00:42:34,179 --> 00:42:39,420 1, 2, 3, 4, 5 y 6, porque aquí consideramos todos los datos de la serie. 244 00:42:39,420 --> 00:42:54,940 Me voy a mi tabla y veo que mi valor tabulado con 6 datos y al 95% es 0,560. 245 00:42:54,940 --> 00:43:21,730 Pues aquí debe de haber un 0,55624, porque yo he utilizado una tabla de otro texto estadístico. 246 00:43:21,730 --> 00:43:33,190 Si es cierto que podéis encontraros en función del tipo de manual que se utilice, puede haber pequeñas variaciones en los parámetros de cálculo. 247 00:43:33,190 --> 00:43:45,929 Os insisto que de cara al examen sí os daría yo todas las tablas que vais a tener que utilizar, lo que pasa que vosotros tendréis que decidir qué tabla vais a utilizar en cada caso y lógicamente saberla manejar. 248 00:43:45,929 --> 00:44:06,269 Aquí sale 0,5624, mientras que en la tabla que yo os he puesto aquí en el aula virtual tenéis, para seis datos en la Q de Dixon, veis que sale 0,560, es decir, no aproxima las centésimas, o sea, las milésimas y las diez milésimas. 249 00:44:06,989 --> 00:44:20,619 En este caso, si yo pondría 0,560, también veo que mi Q de cálculo, al compararla con la Q tabulada, es mayor. 250 00:44:20,780 --> 00:44:24,840 Luego, en este caso, rechazamos el dato dudoso y lo eliminamos de la serie de datos. 251 00:44:25,800 --> 00:44:33,880 ¿Vale? Entonces, pues bueno, en este caso sí es verdad que cuando vosotros estáis trabajando los procedimientos normalizados de trabajo, 252 00:44:33,880 --> 00:44:55,119 En caso de que tengáis que utilizar tablas estadísticas, sí tienen que tener el tipo de tabla recogida. Es verdad que dependiendo de los manuales que se utilicen estadístico podéis encontraros pequeñas variaciones en los valores tabulados a partir de las milésimas o diez milésimas en función de los niveles de aproximación de esas tablas. 253 00:44:55,119 --> 00:45:05,099 que ha sido lo que a mí me ha pasado aquí, que he utilizado el valor de la Q de Dixon de un manual diferente del que os he subido en el aula virtual, 254 00:45:05,219 --> 00:45:06,659 que es la que más se suele utilizar. 255 00:45:07,900 --> 00:45:22,000 La evaluación del error experimental, que ya vimos con los intervalos de confianza, os he puesto aquí una pequeña aclaración que os la comenté en la videoconferencia anterior 256 00:45:22,000 --> 00:45:30,260 de lo que significaría la utilización de las tablas TED-STUDEN de una o de dos colas. 257 00:45:31,280 --> 00:45:37,980 Cuando nosotros hablamos de un ensayo de una cola, que hablaremos de esto mismo más adelante 258 00:45:37,980 --> 00:45:43,400 cuando estemos tratando de lo que son los ensayos o las pruebas de significación, 259 00:45:44,079 --> 00:45:47,659 cuando hablamos de una cola estamos hablando de una prueba estadística 260 00:45:47,659 --> 00:45:59,320 que estamos utilizando para determinar si una media de una muestra es significativamente mayor o menor que un valor de referencia. 261 00:45:59,920 --> 00:46:04,780 Cuando yo establezco mayor o menor, estoy estableciendo un sentido. 262 00:46:05,380 --> 00:46:13,500 Ya sea mayor, por ejemplo, estoy desplazándome hacia la derecha o menor hacia la izquierda, 263 00:46:13,500 --> 00:46:18,599 es decir, estoy poniendo un sentido, estoy hablando de una cola. 264 00:46:19,019 --> 00:46:23,519 Estas pruebas se denominan también hipótesis unidireccionales 265 00:46:23,519 --> 00:46:30,960 porque prueba que la media de mi muestra es significativamente mayor o menor 266 00:46:30,960 --> 00:46:33,059 que un valor que se ha dado de diferencia. 267 00:46:33,320 --> 00:46:38,340 Las pruebas de una cola las soléis utilizar siempre o se suelen utilizar 268 00:46:38,340 --> 00:46:46,199 cuando un investigador tiene una hipótesis específica sobre la dirección de la relación de 269 00:46:46,199 --> 00:46:51,039 esas variables que está comprobando. Normalmente esas variables suele ser un valor de referencia 270 00:46:51,039 --> 00:46:57,719 que puede ser un material certificado, puede ser un valor legal y luego un valor de referencia de 271 00:46:57,719 --> 00:47:04,139 una serie de datos que es la media aritmética. Cuando está comparando esos dos valores los 272 00:47:04,139 --> 00:47:13,619 puede comparar en el sentido de que sean significativamente iguales o diferentes, ahí no estamos estableciendo 273 00:47:13,619 --> 00:47:21,579 si es mayor o menor, ahí estaríamos en dos colas, o bien si estoy yo estableciendo esa 274 00:47:21,579 --> 00:47:27,980 hipótesis comparándola en una dirección, mayor o menor estaría en una cola. Si nos 275 00:47:27,980 --> 00:47:36,219 fijamos en las figuras que tenemos aquí, vemos que las pruebas de una cola se prefieren siempre a 276 00:47:36,219 --> 00:47:43,360 las pruebas de dos colas, porque en la prueba de una cola, ya sea a izquierda o a derecha, yo voy 277 00:47:43,360 --> 00:47:51,000 a tener los valores críticos en una cola de distribución. Es decir, mi valor crítico lo voy 278 00:47:51,000 --> 00:47:58,820 a centrar o en este lado o en este otro, luego la probabilidad de que el resto de valores se 279 00:47:58,820 --> 00:48:04,940 encuentren en la otra cola, vemos en este caso en este lado o en este vemos que es mucho mayor que 280 00:48:04,940 --> 00:48:14,380 si estoy en dos colas, porque en dos colas lo que estoy es acotando mi intervalo de probabilidad 281 00:48:14,380 --> 00:48:19,980 tanto a izquierda como a derecha, luego lo estoy haciendo más pequeño, si estoy utilizando una 282 00:48:19,980 --> 00:48:26,659 cola mi intervalo de probabilidad es mucho mayor. Cuando veamos los ensayos de significación esto 283 00:48:26,659 --> 00:48:33,380 lo vais a entender mucho mejor porque ahí ya vamos a establecer nuestras hipótesis y en la forma en 284 00:48:33,380 --> 00:48:38,980 la que nosotros redactemos nuestras hipótesis vamos a determinar claramente si va a ser 285 00:48:38,980 --> 00:48:46,500 unidireccional mayor o menor o si va a ser bidireccional. Bien, pues una vez que ya hemos 286 00:48:46,500 --> 00:48:55,039 hablado de la evaluación de los datos anómalos antes de meternos en el siguiente bloque que es 287 00:48:55,039 --> 00:49:01,940 los métodos de calibración, límites de detección y de cuantificación, volviendo al aula virtual, 288 00:49:02,780 --> 00:49:11,400 os he subido en la carpetita de práctica con la hoja de datos una nueva práctica resuelta de 289 00:49:11,400 --> 00:49:18,900 utilización de la hoja Excel con la aceptación de los valores, o sea, con los criterios que 290 00:49:18,900 --> 00:49:24,539 hemos visto estadísticos y basados en los intervalos de confianza para calcular los 291 00:49:24,539 --> 00:49:35,260 valores anuales. Si nosotros la descargamos, la aplicación de la práctica y al mismo 292 00:49:35,260 --> 00:49:45,059 tiempo la hoja Excel, que también la tenéis resuelta. Vamos a abrir nuestro LibreOffice. 293 00:49:46,079 --> 00:49:56,960 Perdona, me he equivocado. No es el procesador de textos. Es la hoja de cálculo que es LibreOffice 294 00:49:56,960 --> 00:50:20,510 Voy a abrir mi archivo y aquí tenéis el ejercicio que os he explicado analíticamente en la presentación, lo tenéis aquí resuelto en la hoja de cálculo. 295 00:50:20,510 --> 00:50:33,190 Veis que he utilizado cada pestañita del libro, esto se llama libro, para utilizar un criterio de aceptación o de rechazo. 296 00:50:33,190 --> 00:50:42,789 Vamos a empezar con los criterios basados en los intervalos de confianza y luego los basados en las tablas estadísticas. 297 00:50:43,670 --> 00:51:02,170 Volviendo a la explicación de este ejercicio práctico, vamos a ver cómo utilizamos la hoja de cálculo para resolver un problema típico de determinación de valores sospechosos. 298 00:51:03,190 --> 00:51:12,050 Se han efectuado seis valoraciones para determinar la concentración de una disolución de clorhídrico y aquí tenéis expresados los resultados. 299 00:51:13,110 --> 00:51:23,570 Se pide que se realice un tratamiento estadístico de esta serie con la utilización de diversos criterios para aceptar o rechazar los valores sospechosos. 300 00:51:23,570 --> 00:51:35,670 En primer lugar, a la hora de ponernos a aplicar los distintos criterios, lo primero que vamos a hacer es que vemos que el problema no nos da ningún tipo de referencia. 301 00:51:36,530 --> 00:51:49,510 Luego, a la hora de estudiar la aplicación de los distintos criterios de aceptación o rechazo que hemos visto en los contenidos teóricos, vamos a utilizar un nivel de confianza del 95%. 302 00:51:49,510 --> 00:52:07,269 Y lo que vamos a hacer es comenzar situando los datos de nuestro análisis en la columna A de nuestra hoja de cálculo y vamos a ordenar todos los valores que los tenemos aquí ordenados. 303 00:52:07,269 --> 00:52:13,929 ordenados, para ordenar los valores utilizamos estas dos teclas que tenemos aquí, que los 304 00:52:13,929 --> 00:52:19,409 podemos ordenar en orden ascendente o en orden descendente. En este caso nosotros empezamos 305 00:52:19,409 --> 00:52:26,989 del pequeño al mayor. Entonces aquí los tenemos ordenados y a la hora de ordenarlos 306 00:52:26,989 --> 00:52:33,050 nos damos cuenta que el valor sospechoso, el que se aleja de la tendencia de los datos 307 00:52:33,050 --> 00:52:43,880 es 0,1082. Vamos a comenzar con los criterios que están basados en los intervalos de confianza. 308 00:52:44,019 --> 00:52:50,960 Comenzamos con el 2,5D y recordemos que los parámetros estadísticos eran la desviación 309 00:52:50,960 --> 00:53:02,599 media y la media aritmética. Entonces vamos a empezar en la celda C2 introduciendo el 310 00:53:02,599 --> 00:53:09,539 n y en la celda D2 el número de datos. Es decir, nosotros aquí comenzamos poniendo 311 00:53:09,539 --> 00:53:17,679 n, que es nuestro número de datos, tenemos 5 datos, 1, 2, 3, 4 y 5, sin considerar nuestro 312 00:53:17,679 --> 00:53:27,380 dato sospechoso. En la siguiente celda, en la C3, siguiendo el orden que tenéis aquí 313 00:53:27,380 --> 00:53:35,980 explicado, en la C3 vamos a poner nuestra media aritmética y aquí cómo calculamos nuestro valor 314 00:53:35,980 --> 00:53:41,159 de la media. Recordad que tal y como os he explicado anteriormente, nuestro valor de la media se 315 00:53:41,159 --> 00:53:52,519 calcularía con la fórmula promedio desde el valor primero de mi intervalo, el A2, hasta el A6, porque 316 00:53:52,519 --> 00:53:58,260 no consideramos el valor sospechoso. Y luego calculamos la desviación media. La desviación 317 00:53:58,260 --> 00:54:11,269 media se calcula con esta fórmula que tenéis aquí. Una vez que ya hemos calculado nuestros 318 00:54:11,269 --> 00:54:17,730 parámetros estadísticos, aplicamos nuestra fórmula. Esta fórmula la tecleamos en Excel 319 00:54:17,730 --> 00:54:22,070 tal cual, porque esto no es una fórmula que nosotros hayamos metido, esto lo he metido 320 00:54:22,070 --> 00:54:28,170 yo pues con el signo igual y con los distintos símbolos el más menos pues lo 321 00:54:28,170 --> 00:54:33,530 podéis encontrar aquí desplegamos más caracteres y 322 00:54:33,530 --> 00:54:40,730 buscamos el más menos que lo tenéis aquí vale lo seleccionáis lo seleccionáis y 323 00:54:40,730 --> 00:54:46,789 le dais a insertar entonces escribimos nuestra fórmula y aquí sustituimos los 324 00:54:46,789 --> 00:54:58,369 datos. Nuestro valor medio es el que tenéis aquí, más menos 2,5 por la desviación media. Y aquí pongo 325 00:54:58,369 --> 00:55:10,670 el resultado de 2,5 por la desviación media. Aquí aplico la fórmula. ¿Veis? De 3 es la desviación 326 00:55:10,670 --> 00:55:22,730 media más 2,5 por d4 que es la desviación estándar. Este sería el límite superior del intervalo y este 327 00:55:22,730 --> 00:55:33,289 sería el límite inferior del intervalo. Y fijaros lo que pasa en la celda C10. En la celda C10 he 328 00:55:33,289 --> 00:55:42,389 incluido una fórmula condicional estadística en la cual me va a dar ya directamente la aceptación 329 00:55:42,389 --> 00:55:50,590 o el rechazo de mi parámetro dudoso o sospechoso. Una vez que yo he calculado los límites superiores 330 00:55:50,590 --> 00:56:01,710 e inferiores, lo tenéis aquí, aplico en esta celda la siguiente fórmula igual a si mi valor 331 00:56:01,710 --> 00:56:11,349 Y, abro paréntesis, si A7, vemos que A7 es el valor sospechoso. 332 00:56:11,630 --> 00:56:22,079 Si el valor sospechoso es más pequeño que E7, E7 es mi límite inferior. 333 00:56:22,679 --> 00:56:27,639 El siguiente condicionante es si mi valor sospechoso es mayor que mi límite superior. 334 00:56:27,639 --> 00:56:42,559 Entonces, si el valor sospechoso, que es A7, es más pequeño que el límite inferior, E7, que es este valor que tenéis aquí, aceptamos. 335 00:56:43,800 --> 00:56:45,139 Perdona, escape. 336 00:56:47,889 --> 00:56:49,929 Y si es mayor, rechazamos. 337 00:56:50,510 --> 00:56:58,590 Nosotros vemos que nuestro límite superior, veis que el límite superior del intervalo es 0,10398. 338 00:56:58,590 --> 00:57:12,829 Este límite, nuestro valor sospechoso a 7 es mayor que el límite superior. Luego, por tanto, rechazamos. Ya me da directamente el rechazo. 339 00:57:13,650 --> 00:57:18,650 Nuestro valor sospechoso no se encuentra dentro de los límites del intervalo y, por tanto, se rechaza. 340 00:57:18,650 --> 00:57:31,590 Aquí tenéis, en el aula virtual, tenéis explicado todo el proceso que yo he ido siguiendo en la hoja Excel 341 00:57:31,590 --> 00:57:40,530 Os lo he puesto explicado para que vosotros intentéis resolverlo y os vayáis familiarizando con el manejo de una hoja de cálculo 342 00:57:40,530 --> 00:57:43,610 para aquellos que no estáis muy familiarizados 343 00:57:43,610 --> 00:57:58,889 ¿Vale? Entonces, este proceso que se ha descrito aquí se aplica al resto de criterios basados en el intervalo, teniendo en cuenta los parámetros estadísticos que consideramos en cada caso. 344 00:57:58,889 --> 00:58:02,989 Es decir, en el criterio 4D procedemos de la misma manera. 345 00:58:03,690 --> 00:58:06,889 La desviación media se calcula con la fórmula del promedio, 346 00:58:09,079 --> 00:58:15,179 la desviación, perdón, la fórmula, la media aritmética con el promedio, 347 00:58:15,659 --> 00:58:18,539 la desviación media con la fórmula que tenéis aquí 348 00:58:18,539 --> 00:58:23,340 y luego lo que vamos haciendo es calculando el intervalo de confianza, 349 00:58:23,719 --> 00:58:26,119 límite superior, límite inferior 350 00:58:26,119 --> 00:58:30,059 y al aplicar la fórmula que os he comentado anteriormente, 351 00:58:30,199 --> 00:58:34,940 Se rechaza porque el valor sospechoso queda fuera del intervalo. 352 00:58:35,000 --> 00:58:40,239 Este es mi intervalo superior, luego vemos al compararlo que queda fuera, por tanto se rechaza. 353 00:58:40,239 --> 00:58:49,699 Y de la misma forma se procede con el criterio 2S, lo que cambia es el parámetro a considerar, que es la desviación estándar en lugar de la desviación media. 354 00:58:50,300 --> 00:58:56,059 Pero vemos que procedemos de la misma forma que os he comentado anteriormente. 355 00:58:56,059 --> 00:59:19,840 A continuación, tenemos el criterio Q de Dixon y el R de Groups. Comentaros que la Q de Dixon y la Q de Groups tabulada no se encuentran metidas en la hoja Excel como sí ocurría con la T de Student. Luego, en este caso, nosotros la Q tabulada la vamos a incluir de la lectura de la tabla que tenéis en el aula virtual. 356 00:59:20,440 --> 00:59:25,579 Luego, cuando yo voy a aplicar la Q de Dixon, los parámetros que yo voy a utilizar es el rango. 357 00:59:25,739 --> 00:59:30,360 Aquí tenéis la fórmula de cálculo del rango, el valor máximo del intervalo menos el mínimo. 358 00:59:30,360 --> 00:59:39,159 Y luego, ¿cuál es mi valor más cercano? Pues el valor que más se acerca a 10.82 es 10.59. 359 00:59:40,340 --> 00:59:46,360 Aplico la fórmula de la Q de Dixon. Esta ABS significa valor absoluto. 360 00:59:46,360 --> 00:59:55,119 absoluto. Esta fórmula sería el valor absoluto de mi valor sospechoso, que es A7, menos el más 361 00:59:55,119 --> 01:00:02,519 cercano, que lo tenéis aquí, dividido por el rango, que es D3, el rango lo tenéis calculado aquí. La 362 01:00:02,519 --> 01:00:09,500 cutabulada la introduzco de la tabla y automáticamente al aplicar en la celda C9 la 363 01:00:09,500 --> 01:00:16,260 fórmula estadística nos da el rechazo del dato. Y procedemos de la misma forma con la R de grupo. 364 01:00:16,360 --> 01:00:20,280 calculando la media aritmética y la desviación estándar. 365 01:00:20,780 --> 01:00:24,880 Aplicamos la R de cálculo, ¿veis la fórmula? 366 01:00:25,300 --> 01:00:26,380 Y la R tabulada. 367 01:00:26,820 --> 01:00:29,800 Lo que he hecho aquí al aplicar la fórmula 368 01:00:29,800 --> 01:00:33,019 es sencillo y llanamente ir sustituyendo, 369 01:00:33,019 --> 01:00:39,380 por ejemplo, digo igual a B, S es valor absoluto 370 01:00:39,380 --> 01:00:42,500 de la R de Dixon, la R de Grubbs, 371 01:00:42,760 --> 01:00:45,519 disculpadme, un poco de jaleo, 372 01:00:45,519 --> 01:01:02,789 Se calculaba el valor absoluto, si nosotros volvemos a la presentación, vemos que la fórmula era el valor sospechoso menos la media aritmética. 373 01:01:02,789 --> 01:01:21,090 Pues volvemos aquí y tenemos el valor sospechoso, que hemos dicho que es este, a7 menos, que es el guión, la media aritmética, cierro paréntesis, 374 01:01:21,090 --> 01:01:33,829 dividido por la barra, que la división es con la barra, y dividido por la desviación estándar. 375 01:01:34,809 --> 01:01:39,590 ¿Veis? Y aquí tenéis el resultado que coincide con el que tenéis aquí, 376 01:01:39,590 --> 01:01:43,889 que yo lo he redondeado al mismo número de cifras decimales que la he retabulado. 377 01:01:43,889 --> 01:01:52,070 Así se meten las fórmulas normales, una fórmula matemática en Excel 378 01:01:52,070 --> 01:01:58,349 Se ponen los distintos datos y luego se introduce la fórmula como hemos visto en videoconferencias anteriores 379 01:01:58,349 --> 01:02:04,130 La R de Groups no está incluida en la hoja de datos, luego yo de la tabla la tecleo 380 01:02:04,130 --> 01:02:08,889 Y automáticamente de la fórmula estadística pues rechazamos 381 01:02:08,889 --> 01:02:20,530 ¿Vale? Entonces, así tenéis una aplicación práctica de los distintos criterios de cálculo, de aceptación o rechazo de datos anómalos. 382 01:02:20,530 --> 01:02:36,860 Bien, pues voy a cerrar aquí y ya hemos completado la parte que correspondía al punto número 4 de evaluación del error experimental. 383 01:02:36,860 --> 01:03:09,190 Bien, no os he subido en el aula virtual en la parte de práctica, disculpadme, en la parte que tenéis aquí de ejercicios para practicar, no tenéis ejercicios subidos con aceptación o rechazo porque os lo voy a subir en ejercicios posteriores combinados con los ensayos de significación y así ya podemos hacer ejercicios más combinados. 384 01:03:09,190 --> 01:03:22,070 Además, también os he puesto en la presentación ejercicios resueltos. Luego creo que queda ya suficientemente comprendida la parte correspondiente a los datos anómalos. 385 01:03:22,070 --> 01:03:39,610 Vale, pues vamos a continuar la semana que viene con el punto número 5 correspondiente a lo que son los métodos de calibración, límites de detección y límites de cuantificación. 386 01:03:39,610 --> 01:03:53,730 Y aquí vamos a calcular, a aprender a calcular lo que son los parámetros de una recta de calibrado, tanto de una forma matemática como utilizando nuestra hoja Excel. 387 01:03:54,730 --> 01:04:01,730 Bien, pues entonces lo dejamos aquí y nos vemos en la siguiente videoconferencia.