1 00:00:00,050 --> 00:00:17,370 Buenas tardes. Hoy vamos a continuar con nuestra siguiente videoconferencia, pero antes de avanzar con la parte de los contenidos correspondientes a los intervalos de confianza, 2 00:00:17,370 --> 00:00:24,250 voy a explicaros cómo ir manejando la hoja de cálculo, ya sea Excel o LibreOffice, 3 00:00:24,730 --> 00:00:31,649 en una serie de ejercicios resueltos que os voy a ir subiendo a medida que vayamos avanzando 4 00:00:31,649 --> 00:00:37,909 por cada uno de los bloques del temario que corresponde a esta unidad de trabajo número 5. 5 00:00:37,909 --> 00:01:05,829 Como en la videoconferencia anterior hablamos de la forma de expresar los resultados con nuestra incertidumbre y hablamos de los errores sistemáticos, los errores aleatorios y lo que era exactitud y precisión con los parámetros estadísticos de la media, la desviación estándar y la varianza, 6 00:01:05,829 --> 00:01:16,810 os he subido una actividad resuelta en el aula virtual para que aprendáis a ir manejando poco a poco la hoja Excel. 7 00:01:17,069 --> 00:01:26,450 Lo tenéis en la parte de práctica con la hoja de datos, que puede ser Excel si la tenéis en casa o LibreOffice. 8 00:01:26,450 --> 00:01:34,170 Aquí tenéis la primera práctica de todas, es práctica con la hoja de cálculo 9 00:01:34,170 --> 00:01:39,430 y luego ya os voy a ir subiendo a medida que vayamos avanzando con bloques 10 00:01:39,430 --> 00:01:44,090 ejercicios resueltos para que veáis cómo se calcula de una manera analítica 11 00:01:44,090 --> 00:01:51,430 y también de una forma utilizando la hoja de cálculo y las funciones estadísticas 12 00:01:51,430 --> 00:01:54,109 que la propia hoja de cálculo tiene metidas 13 00:01:54,109 --> 00:02:06,689 Entonces, si os descargáis el archivo PDF es donde tenéis la práctica explicada y aquí vamos a empezar con una utilización básica de la hoja de cálculo. 14 00:02:06,909 --> 00:02:18,110 No sé si alguno de vosotros estáis ya familiarizados con el manejo de las hojas de cálculos o otros a lo mejor no la habéis utilizado. 15 00:02:18,110 --> 00:02:33,129 La hoja de cálculo Excel, que es la que se encuentra dentro del paquete Office, es un software que no es libre. Es decir, tienes que comprar la licencia del paquete Office para poderla usar e instalarla. 16 00:02:33,129 --> 00:02:51,110 Sin embargo, LibreOffice, que os he puesto aquí un hipervínculo para que podáis acceder a descargarlo, esta es la página web de LibreOffice y aquí os podéis descargar la versión gratuita que se encuentra ahora mismo disponible. 17 00:02:51,110 --> 00:03:00,610 La última versión es la 24.2.2. Aquí podéis elegir el sistema operativo que tengáis en casa en vuestro ordenador y os la descargáis. 18 00:03:01,129 --> 00:03:14,189 La instaláis y ya podéis utilizar de forma gratuita la versión libre de la hoja de cálculo, del procesador de texto, de las presentaciones e incluso de la base de datos. 19 00:03:15,189 --> 00:03:26,629 Nosotros aquí en el ordenador del instituto tenemos instalado LibreOffice, por eso una vez que ya lo tengáis instalado cualquier hoja de cálculo, sea de Excel o de LibreOffice, la vais a poder abrir. 20 00:03:27,370 --> 00:03:37,490 Entonces, continuando con la práctica, vamos a ver cómo vamos a calcular los parámetros estadísticos que vimos en la videoconferencia anterior, 21 00:03:37,490 --> 00:03:43,490 que se pueden calcular con la calculadora científica pero también se pueden calcular con la hoja Excel 22 00:03:43,490 --> 00:03:50,889 y ahora vamos a ver cuáles son las fórmulas que Excel o LibreOffice tiene ya incluidas dentro 23 00:03:50,889 --> 00:03:54,509 para poderlas usar y calcular esos parámetros estadísticos. 24 00:03:54,509 --> 00:04:03,770 Aquí tenéis la descripción de una práctica en la cual se ha determinado la acidez de una muestra de clorhídrico 25 00:04:03,770 --> 00:04:13,469 diluyéndola 100 veces en agua destilada y posteriormente se ha realizado una valoración con hidróxido sódico 0,1 normal 26 00:04:13,469 --> 00:04:16,029 utilizando como indicador fenoxaleína. 27 00:04:16,029 --> 00:04:22,430 Aquí tenéis los resultados que se han obtenido en cada una de las valoraciones 28 00:04:22,430 --> 00:04:32,129 y lo que se pide es que calculeis la media aritmética, la desviación estándar 29 00:04:32,129 --> 00:04:46,930 Cuando no dice nada se supone o están preguntando por la desviación estándar absoluta, la desviación estándar relativa, acordaros que siempre va en tanto por ciento, la varianza y el rango o recorrido. 30 00:04:46,930 --> 00:05:05,230 Volviendo a la presentación, vemos que las fórmulas por las cuales calculábamos los distintos parámetros estadísticos que os pide el ejercicio los tenéis aquí en la diapositiva. 31 00:05:05,230 --> 00:05:25,589 Tenéis la media aritmética, desviación estándar absoluta, desviación estándar relativa, aquí tenemos el rango y la varianza que es sencilla y llanamente el cuadrado de la desviación estándar. 32 00:05:25,589 --> 00:05:41,009 Cuando nosotros calculamos u operamos con una hoja Excel, lo primero que vamos a hacer es abrir nuestra hoja de cálculo y vamos a introducir los datos en la columna A. 33 00:05:41,009 --> 00:05:49,389 Es decir, aquí tenéis los datos que yo los he incluido, como veis, esta es la columna A y estas son las distintas filas. 34 00:05:49,389 --> 00:05:55,569 Así sencilla y llanamente se van tecleando los distintos datos y se van introduciendo. 35 00:05:56,069 --> 00:05:56,389 ¿De acuerdo? 36 00:05:57,110 --> 00:06:03,069 Entonces, a continuación, cuando una vez hemos introducido todos los datos, 37 00:06:03,069 --> 00:06:09,449 los parámetros estadísticos requeridos se deben de introducir en la hoja de cálculo 38 00:06:09,449 --> 00:06:17,250 con las fórmulas correspondientes que nos van a permitir calcular dicho valor. 39 00:06:17,250 --> 00:06:26,170 Es decir, estas fórmulas son equivalentes a si nosotros cogiéramos la calculadora científica y aplicáramos las fórmulas que hemos visto en teoría, 40 00:06:26,370 --> 00:06:35,310 aunque ya las calculadoras científicas en la opción B estadística tienen igualmente estas fórmulas metidas. 41 00:06:36,230 --> 00:06:46,889 Entonces, aquí tenéis un cuadrado resumen de las fórmulas que tiene la hoja Excel para calcular los distintos parámetros estadísticos requeridos. 42 00:06:46,889 --> 00:07:01,889 El número de datos de una serie es igual a contar y se mete a 1, a 12, en este caso es el intervalo de datos que yo he metido en la hoja de cálculo. 43 00:07:02,129 --> 00:07:12,350 Es decir, yo veo que en mi columna A, donde yo he puesto todos mis datos, empiezo poniendo el primer dato, ¿en qué fila? En la A, 2. 44 00:07:12,350 --> 00:07:31,649 Y el último en la A12. Luego yo, veis aquí, para que me cuente el número de datos, es decir, me diga que mi serie de datos tiene 11, yo siempre tengo que poner igual, veis, lo voy a hacer aquí para que lo veáis. 45 00:07:31,649 --> 00:07:48,910 Pongo igual, escribo la función, abro paréntesis, pincho el primer dato, le doy dos puntos, pincho el último dato, cierro paréntesis y Mel me los cuenta. 46 00:07:49,110 --> 00:07:58,050 ¿Veis? Es lo mismo. Así se procede con todas las fórmulas que vais a tener incluidas en este ejemplo resuelto. 47 00:07:58,050 --> 00:08:03,370 Volviendo con la parte de la explicación de la práctica 48 00:08:03,370 --> 00:08:09,029 La media aritmética se calcula con la función promedio 49 00:08:09,029 --> 00:08:14,589 Y tengo que especificar el intervalo de datos 50 00:08:14,589 --> 00:08:19,730 En los cuales yo he incluido todos mis datos de cálculo 51 00:08:19,730 --> 00:08:25,410 Como hemos visto antes, de la celda A2 a la A12 52 00:08:25,410 --> 00:08:47,509 Para la desviación estándar incluimos esta fórmula. La desviación estándar relativa podéis incluirla de dos maneras. En este caso tenéis la desviación estándar relativa es siempre la desviación estándar absoluta, veis que esta fórmula y esta es la misma, dividida por la media. 53 00:08:47,509 --> 00:08:51,990 Y la media coincide con esta fórmula y multiplicado por 100. 54 00:08:52,950 --> 00:08:56,230 O bien, metiendo las celdas correspondientes. 55 00:08:56,789 --> 00:09:02,029 Es decir, si yo me vengo aquí, aquí vemos la media y aquí veis la función. 56 00:09:03,029 --> 00:09:09,870 Y ya, una vez que yo he tecleado la función y le doy a intro, me calcula directamente el valor. 57 00:09:10,470 --> 00:09:15,590 Con la desviación estándar, hacemos lo mismo, igual que os he explicado con el número de datos. 58 00:09:15,590 --> 00:09:31,710 La desviación estándar relativa, como la hacemos, la desviación estándar relativa es igual a la desviación estándar absoluta que coincide con la celda E2. 59 00:09:31,710 --> 00:09:35,429 mirad, os lo voy a poner aquí que creo que lo vais a ver mejor 60 00:09:35,429 --> 00:09:39,490 la desviación estándar relativa es igual 61 00:09:39,490 --> 00:09:43,769 siempre a la desviación estándar absoluta con que pincha aquí 62 00:09:43,769 --> 00:09:47,110 ya me coge todo ese valor con todos los decimales 63 00:09:47,110 --> 00:09:51,909 dividido, siempre con la barra 64 00:09:51,909 --> 00:09:55,669 entre el valor medio y ahora le voy a poner 65 00:09:55,669 --> 00:09:59,190 un paréntesis para que toda esta 66 00:09:59,190 --> 00:10:03,750 esta operación, el resultado de esta operación, me lo multiplique 67 00:10:03,750 --> 00:10:07,149 la multiplicación en Excel se pone con el asterisco 68 00:10:07,149 --> 00:10:11,730 me lo multiplique por 100, ¿veis? y ya me devuelve 69 00:10:11,730 --> 00:10:15,769 todo este valor, ¿así vale? entonces aquí tenéis la desviación 70 00:10:15,769 --> 00:10:19,850 estándar relativa y la varianza se utiliza 71 00:10:19,850 --> 00:10:23,870 con esta fórmula, ¿vale? aquí tenéis var 72 00:10:23,870 --> 00:10:27,769 abro paréntesis y meto mi intervalo de datos 73 00:10:27,769 --> 00:10:36,549 para que me calcule la varianza y el rango se calcula con el máximo de mi intervalo de datos 74 00:10:36,549 --> 00:10:40,629 menos el valor mínimo del intervalo de datos. 75 00:10:41,309 --> 00:10:48,029 Entonces aquí tenemos nuestro valor de varianza, ahí veis la fórmula y el rango veis que es 0,3. 76 00:10:48,889 --> 00:10:56,350 Entonces de esta forma es como vamos a ir utilizando a medida que vayamos avanzando en los contenidos 77 00:10:56,350 --> 00:11:02,110 las distintas fórmulas que tiene incluida la hoja de cálculo 78 00:11:02,110 --> 00:11:06,190 para que aprendáis a manejarla porque en la vida real 79 00:11:06,190 --> 00:11:09,590 la inmensa mayoría de las operaciones matemáticas 80 00:11:09,590 --> 00:11:12,289 con DAC, Tratamiento Estadístico de Datos, 81 00:11:12,350 --> 00:11:14,909 lo vais a hacer con una hoja de cálculo. 82 00:11:15,629 --> 00:11:18,409 Aquí tenéis algunas aclaraciones que os he puesto 83 00:11:18,409 --> 00:11:22,009 para que os familiaricéis con la hoja de cálculo 84 00:11:22,009 --> 00:11:25,389 para aquellas personas que han trabajado un poquito con ella 85 00:11:25,389 --> 00:11:29,789 y veis que es muy importante que antes de introducir cualquier fórmula 86 00:11:29,789 --> 00:11:32,990 en una hoja de cálculo hay que poner el signo igual. 87 00:11:33,529 --> 00:11:37,330 Si yo no pongo el signo igual, Excel me va a devolver un error. 88 00:11:37,710 --> 00:11:41,690 Mirad, si yo voy a calcular el número de datos, voy a poner contar, 89 00:11:42,950 --> 00:11:48,029 pongo el intervalo, marco el primero, ¿veis? 90 00:11:48,529 --> 00:11:51,370 No tiene esta misma forma. 91 00:11:52,049 --> 00:11:55,309 ¿Lo veis? Si yo pongo contar y le doy enter, no hace nada. 92 00:11:55,389 --> 00:12:00,029 porque no le he puesto igual, luego la hoja de cálculo no entiende lo que tiene que hacer, 93 00:12:00,129 --> 00:12:02,950 me lo pone como si fuera un texto normal y corriente. 94 00:12:03,929 --> 00:12:07,710 Entonces es muy importante que siempre pongáis el signo igual. 95 00:12:08,370 --> 00:12:13,269 A continuación escribimos la fórmula, es decir, si es promedio pongo promedio, 96 00:12:13,350 --> 00:12:18,769 da igual que ponga la primera con mayúscula, que la ponga toda mayúscula o toda minúscula, no pasa nada. 97 00:12:19,110 --> 00:12:23,789 Pero es muy importante escribir la fórmula tal y como la tiene la hoja de datos metida 98 00:12:23,789 --> 00:12:30,850 y luego se escribe con paréntesis o el intervalo o la operación que yo voy a hacer, 99 00:12:30,950 --> 00:12:34,970 que es lo que se denomina el rango de la función matemática. 100 00:12:35,429 --> 00:12:40,049 No se ponen espacios, veis que os he puesto aquí no con mayúscula, 101 00:12:40,389 --> 00:12:46,250 a la hora de escribir todo el texto, ya sea la función y el rango. 102 00:12:46,250 --> 00:12:54,990 Entonces veis que en Excel toda fórmula en una hoja de cálculo siempre viene dada por el signo igual 103 00:12:54,990 --> 00:13:00,230 A continuación escribo la función que en este caso es la función promedio 104 00:13:00,230 --> 00:13:03,889 Abro paréntesis y escribo el rango 105 00:13:03,889 --> 00:13:07,149 Esto que tenéis aquí es lo que se denomina rango 106 00:13:07,149 --> 00:13:15,970 El rango puede hacer referencia a un número, a dos números o a un intervalo o una serie de números 107 00:13:15,970 --> 00:13:24,070 En este caso el rango va a representar los números afectados por la operación matemática o bien por el intervalo. 108 00:13:24,110 --> 00:13:32,669 El intervalo siempre va a estar compuesto por el primer número, por el número más pequeño, seguido del último y separado por dos puntos. 109 00:13:34,129 --> 00:13:40,990 Entonces aquí veis que el resultado de la hoja de cálculos es este, os he subido también el archivo para que lo tengáis resuelto. 110 00:13:40,990 --> 00:13:47,570 y luego ya os explico aquí dos funcionalidades de la hoja de cálculo que son muy interesantes. 111 00:13:48,110 --> 00:13:52,389 Una de ellas es cómo puedo yo redondear con la hoja de cálculo. 112 00:13:52,389 --> 00:13:57,409 Si yo me vengo aquí, por ejemplo, yo tengo aquí un montón de números decimales. 113 00:13:57,549 --> 00:14:01,549 Ya hablamos en las videoconferencias anteriores del número de cifras significativas. 114 00:14:02,090 --> 00:14:08,809 Si yo quisiera reducir decimales a dejarlo con una cifra significativa, 115 00:14:08,809 --> 00:14:11,889 me pongo en la celda y le doy a la X. 116 00:14:12,070 --> 00:14:13,950 ¿Veis que pone eliminar decimal? 117 00:14:14,570 --> 00:14:16,629 Pues en este caso se me pone así. 118 00:14:17,250 --> 00:14:22,450 Esto lo suele hacer la hoja Excel cuando el número tiene muchas cifras decimales. 119 00:14:22,610 --> 00:14:28,370 Lo que hago es agrandar la celda y voy dándole sucesivamente 120 00:14:28,370 --> 00:14:34,970 y veis que va paulatinamente redondeando hasta que llegue al número de cifras significativas que yo quiero. 121 00:14:34,970 --> 00:14:41,529 Si quisiera dos cifras significativas, recordad que los cero a la izquierda no eran significativos, me quedaría aquí. 122 00:14:41,970 --> 00:14:44,230 Y si quisiera una, me quedaría aquí. 123 00:14:47,419 --> 00:14:52,799 Esta serviría para aumentar las cifras significativas. 124 00:14:55,039 --> 00:14:56,299 ¿Qué sería lo contrario? 125 00:14:57,000 --> 00:15:06,559 Las fórmulas matemáticas que hemos visto aquí antes, normalmente las más usuales suelen ser fácil de memorizar. 126 00:15:06,559 --> 00:15:19,840 De todas formas, si no os acordáis, en un momento determinado aquí tenéis el símbolo Fx o el asistente de funciones las distintas fórmulas matemáticas. 127 00:15:19,840 --> 00:15:34,980 Veis que Excel, en este caso LibreOffice, me permite elegir entre todas las funciones que tiene metida, ya sean funciones matemáticas, funciones estadísticas o bien yo puedo seleccionar el tipo de función que quiero. 128 00:15:35,159 --> 00:15:47,639 Puedo escoger, aquí veis que tiene funciones para temas de finanzas, funciones informáticas, lógica, matemáticas, matrices y yo quiero estadísticas, acoto a la función estadística. 129 00:15:47,639 --> 00:15:57,240 Y si yo quisiera saber, por ejemplo, lo que me dice la función contar, veis aquí que me da la fórmula para que yo la pueda poner. 130 00:15:57,700 --> 00:16:02,559 Y esta fórmula, contar, cuenta los números que hay en la lista de argumentos. 131 00:16:02,679 --> 00:16:04,639 Recordad que este es el argumento. 132 00:16:06,720 --> 00:16:10,019 Entonces, para que veáis que este es el asistente de funciones. 133 00:16:10,019 --> 00:16:23,220 Y aquí, si en un momento determinado no os acordáis de una función, podéis buscarlo y tenéis la explicación en la propia hoja de cálculo, que es lo que os he puesto aquí al final de la práctica. 134 00:16:23,980 --> 00:16:35,799 Os he subido estos ejercicios resueltos porque considero que son muy interesantes para que vayáis practicando y os vayáis familiarizando con ellos. 135 00:16:35,799 --> 00:16:45,840 Voy a ir cerrando estos documentos para continuar con la parte donde nos habíamos quedado en la videoconferencia anterior. 136 00:16:49,840 --> 00:17:06,019 Entonces, acabamos en la parte de los intervalos de confianza y vamos a comenzar hoy con la definición de intervalo de confianza. 137 00:17:06,019 --> 00:17:23,079 Para ello voy a hacer un pequeño inciso del final de la videoconferencia anterior donde vimos que la inmensa mayoría de los resultados analíticos que vais a trabajar en el laboratorio se asemejan a una distribución normal o una distribución de Gauss. 138 00:17:23,079 --> 00:17:46,259 Y esto nos va a permitir, si escalamos el eje X en unidades de desviación estándar, poder dividirlo en una serie de intervalos donde voy a tener yo la seguridad de que un determinado porcentaje de mis medidas van a encontrarse en esos intervalos. 139 00:17:46,259 --> 00:18:08,259 Entonces, aquí veis, por ejemplo, que el intervalo comprendido entre una unidad ya sea positiva o negativa alrededor del valor medio de desviación estándar, voy a tener yo la seguridad de que el 68,27% de los datos se encuentran en este intervalo. 140 00:18:08,259 --> 00:18:28,859 A medida que yo voy ampliando el intervalo, los extremos, por ejemplo si me voy a menos dos unidades de desviación estándar a izquierda y a derecha, a medida que mi intervalo se hace más grande voy a tener mayor cantidad de unidades metidas en ese intervalo. 141 00:18:28,859 --> 00:18:45,680 Entonces, por ejemplo, el intervalo comprendido alrededor del valor medio más menos dos unidades de desviación estándar me va a comprender dentro o a contener el 95,4% de los datos. 142 00:18:45,680 --> 00:18:58,339 Si amplio mi intervalo a tres unidades de desviación estándar tendré el 99,7% y a cuatro unidades el 99,99% de los datos. 143 00:18:58,859 --> 00:19:07,720 También aprovecho para comentaros que la diferencia entre S y sigma es que S es la desviación estándar de una muestra 144 00:19:07,720 --> 00:19:12,240 y sigma es la desviación estándar de la población objeto de estudio. 145 00:19:13,019 --> 00:19:19,579 Cuanto mayor sea el número de datos de mi muestra, cuanto más grande sea mi muestra, 146 00:19:20,180 --> 00:19:25,299 esa desviación estándar más se acercará a la desviación estándar de la población. 147 00:19:25,299 --> 00:19:35,559 Porque normalmente en los laboratorios vais a trabajar con muestras que suelen ser pequeñas, es decir, una población tiene un número muy grande de datos. 148 00:19:35,559 --> 00:20:00,339 Entonces una vez visto esto los intervalos de confianza son precisamente el conjunto de datos constituido por un valor mínimo y un valor máximo en los cuales nosotros vamos a tener la seguridad, 149 00:20:00,339 --> 00:20:06,500 esa seguridad viene expresada en una probabilidad de que todos mis datos se van a encontrar ahí 150 00:20:06,500 --> 00:20:10,000 y el valor verdadero también se encuentra en ese intervalo. 151 00:20:10,279 --> 00:20:16,640 Es decir, si nosotros tenemos un intervalo de confianza que se expresa por IC 152 00:20:16,640 --> 00:20:21,200 definido por el valor medio, en este caso de una muestra, 153 00:20:22,200 --> 00:20:30,079 más menos 2S, que en este caso lo tendríamos en este intervalo, 154 00:20:30,079 --> 00:20:38,319 vemos que la probabilidad de que todos mis datos se encuentren en ese intervalo es del 95,4%. 155 00:20:38,319 --> 00:20:46,759 Esa es la utilidad de la distribución normal, el que nos permite a nosotros calcular mi intervalo de confianza 156 00:20:46,759 --> 00:20:57,140 con un nivel de seguridad, un nivel de confianza 68,3, 95,4, 99,7% 157 00:20:57,140 --> 00:21:04,779 de que mis datos están en ese intervalo o bien el valor verdadero. Aquí tenéis la definición de 158 00:21:04,779 --> 00:21:13,900 intervalo de confianza, es decir, conjunto dentro del cual podemos suponer de una forma razonable 159 00:21:13,900 --> 00:21:22,019 que se encuentra el valor verdadero o los datos de mi objeto de estudio. Un intervalo de confianza 160 00:21:22,019 --> 00:21:27,980 viene dado por unos valores extremos. Esos valores extremos, el valor mínimo hacia la 161 00:21:27,980 --> 00:21:33,900 izquierda y el valor máximo hacia la derecha, es lo que se denomina límites de confianza. 162 00:21:34,059 --> 00:21:39,500 Y estos límites de confianza representan la incertidumbre. Luego, si representan la 163 00:21:39,500 --> 00:21:46,559 incertidumbre, yo los voy a expresar con un más menos. ¿Veis cómo tenemos aquí? Este 164 00:21:46,559 --> 00:21:58,440 que serían mis límites de confianza, más menos 1s, luego aquí tendría yo un extremo, menos 1s y este sería el otro extremo. 165 00:21:58,440 --> 00:22:09,240 Entonces, continuando, la amplitud, la anchura, lo grande que es mi intervalo de confianza, esto es lo que se denomina amplitud, 166 00:22:09,240 --> 00:22:24,099 ¿Veis? ¿De qué va a depender? Del grado de certeza o del nivel de confianza seleccionado, del porcentaje. 68%, 95%, 99%. 167 00:22:24,099 --> 00:22:48,059 En análisis químico habitualmente se va a fijar en el 95%. Es decir, que si un problema que vosotros encontréis no os da el nivel de confianza de forma taxativa, al tratarse de análisis químico de manera cuantitativa podéis suponer que se está hablando de un 95% de nivel de confianza. 168 00:22:48,059 --> 00:22:56,059 Y esto nos expresa la probabilidad de que en ese intervalo de confianza se encuentre el valor verdadero. 169 00:22:57,059 --> 00:23:06,119 Si mi nivel de confianza es el 95%, aquí viene otro concepto que es el nivel de significación. 170 00:23:06,119 --> 00:23:20,180 El nivel de significación es el 5% restante, es decir, se asume que existe un 5% de probabilidad de que el valor esté fuera de ese intervalo de confianza. 171 00:23:20,319 --> 00:23:23,839 Eso es lo que se denomina nivel de significación. 172 00:23:24,880 --> 00:23:33,359 Vamos a ver cómo vamos a nosotros a trabajar de forma analítica y cómo vamos a calcular este intervalo de confianza 173 00:23:33,359 --> 00:23:44,660 que ya sabemos que viene dado por el valor verdadero más menos los niveles de confianza, que es lo que se denomina incertidumbre. 174 00:23:45,480 --> 00:23:58,359 Si nosotros suponemos que la distribución de datos es una distribución normal, podemos afirmar que el 95% de las mediciones muestrales se encuentran en este intervalo. 175 00:23:58,359 --> 00:24:05,619 intervalo. Mu es el valor medio poblacional en este caso, pero si estamos trabajando con una 176 00:24:05,619 --> 00:24:14,079 muestra será mi valor muestral. También podemos estar trabajando con un valor de referencia. Ese 177 00:24:14,079 --> 00:24:21,119 valor de referencia a un valor certificado será mi valor verdadero y yo mi serie de datos la voy 178 00:24:21,119 --> 00:24:28,299 a tener definida en un intervalo inferior, el límite inferior será el valor medio de 179 00:24:28,299 --> 00:24:37,440 mis muestras menos 1,96 desviación estándar poblacional y el valor máximo, el valor medio 180 00:24:37,440 --> 00:24:43,920 más 1,96, perdonad aquí me falta el sigma que no me ha salido, no lo he puesto, aquí 181 00:24:43,920 --> 00:24:53,500 falta el sigma. Mirad, esto viene a ser lo mismo que tenéis aquí. Aquí tenéis justo 182 00:24:53,500 --> 00:25:03,819 el valor, el 95,45% de los datos. Cuando estamos trabajando con una muestra, al tener el número 183 00:25:03,819 --> 00:25:10,000 de datos de la muestra más pequeño que el de la población, vemos que el intervalo 184 00:25:10,000 --> 00:25:32,980 Esto viene definido por el valor medio más menos 2S. Vemos como aquí tenemos 2 mientras que aquí tenemos 1,96. ¿Por qué? Porque en una muestra, al ser el dato más pequeño, se aproxima a 2, mientras que cuando estamos trabajando con un valor poblacional estaríamos en 1,96. 185 00:25:32,980 --> 00:25:44,119 Luego esta es una forma de expresar los datos de mi intervalo de confianza teniendo en cuenta un valor verdadero o un valor representativo. 186 00:25:44,299 --> 00:25:53,940 Vamos a ver cómo vamos nosotros a calcular en los problemas los intervalos de confianza en función de nuestro número de datos de la muestra. 187 00:25:54,480 --> 00:26:15,859 Vais a ver que en este caso no existe mucha homogeneidad a la hora de establecer una serie de números de datos que me dé un corte para utilizar una fórmula u otra a la hora de calcular un intervalo de confianza. 188 00:26:15,859 --> 00:26:29,539 Según estemos trabajando en disciplinas como las matemáticas, la química, la economía, la informática, podemos encontrar que el número de datos para aplicar una fórmula u otra, 189 00:26:29,779 --> 00:26:37,079 a veces vais a ver manuales donde aparecen 50 datos o donde aparecen 30. No existe homogeneidad. 190 00:26:37,079 --> 00:26:58,099 En análisis químico nosotros vamos a considerar el corte en 50 datos. Luego, para calcular el intervalo de confianza, como vamos a estar trabajando con una muestra, nuestro valor de media va a ser media muestral y la desviación estándar será la desviación estándar de la muestra. 191 00:26:58,099 --> 00:27:16,680 Luego, para calcular el intervalo de confianza de una serie de datos con los que estamos operando en el laboratorio, si tenemos 50 datos o más de 50 datos, que ya es un número bastante elevado, el intervalo de confianza se calcula mediante esta fórmula que tenéis aquí. 192 00:27:16,680 --> 00:27:24,059 El valor medio de la muestra, más menos, y esta es la expresión de la incertidumbre. 193 00:27:24,519 --> 00:27:32,660 La incertidumbre viene dada por Z que multiplica la desviación estándar de la muestra dividido por la raíz del número de datos. 194 00:27:33,359 --> 00:27:40,559 Si el nivel de confianza es del 95%, Z vale 1,96. 195 00:27:40,559 --> 00:28:04,900 Si el nivel de confianza es del 99%, Z vale 2,58 y si es del 99,7, 2,97. Veis que 1,96 es aproximadamente 2, 2,58 es 3 y 2,97 casi que llega también al 3. 196 00:28:04,900 --> 00:28:24,380 ¿Qué es lo que ocurre? Aquí tenéis justo los intervalos que hemos comentado antes. El 95,45% se redondea a 2 y el 99,7 a 3 unidades de desviación estándar. 197 00:28:24,380 --> 00:28:33,809 Esa es la única diferencia entre tener un número de datos muy grande y un número de datos pequeño. 198 00:28:34,069 --> 00:28:38,750 ¿Qué ocurre cuando tenemos muestras con menos de 50 datos? 199 00:28:39,190 --> 00:28:50,390 Al tener muestras más pequeñas, la desviación estándar muestral S ya se aleja de la desviación estándar poblacional sigma. 200 00:28:50,990 --> 00:28:54,809 Por tanto, no podemos utilizar esta expresión anterior. 201 00:28:54,809 --> 00:29:18,210 Para ello, sustituimos el valor de Z por un parámetro estadístico que se denomina el parámetro de Steuden o la distribución T de Steuden, que va a depender de mi nivel de significación, es decir, va a depender de un 5%. 202 00:29:18,210 --> 00:29:22,869 luego estaríamos hablando del 95, tenéis que tener cuidado con estos conceptos 203 00:29:22,869 --> 00:29:26,549 porque depende de cómo lo exprese el enunciado del problema 204 00:29:26,549 --> 00:29:30,990 os puede hablar de nivel de confianza o de nivel de significación. 205 00:29:31,910 --> 00:29:36,710 Dependiendo del nivel de significación y de lo que se denomina grados de libertad 206 00:29:36,710 --> 00:29:41,269 que es el subíndice n-1. 207 00:29:41,269 --> 00:30:06,950 La fórmula para calcular el intervalo de confianza cuando tenemos menos de 50 datos en nuestra muestra es el valor medio de la muestra más menos el parámetro estadístico t de student que vamos a sacar de una tabla, ahora os explicaré cómo se utiliza esta tabla, la desviación estándar de la muestra partido por la raíz de n-1. 208 00:30:06,950 --> 00:30:27,670 Veis que las dos fórmulas son iguales, lo único que varía es el coeficiente que afecta a la desviación estándar y al número de datos, que va a depender de si estoy en una muestra con un determinado número de datos más grande o en una muestra más pequeña. 209 00:30:27,670 --> 00:30:45,490 Bien, este hipervínculo que os pongo aquí de la TED Student, cuando lo abrís, esta tabla es la misma que la que tenéis en los contenidos interactivos de la unidad número 5. 210 00:30:45,490 --> 00:31:01,670 Si yo abro los contenidos interactivos y me voy a la evaluación del error experimental, cuando estoy calculando las incertidumbres, perdonad, calculo del error, los intervalos de confianza. 211 00:31:02,930 --> 00:31:10,950 Veis que esta tabla, si yo pincho aquí, cuando se abre esta tabla es igual que la que tenéis aquí. 212 00:31:10,950 --> 00:31:30,470 Bien, quería haceros un inciso. Esta tabla, la T de Student, se puede calcular considerando que el nivel de significación, ese 5%, lo puedo tener concentrado a izquierda o a derecha de la función T, que viene a ser muy parecida a una campana de Gauss. 213 00:31:30,470 --> 00:31:44,990 En este caso estaríamos hablando de dos colas o bien si lo tengo concentrado en un único lado o a la izquierda o a la derecha. Es en lo que os explico aquí más adelante que es lo que se denomina una o dos colas. 214 00:31:44,990 --> 00:31:58,730 La explicación de una o dos colas la vamos a ver cuando al final del tema veamos la parte de los ensayos de significación y ahí la vais a entender mejor 215 00:31:58,730 --> 00:32:04,190 Pero cuando vamos nosotros a trabajar con la T de Student que suele tener esta forma 216 00:32:04,190 --> 00:32:14,130 La T de Student tiene unos valores distintos si estamos trabajando con dos colas o bien con una cola ya sea a izquierda o a derecha 217 00:32:14,130 --> 00:32:26,089 Cuando nosotros estamos trabajando con dos colas bilateral es porque el nivel de significación, ese alfa, ese 5% está dividido a la izquierda y a la derecha. 218 00:32:26,470 --> 00:32:32,289 Luego veis que mi intervalo de datos donde se van a concentrar todos los datos es mucho más pequeño. 219 00:32:32,690 --> 00:32:39,490 De si yo tengo una cola, ya sea en este sentido hacia la derecha o en este que es hacia la izquierda. 220 00:32:39,490 --> 00:32:50,750 Todos los datos se me concentrarían aquí y si es en el otro sentido, aquí. Luego veis que en una cola tengo yo un intervalo muchísimo mayor que si es bilateral. 221 00:32:51,490 --> 00:33:06,190 Entonces, en los problemas que vamos a trabajar en la parte de intervalos de confianza, nos vamos a mover con la distribución de The Student de dos colas. 222 00:33:06,190 --> 00:33:28,750 Esta es de una cola, por tanto no la vamos a utilizar en esta parte. Es un error que tenéis en los contenidos interactivos. Comentaros que la parte de los intervalos de confianza con dos colas os las he subido en los ejercicios para practicar que la tenéis aquí. 223 00:33:28,750 --> 00:33:46,690 ¿Veis? Aquí tenéis de dos colas y esta es la distribución T de Student que vamos a utilizar para resolver los ejercicios de intervalos de confianza. 224 00:33:46,690 --> 00:34:06,450 Entonces, volviendo a la presentación, vemos aquí un resumen de cómo calcular los intervalos de confianza en función de que yo tenga una muestra mayor o igual de 50 datos o menor de 50 datos. 225 00:34:06,450 --> 00:34:25,409 Si tengo más de 50 datos o 50 datos utilizaré el parámetro Z que en función del nivel de confianza tendrá un valor u otro y si tengo menos de 50 datos tengo que calcularlo por el parámetro de student de dos colas. 226 00:34:25,409 --> 00:34:29,409 Bien, aquí tenemos un ejercicio resuelto. 227 00:34:30,829 --> 00:34:46,429 En el tenéis, por ejemplo, mirad, vais a calcular el contenido de sodio en una muestra de orina utilizando un electrodo selectivo de iones y hemos obtenido los valores que tenéis aquí. 228 00:34:46,429 --> 00:34:58,510 El problema nos pide que calculemos los límites de confianza al 95% para la concentración de ión sodio respectivamente. 229 00:34:58,989 --> 00:35:05,710 Entonces, como nosotros vamos a calcular el intervalo de confianza, tenemos lo siguiente. 230 00:35:05,969 --> 00:35:08,710 Mi número de datos es 6. 231 00:35:09,429 --> 00:35:13,610 Luego, al tener menos de 50 datos, por lo que hemos visto anteriormente, 232 00:35:13,610 --> 00:35:16,630 el intervalo de confianza lo vamos a calcular con la T de Student. 233 00:35:17,329 --> 00:35:25,269 Para calcular el intervalo de confianza yo necesito el valor de la media, la desviación estándar, 234 00:35:25,449 --> 00:35:31,369 mi número de datos ya lo conozco y calculo la T de Student mediante la tabla. 235 00:35:31,789 --> 00:35:37,429 Aquí os he puesto las fórmulas tanto de la media aritmética como de la desviación estándar, 236 00:35:37,429 --> 00:35:55,510 Pero esto lo podéis calcular con la calculadora científica sin ningún tipo de problema porque tiene introducidos en la selección del modo estadístico los parámetros de la media aritmética, desviación estándar poblacional y desviación estándar muestral. 237 00:35:55,510 --> 00:36:07,650 La varianza es el cuadrado de la desviación estándar, lo que por tanto se puede calcular sin necesidad de tener que hacer una tabla y ir calculando los distintos elementos que componen el sumatorio. 238 00:36:08,210 --> 00:36:15,489 El valor medio sale 100,5 y nuestra desviación estándar 3,27. 239 00:36:16,329 --> 00:36:19,510 Ahora vamos a calcular los límites de confianza. 240 00:36:19,510 --> 00:36:22,989 Vamos a calcular los límites de confianza al 95%. 241 00:36:22,989 --> 00:36:34,349 Para n-1, n-1 es igual a 5 porque yo tengo 6 datos menos 1, 5. 242 00:36:34,829 --> 00:36:45,269 Luego el valor de t de student con la probabilidad del 95% para 5 datos de la tabla. 243 00:36:46,110 --> 00:36:51,710 Comentaros que este valor de 2,15 está sacado de la tabla de una cola. 244 00:36:51,710 --> 00:36:55,989 Y ahora vais a ver la diferencia con la tabla de dos colas. 245 00:36:56,210 --> 00:37:04,449 El valor que tenemos en la tabla de una cola, que la he borrado, la voy a poner aquí, ¿cómo se calcularía? 246 00:37:04,530 --> 00:37:10,869 Os lo voy a mostrar con las dos, aunque os insisto que en los intervalos de confianza vamos a utilizar la de dos colas. 247 00:37:11,409 --> 00:37:16,210 Una vez que yo he abierto la tabla de TED Student, me voy a mi nivel de confianza. 248 00:37:16,210 --> 00:37:24,070 O sea, mi nivel de confianza es 0,95 porque me está diciendo que es del 95% y mis grados de libertad es n-1. 249 00:37:24,570 --> 00:37:29,269 n-1, hemos dicho que es 5. 250 00:37:29,590 --> 00:37:39,969 Pues entonces yo me vengo aquí y 5 a 0,95, este sería mi parámetro de Cd2 con 0,15. 251 00:37:39,969 --> 00:37:48,030 Que es el que yo os he puesto en la diapositiva sin darme cuenta que esa tabla era de una cola 252 00:37:48,030 --> 00:37:53,110 Insisto que este valor lo tenéis que calcular con la tabla de dos colas 253 00:37:53,110 --> 00:37:56,949 Como la tenéis ya subida al aula virtual, hacemos lo mismo 254 00:37:56,949 --> 00:37:59,909 Mirad la diferencia entre esta tabla y la otra 255 00:37:59,909 --> 00:38:05,809 Si vosotros os fijáis, aquí no viene 0.95, aquí viene 0.05 256 00:38:05,809 --> 00:38:09,110 Este sería el nivel de significación 257 00:38:09,110 --> 00:38:28,289 Y aquí tenéis el nivel de confianza. Es muy normal que en función del manual de estadística que utilicéis encontréis una tabla de 3D Student dada de esta forma o bien dada con los niveles de significación. 258 00:38:28,289 --> 00:38:36,869 Así que tenéis que tener cuidado a la hora de seleccionar el tipo de tabla que vais a utilizar, sobre todo si es de una cola o de dos colas. 259 00:38:36,869 --> 00:38:59,369 Vale, insisto, para calcular intervalos de confianza vamos a utilizar dos colas. Luego, como estábamos en 95%, luego mi nivel de significación es 0,05 y mi grado de libertad son 5. Luego voy donde se cruza y tengo 2,571. 260 00:38:59,369 --> 00:39:11,880 Como veis, la diferencia entre 2,015 a 2,571 es grande. 261 00:39:12,860 --> 00:39:21,019 De ahí que todos los datos yo los tenga considerados en este intervalo a que los tenga considerados solamente en un extremo. 262 00:39:21,139 --> 00:39:27,280 Esa es la diferencia, pero donde verdaderamente tiene sentido es en los ensayos de significación que los veremos al final. 263 00:39:27,280 --> 00:39:37,519 Luego yo sustituiría aquí 2,015 por 2,571 y luego lo único que tengo que hacer es operar. 264 00:39:38,099 --> 00:39:53,719 Como veis el intervalo de confianza siempre se muestra con una cifra significativa, por eso yo aquí opongo los límites entre 100,2 y 100,8. 265 00:39:53,719 --> 00:40:02,440 Este intervalo de confianza sería 100,5 más menos 0,3. Este es el resultado que sale de operar. 266 00:40:03,739 --> 00:40:08,300 Este es un ejemplo que tenéis resuelto de un intervalo de confianza. 267 00:40:08,480 --> 00:40:19,820 No obstante, aquí en el aula virtual os he incluido unos ejercicios resueltos de intervalos de confianza. 268 00:40:19,820 --> 00:40:25,380 Y estos ejercicios ya tienen incluida la tabla de TED Students de dos colas. 269 00:40:26,079 --> 00:40:37,940 Entonces, yo lo que os aconsejo es que primero os cojáis los enunciados y tratéis de resolverlos vosotros y los comparéis con las soluciones. 270 00:40:37,940 --> 00:41:02,159 No obstante, aquí os comento en las soluciones, pues veis, por ejemplo, en el ejercicio número 6, que os lo he resuelto a mano, pues veis cómo os calculo el valor medio, la desviación estándar, el coeficiente de variación, que es una expresión de la precisión. 271 00:41:02,159 --> 00:41:11,940 y luego para calcular el intervalo de confianza veis que os pongo la fórmula y esta tabla es la de dos colas. 272 00:41:11,940 --> 00:41:19,480 Y aquí tenéis ya el valor de la T de Student y cómo se calcula el intervalo de confianza con unas cifras significativas 273 00:41:19,480 --> 00:41:24,559 y las dos formas de expresar el intervalo de confianza son las que tenéis aquí. 274 00:41:25,059 --> 00:41:30,500 Aquí lo expresamos en función de la precisión con el más menos, la incertidumbre, 275 00:41:30,500 --> 00:41:37,099 Y esto es con los límites de confianza, el valor más pequeño y el valor más grande. 276 00:41:38,099 --> 00:41:43,780 Entonces aquí tenéis los ejercicios que os he propuesto, los tenéis resueltos. 277 00:41:46,670 --> 00:41:54,769 Bien, volvemos a la presentación y ya que hemos visto cómo se calculan los intervalos de confianza, 278 00:41:54,769 --> 00:42:04,769 Otra posibilidad en la cual se utilizan los intervalos de confianza es para la determinación del sesgo en un ensayo analítico. 279 00:42:05,750 --> 00:42:07,929 ¿En qué consiste la prueba del sesgo? 280 00:42:09,070 --> 00:42:21,769 Pues la prueba del sesgo consiste en determinar la veracidad de los resultados de mi análisis utilizando materiales de referencia certificados o métodos de referencia. 281 00:42:21,769 --> 00:42:28,030 referencia. Me explico, cuando nosotros utilizamos materiales de referencia en un análisis químico, 282 00:42:28,750 --> 00:42:35,829 la media experimental del análisis, es decir, los valores de mi media aritmética de toda la serie 283 00:42:35,829 --> 00:42:42,530 de datos que yo he obtenido, va a ser diferente al valor verdadero. Es decir, si yo comparo mi media 284 00:42:42,530 --> 00:42:47,969 aritmética con el valor de referencia, que se considera valor verdadero, sé que no van a coincidir. 285 00:42:47,969 --> 00:42:57,969 De hecho, la diferencia entre esa media aritmética y ese valor verdadero era lo que habíamos definido anteriormente como exactitud o error absoluto. 286 00:42:57,969 --> 00:43:17,230 La forma más habitual de tratar estadísticamente este problema consiste en comprobar si ese valor verdadero, si ese valor certificado, se encuentra dentro del intervalo de confianza para un nivel de confianza dado. 287 00:43:17,230 --> 00:43:22,409 más que comparar mi media aritmética con el valor verdadero 288 00:43:22,409 --> 00:43:24,150 sacar la diferencia 289 00:43:24,150 --> 00:43:27,530 esa diferencia a mí no me dice nada 290 00:43:27,530 --> 00:43:30,090 si yo no establezco una precisión 291 00:43:30,090 --> 00:43:34,250 y esa precisión se va a dar con el intervalo de confianza 292 00:43:34,250 --> 00:43:37,989 por tanto una vez que yo he calculado el intervalo de confianza 293 00:43:37,989 --> 00:43:43,409 si el valor verdadero no está dentro del intervalo de confianza 294 00:43:43,409 --> 00:43:44,730 se queda afuera 295 00:43:44,730 --> 00:43:51,230 es probable que exista un sesgo, que se haya producido un tipo de error sistemático. 296 00:43:51,769 --> 00:43:56,309 Si el valor verdadero está dentro del intervalo de confianza, 297 00:43:56,789 --> 00:44:01,829 tener cuidado porque yo no puedo afirmar categóricamente que no hay error sistemático. 298 00:44:01,829 --> 00:44:06,889 Lo que puedo decir es que no existe la presencia de un sesgo. 299 00:44:07,690 --> 00:44:10,809 No queda demostrada la presencia del sesgo, disculpadme, 300 00:44:10,809 --> 00:44:19,969 Pero el que no quede demostrado no significa que no exista. Tener cuidado con este matiz que es importante. 301 00:44:21,110 --> 00:44:31,550 Entonces nosotros para calcular la prueba del sesgo podemos utilizar el método del intervalo o el método estadístico. 302 00:44:31,550 --> 00:44:40,789 El que tenéis resuelto en los problemas que os he subido al aula virtual es el método del intervalo de confianza. 303 00:44:40,809 --> 00:44:57,969 ¿Veis? El problema número 8 es el que os pide que determinéis si existe evidencia de sesgo y yo he utilizado el cálculo del intervalo de confianza, aunque existe otra forma de calcularlo que es con el parámetro estadístico de la TED-STUDEN. 304 00:44:57,969 --> 00:45:00,309 Podéis utilizar las dos. 305 00:45:01,130 --> 00:45:08,449 Entonces, la T de student la vamos a utilizar para comparar una serie de datos con el valor conocido. 306 00:45:08,809 --> 00:45:17,050 Lo que estamos calculando es la media aritmética y en la comparación vemos la exactitud con un determinado nivel de confianza. 307 00:45:18,110 --> 00:45:26,969 Y eso nos va a determinar si esa exactitud es significativa o no, si existe sesgo o error sistemático. 308 00:45:27,969 --> 00:45:39,710 Cuando yo calculo la media aritmética y calculo, digamos, la exactitud que es la diferencia entre el valor conocido y la media aritmética en valor absoluto, 309 00:45:39,710 --> 00:45:52,829 si es mayor que el producto de la desviación estándar por el parámetro estadístico y dividido por n, existe una diferencia significativa. 310 00:45:52,829 --> 00:46:09,730 No obstante, la prueba del sesgo, siempre podéis utilizar el método de cálculo que yo os he puesto aquí, que yo creo que es más visual y se entiende mejor, que es el método del intervalo. 311 00:46:10,829 --> 00:46:21,869 A continuación, vamos a calcular otra aplicación del intervalo de confianza, que es la propagación de las incertidumbres. 312 00:46:22,829 --> 00:46:49,849 Pero me voy a detener aquí, disculpadme que acabo de recordar que os he subido al aula virtual una forma de resolver los intervalos de confianza con la hoja Excel, siguiendo con la dinámica que os comenté al principio de a medida que vayamos viendo bloques de cálculo de parámetros estadísticos que veáis la diferencia entre el cálculo analítico con las fórmulas y con la hoja Excel. 313 00:46:49,849 --> 00:47:05,070 Si volvemos al aula virtual, donde tenéis aquí el cálculo con la hoja de datos, tenéis una práctica de los intervalos de confianza y aquí la tenéis con la hoja Excel resuelta. 314 00:47:05,070 --> 00:47:18,670 Bien, cuando yo me descargo la explicación, pues me voy a descargar también la, digamos, la hoja Excel. 315 00:47:18,809 --> 00:47:22,309 Disculpadme que tengo un montón de ventanas abiertas y me estoy liando un poquillo. 316 00:47:23,650 --> 00:47:32,610 Vale, bien, he abierto el Excel, lo voy a cerrar porque quiero abrir el LibreOffice. 317 00:47:33,389 --> 00:47:37,630 Entonces, lo que hago, no, me he vuelto a equivocar otra vez, perdonad. 318 00:47:38,809 --> 00:47:59,320 Voy a abrir LibreOffice, abro la hoja de cálculo con LibreOffice y ahora voy a abrir mi archivo que os he subido con los intervalos de confianza. 319 00:48:00,179 --> 00:48:13,780 Vamos a ir a la explicación de cómo calculamos los intervalos de confianza con la hoja de cálculo. 320 00:48:13,780 --> 00:48:24,300 Vimos en la presentación que los intervalos de confianza se podían calcular bien con el parámetro Z o con la T de Student. 321 00:48:24,860 --> 00:48:34,059 Con la hoja Excel la función T de Student ya se encuentra incluida dentro de dicha hoja, por tanto no tengo que utilizar la tabla. 322 00:48:34,219 --> 00:48:40,019 El ejemplo que os he subido es aquel en el que el número de datos es inferior a 50. 323 00:48:40,019 --> 00:48:42,500 Luego nosotros vamos a utilizar esta fórmula. 324 00:48:42,500 --> 00:48:55,719 Entonces, si nosotros nos venimos aquí, vemos que la distribución T de student se calcula metiendo en Excel esta fórmula precedida del signo igual. 325 00:48:55,719 --> 00:49:02,719 Es decir, yo tengo que meter distr.t.invertida y tengo que teclear. 326 00:49:03,460 --> 00:49:11,820 Af alfa es el nivel de significación, es decir, 0,05 si estoy con un 95% o el que corresponda. 327 00:49:11,820 --> 00:49:14,699 Y los grados de libertad es n-1. 328 00:49:15,139 --> 00:49:16,280 ¿Veis que os lo explico aquí? 329 00:49:17,079 --> 00:49:23,280 Luego, esta es la función de t de student de dos colas y me calcula la probabilidad. 330 00:49:23,719 --> 00:49:27,199 Esta función en Excel sustituye el empleo de las tablas. 331 00:49:27,500 --> 00:49:31,539 Es decir, yo para calcular la t de student en Excel no tengo que utilizar las tablas. 332 00:49:32,199 --> 00:49:36,079 Y luego el intervalo de confianza yo lo puedo calcular de dos formas. 333 00:49:36,079 --> 00:49:46,980 con la función intervalo.confianza poniendo en el argumento el nivel de significación, la desviación estándar y el número de datos 334 00:49:46,980 --> 00:49:50,539 o puedo aplicar esta fórmula de cálculo. 335 00:49:51,679 --> 00:49:59,840 Aquí os he puesto un ejemplo resuelto que lo hemos hecho aquí en la hoja Excel que os he subido. 336 00:49:59,840 --> 00:50:16,599 Tenemos nuestros datos de nuestra muestra, el número de datos se calcularía con la función contar, que ya lo hemos visto al principio de la clase de hoy, la media con la función promedio y la desviación estándar. 337 00:50:16,599 --> 00:50:29,800 Porque yo sé que para calcular el intervalo de confianza cuando tengo 5 datos, que tengo menos de 50, pues tendría que aplicar la fórmula de la que desciuden. 338 00:50:30,579 --> 00:50:43,400 Luego, en este caso, yo calculo el nivel de significación alfa, si no me dicen nada, es el 0,05. ¿Por qué? Porque el nivel de confianza es del 95%. 339 00:50:43,400 --> 00:50:50,019 Veamos la descripción del problema y no lo dice en este caso. 340 00:50:50,219 --> 00:50:55,340 Expresar el resultado con un intervalo de confianza con un nivel de significación de 0,05. 341 00:50:55,340 --> 00:51:02,460 Me está diciendo de manera indirecta que el nivel de confianza está en 95%, 0,95. 342 00:51:03,159 --> 00:51:06,800 Entonces veis que esto que tenéis aquí es lo que yo os he puesto aquí. 343 00:51:07,360 --> 00:51:12,980 Luego mi nivel de significación es 0,05 que este lo tecleo yo tal cual. 344 00:51:12,980 --> 00:51:14,840 Veis que no tiene fórmula metida. 345 00:51:15,559 --> 00:51:21,320 Y para calcular la T de Student, pues incluyo la fórmula que tenéis aquí. 346 00:51:21,960 --> 00:51:29,980 Veis que es la distribución T invertida con 0,05 y los grados de libertad. 347 00:51:30,659 --> 00:51:40,619 Es decir, D5 es esta celda, que es alfa, y luego veis que es D2 menos 1. 348 00:51:40,619 --> 00:51:42,900 de su 2 es el número de datos 349 00:51:42,900 --> 00:51:45,519 5 menos 1 es n menos 1 350 00:51:45,519 --> 00:51:48,079 luego cuando yo esta función 351 00:51:48,079 --> 00:51:50,119 la tecleo tal cual 352 00:51:50,119 --> 00:51:51,880 veis, si yo pongo 353 00:51:51,880 --> 00:51:56,579 ya me van apareciendo aquí las distribuciones 354 00:51:56,579 --> 00:51:59,659 yo tengo que poner la de t de student 355 00:51:59,659 --> 00:52:02,280 veis que es 356 00:52:02,280 --> 00:52:03,840 distrib 357 00:52:03,840 --> 00:52:06,909 uy, perdonad 358 00:52:06,909 --> 00:52:09,849 tener cuidado con Excel cuando hacéis esto 359 00:52:09,849 --> 00:52:14,909 Si no os acordáis bien de la fórmula, borrar el signo igual para no confundiros. 360 00:52:15,750 --> 00:52:36,619 Vale, entonces sería punto T, perdonad, poner punto T punto INV y ahora a continuación yo pongo los grados de libertad, punto y coma, 361 00:52:36,619 --> 00:52:50,719 y a continuación pongo n-1, que puedo poner esta celda menos 1 o poner directamente 4, 5 menos 1, 4, cierro paréntesis 362 00:52:50,719 --> 00:52:56,780 y veis que este valor y este son iguales. Luego ya me ha calculado de esta forma la T de Stiuven. 363 00:52:57,340 --> 00:53:04,960 El intervalo de confianza lo puedo calcular de dos formas, aplicando la fórmula de la T de Stiuven. 364 00:53:04,960 --> 00:53:14,360 ¿Cuál es la T de Student? Pone D6. La celda D6 es la columna D y este número de aquí que es el 6. 365 00:53:15,000 --> 00:53:21,559 ¿Qué multiplica? La multiplicación va con el asterisco. ¿A qué multiplica la desviación estándar? 366 00:53:21,619 --> 00:53:27,179 Mi desviación estándar es esta, la de 4 dividido por la raíz. 367 00:53:27,380 --> 00:53:32,000 Cuando yo voy a calcular la raíz de un número pongo raíz, abro paréntesis y pongo el número. 368 00:53:32,000 --> 00:53:42,800 ¿Qué número quiero yo? De 2, es decir, 5. Cierro paréntesis, le doy a Enter y me calcula la desviación, perdón, el intervalo de confianza. 369 00:53:43,219 --> 00:53:58,579 Se puede calcular de esta forma o se puede calcular poniendo esta otra fórmula, intervalo.confianza.t o bien la que os he puesto aquí. 370 00:53:59,199 --> 00:54:10,440 Tenéis que tener cuidado porque muchas veces un parámetro estadístico, como puede ser un intervalo de confianza, en Excel puede calcularse de varias formas. 371 00:54:11,800 --> 00:54:17,579 Puede calcular con la fórmula que hemos visto hace unos minutos o bien con funciones estadísticas. 372 00:54:18,340 --> 00:54:24,780 Y lo que tenéis que tener muy claro es cuál es el argumento de la función estadística a introducir. 373 00:54:24,780 --> 00:54:36,860 Una vez que yo ya tengo todos los datos, el resultado es el valor medio, 0,105, que lo tenéis aquí, más o menos el intervalo de confianza con una cifra significativa. 374 00:54:37,460 --> 00:54:41,199 Esto se teclea tal cual, esto no tiene ninguna fórmula. 375 00:54:41,679 --> 00:54:48,820 Esta es la forma de resolverlo utilizando la hoja de cálculo, que la tenéis también resuelta. 376 00:54:48,820 --> 00:54:56,260 Y ya tenéis la forma analítica con la fórmula y la utilización de las tablas y cómo lo resolveríamos en la hoja Excel. 377 00:54:57,260 --> 00:54:59,820 Cierro aquí, le doy a no guardar. 378 00:55:01,300 --> 00:55:08,699 Esto, insisto, lo tenéis subido en la parte que he denominado práctica con la hoja de datos. 379 00:55:09,219 --> 00:55:13,780 Y sería la parte referente a intervalos de confianza. 380 00:55:13,780 --> 00:55:27,500 En este apartado a medida que vayamos avanzando en teoría con cálculos o iré subiendo la parte correspondiente a la hoja Excel para que vayáis familiarizándoos con los dos métodos analíticos. 381 00:55:27,500 --> 00:55:43,019 Deciros que en el examen os daré las tablas que vais a tener que utilizar, no tenéis que traerlas vosotros. Os daré las tablas que vais a utilizar en cada caso para que lo vayáis teniendo en cuenta. 382 00:55:43,780 --> 00:56:05,579 Bien, pues una vez que ya hemos visto la utilización de la hoja de cálculo y la prueba del sesgo, antes de pasar a lo que es la parte de los datos anómalos, vamos a ver la propagación de incertidumbres en lo que queda de videoconferencia de hoy. 383 00:56:05,579 --> 00:56:19,019 Bien, una vez que ya hemos visto en qué consiste la determinación del sesgo, para calcular la propagación de incertidumbres también se utiliza el intervalo de confianza. 384 00:56:19,699 --> 00:56:27,619 Mirad, cuando vosotros estáis trabajando en el laboratorio, la cantidad de analito o la cantidad de sustancia o de compuesto que queremos determinar 385 00:56:27,619 --> 00:56:37,920 se va a calcular utilizando siempre una serie de operaciones matemáticas, una serie de sumas, rectas, multiplicaciones o divisiones 386 00:56:37,920 --> 00:56:50,460 que van a corresponder también a una serie de operaciones que yo voy a tener que ir desarrollando a la hora que yo hago ese análisis químico. 387 00:56:50,460 --> 00:57:02,460 Cada uno de los datos que yo extraigo de esas operaciones, ya sea una pesada, una dilución, etc., van a llevar una desviación estándar asociada. 388 00:57:02,460 --> 00:57:18,639 Y insisto que la desviación estándar es el parámetro estadístico que me relaciona la incertidumbre y la precisión. La precisión está muy vinculada con el aparato o el instrumental de laboratorio que yo voy a utilizar. 389 00:57:18,639 --> 00:57:36,260 Entonces cuando yo voy a estimar la incertidumbre de una medida tengo que considerar todos los componentes que tienen influencia significativa en esa medida utilizando los métodos analíticos adecuados. 390 00:57:36,260 --> 00:57:49,119 se debe de realizar una estimación preliminar de cómo contribuye cada componente, cada aparato por ejemplo, cada instrumento o combinación de componentes en esa incertidumbre. 391 00:57:49,119 --> 00:57:58,159 Es decir, porque yo voy a ir arrastrando precisiones, porque cada aparato tiene una precisión distinta, es decir, yo voy a ir arrastrando incertidumbres. 392 00:57:58,159 --> 00:58:17,639 Es decir, la información que yo voy a utilizar del uso de distintos aparatos y materiales de laboratorio, esa información, por ejemplo, de las medidas de masa, la precisión me la va a dar la balanza analítica o el granatario. 393 00:58:17,639 --> 00:58:33,519 La medida de volumen, qué precisión es la que yo voy a ir arrastrando en mis operaciones, ya sean analíticas y luego matemáticas, pues me vendrá indicada en las buretas, pipetas, matraces aforados o probetas. 394 00:58:33,519 --> 00:58:57,940 La medida de temperatura, la precisión me la dará el termómetro y luego cuando estoy realizando otro tipo de determinaciones relacionadas con la naturaleza y la composición de los sistemas químicos, pues tendré que utilizar aparatos como pHímetros, conductímetros, espectrofotómetros, etcétera, que también llevan asociada su precisión o su incertidumbre. 395 00:58:58,940 --> 00:59:04,219 Es decir, la incertidumbre siempre va a estar relacionada con un proceso de medida. 396 00:59:04,599 --> 00:59:07,780 En un proceso de medida yo voy a utilizar instrumentos. 397 00:59:07,780 --> 00:59:12,780 El instrumento va a tener una sensibilidad y una precisión. 398 00:59:13,719 --> 00:59:18,659 Es decir, a mayor sensibilidad el instrumento será más preciso. 399 00:59:18,659 --> 00:59:30,820 Un instrumento de medida es tanto más sensible cuanto más pequeña sea la cantidad que puede medir y será más preciso. 400 00:59:31,400 --> 00:59:46,440 Cuando yo realizo operaciones con datos experimentales y yo quiero calcular cómo los errores se me van a ir propagando a medida que yo voy avanzando en cada una de esas operaciones de laboratorio, 401 00:59:46,440 --> 00:59:52,920 tenéis que tener en cuenta que el resultado final que yo dé de un análisis 402 00:59:52,920 --> 00:59:59,000 no puede exceder a la precisión que tiene el aparato que yo he usado 403 00:59:59,000 --> 01:00:01,820 si he usado un único aparato o a la precisión usada 404 01:00:01,820 --> 01:00:07,559 es decir, no tiene sentido que yo esté realizando por ejemplo la medición de una muestra 405 01:00:07,559 --> 01:00:14,300 y utilice una balanza que tiene una precisión de las milésimas 406 01:00:14,300 --> 01:00:23,480 y el resultado débil, pesada, tenga 1, 2, 3, 4, 5 y 6 cifras significativas. 407 01:00:23,699 --> 01:00:25,179 Eso es lo que no tiene sentido. 408 01:00:25,719 --> 01:00:31,579 Yo tengo siempre que tener muy en cuenta la precisión de los aparatos que estoy utilizando 409 01:00:31,579 --> 01:00:37,760 para poder luego ajustar el parámetro correspondiente a la incertidumbre 410 01:00:37,760 --> 01:00:41,059 con el número de cifras significativas que sean concordantes. 411 01:00:41,059 --> 01:01:00,199 Por ello tenemos que tener en cuenta que los errores se propagan con las operaciones analíticas y también con las operaciones aritméticas, sumas, restas, multiplicaciones y divisiones que yo voy a ir haciendo a lo largo de mi análisis y en esto es en lo que consiste la propagación de incertidumbres. 412 01:01:00,199 --> 01:01:08,000 es decir, cómo se van a ir calculando las distintas o cómo voy a ir arrastrando en mis distintas operaciones de laboratorio 413 01:01:08,000 --> 01:01:13,000 y operaciones aritméticas esas incertidumbres o precisiones. 414 01:01:14,139 --> 01:01:21,480 Luego, ¿cuáles son las reglas que vamos a aplicar para estimar los errores que se cometen en las operaciones matemáticas? 415 01:01:21,960 --> 01:01:29,300 Para ello se va a utilizar la nomenclatura con mayúsculas A, B y C para el resultado de las medidas, 416 01:01:29,300 --> 01:01:37,300 Es decir, los datos que yo he obtenido de mis distintos instrumentos analíticos y con los que yo voy a operar. 417 01:01:37,460 --> 01:01:50,059 Con las letras minúsculas, A minúscula, B y C minúscula, voy a hacer referencia a las imprecisiones que van asociadas a los resultados que yo he obtenido. 418 01:01:50,179 --> 01:01:57,860 Ya sabemos que el resultado siempre se expresa por el valor obtenido más menos la imprecisión. 419 01:01:57,860 --> 01:02:02,920 RF es el resultado de la operación que yo he hecho 420 01:02:02,920 --> 01:02:06,260 si es una suma, una resta, multiplicación o división 421 01:02:06,260 --> 01:02:11,860 e I es el resultado de la operación con la imprecisión 422 01:02:11,860 --> 01:02:15,300 luego el resultado final sería RF 423 01:02:15,300 --> 01:02:18,519 que es el resultado de la operación 424 01:02:18,519 --> 01:02:20,639 acompañado de su incertidumbre 425 01:02:20,639 --> 01:02:24,659 por ejemplo, cuando estamos con sumas o restas 426 01:02:24,659 --> 01:02:26,559 ¿cómo calculamos RF? 427 01:02:26,559 --> 01:02:30,820 Pues sumando la parte correspondiente al resultado que yo he obtenido. 428 01:02:31,099 --> 01:02:33,760 Es decir, Rf sería a más b más t. 429 01:02:34,480 --> 01:02:45,099 Y su imprecisión se calcula como la suma de los cuadrados de las imprecisiones asociadas a cada medida 430 01:02:45,099 --> 01:02:51,219 y todo ello elevado a un medio o raíz cuadrada. 431 01:02:51,219 --> 01:03:00,059 Cuando yo voy a realizar producto o cocientes, por ejemplo voy a multiplicar A que multiplica B partido por C 432 01:03:00,059 --> 01:03:08,760 Aquí tenéis la fórmula de aplicación de cómo se calcularía la incertidumbre asociada 433 01:03:08,760 --> 01:03:19,960 Esto al final consiste sencillamente en aplicar las fórmulas teniendo claro cuál es la parte correspondiente al resultado 434 01:03:19,960 --> 01:03:22,699 y cuál es la parte correspondiente a la imprecisión. 435 01:03:22,699 --> 01:03:28,659 Es la única manera de dar al final el resultado correcto de esta forma. 436 01:03:28,940 --> 01:03:34,159 La fórmula que tiene a la parte izquierda el resultado de la operación 437 01:03:34,159 --> 01:03:37,280 y a la parte derecha la precisión, 438 01:03:37,659 --> 01:03:41,719 teniendo en cuenta las cifras significativas que se tienen que dar 439 01:03:41,719 --> 01:03:43,780 y que se indicarán correspondientemente. 440 01:03:44,980 --> 01:03:48,980 Muy bien, lo vamos a dejar aquí para continuar en la siguiente videoconferencia 441 01:03:48,980 --> 01:03:53,199 con la determinación de los datos anómalos. 442 01:03:53,199 --> 01:03:58,539 Es decir, cómo vamos en una serie de datos a detectar un dato erróneo 443 01:03:58,539 --> 01:04:03,420 y qué parámetros o pruebas vamos a aplicar para aceptarlo o rechazarlo 444 01:04:03,420 --> 01:04:07,300 y si lo rechazamos lo eliminamos de nuestra serie de datos 445 01:04:07,300 --> 01:04:11,199 para el resto de cálculos que tengamos que realizar a posteriori. 446 01:04:12,300 --> 01:04:13,320 Muchísimas gracias.