1 00:00:00,300 --> 00:00:13,240 Vale, ya estamos. Muy bien, pues nada, lo que os he comentado es relativo a las prácticas que ya os lo indicaremos más adelante y vamos a continuar con lo que nos quedamos la semana pasada. 2 00:00:13,240 --> 00:00:35,219 Os he actualizado este apartado que tenéis aquí. Bueno, debajo de la descripción de todas las videoconferencias sí que os incluyo lo que hay en esa videoconferencia en concreto. Yo que sé, por si alguno quiere repasar y quiere ir directamente a un tema, lo tenéis escrito en la descripción. 3 00:00:35,219 --> 00:01:03,259 Y aparte, en el planning este que tenemos hecho, que no seguimos al pie de la letra, pero bueno, vamos bastante bien, la semana pasada estuvimos terminando con la parte de rechazo de resultados dudosos, que habíamos visto que teníamos unos test que están basados en tablas y otros test que están basados en intervalos de confianza. 4 00:01:05,219 --> 00:01:10,719 Hoy vamos a empezar con otro tipo de test estadísticos que es para comparar series de valores. 5 00:01:12,400 --> 00:01:18,420 Vamos a hacer primero una recapitulación de lo anterior, lo que os acabo de decir. 6 00:01:18,939 --> 00:01:28,159 Cuando tenemos una serie de datos y alguno vemos que es anómalo, que es demasiado grande o demasiado pequeño en relación al resto, 7 00:01:28,159 --> 00:01:33,099 podemos evaluar mediante distintos métodos estadísticos, matemáticos, 8 00:01:33,099 --> 00:01:43,200 si ese resultado lo tenemos que eliminar o no, si ese resultado sí que es normal, forma parte de nuestra población o si está fuera y directamente lo quitamos 9 00:01:43,200 --> 00:01:56,400 porque nos está estropeando los resultados de nuestro ensayo. Entonces, teníamos los basados en tablas, Brooks y Dixon, por ejemplo, Carolina, que me has preguntado, 10 00:01:56,400 --> 00:02:15,159 La comparación interlaboratorios, que si os acordáis lo vimos al principio del todo en la parte de calidad, estos ejercicios de intercomparación en los que se evaluaban las capacidades de distintos laboratorios. Aquí si hay que aplicar este criterio como algo oficial es el más habitual, el de Bush. 11 00:02:15,159 --> 00:02:32,039 ¿Vale? El de la CUDA Dixon es el que más utilizamos habitualmente. Si estamos en el laboratorio, estamos haciendo una serie de medidas y dudamos en una, lo más habitual es que utilicemos este. ¿Vale? Y luego, bueno, los demás eso nos los tienen que indicar. ¿Vale? 12 00:02:32,039 --> 00:02:53,259 Lo que teníamos que tener aquí muy claro es que si utilizamos estos métodos, los que están basados en tablas, el valor del que tenemos sospecha sí que lo vamos a utilizar cuando hagamos nuestros cálculos, ¿vale? Por ejemplo, esta S de aquí, la desviación, para calcularla, el valor del que yo dudo sí que lo meto, ¿vale? 13 00:02:53,259 --> 00:03:14,259 En cambio, cuando utilizamos los métodos basados en intervalos de confianza, que son menos habituales, ¿vale? Cuando calculamos nuestra media y nuestra desviación, lo hacemos quitando el dato sospechoso, ¿vale? Y aquí, cuando calculamos nuestra desviación típica o estándar, lo mismo, no consideramos el dato sospechoso. 14 00:03:14,259 --> 00:03:20,500 sospechosos. Entonces, resumiendo otra vez mucho, el procedimiento de los que están basados en tablas 15 00:03:20,500 --> 00:03:27,379 es calcular este parámetro estadístico para los datos que yo tengo y después compararlo con el 16 00:03:27,379 --> 00:03:33,060 que hay en las tablas. Si el que yo he calculado es más pequeño que el que está en la tabla, el 17 00:03:33,060 --> 00:03:40,620 resultado lo acepto, si no, lo rechazo. Ese era un poco el resumen. Entonces, esa es la primera 18 00:03:40,620 --> 00:03:47,719 parte de una de las aplicaciones que le podemos dar a esta estadística inferencial que vimos 19 00:03:47,719 --> 00:03:55,120 al principio y la otra es, otra de ellas es la que vamos a ver a continuación, que es 20 00:03:55,120 --> 00:04:04,740 la comparación de series de valores. Se nos puede dar habitualmente que nosotros tengamos 21 00:04:04,740 --> 00:04:10,379 por ejemplo dos métodos, lo que os he comentado antes con la práctica de laboratorio. Tenemos 22 00:04:10,379 --> 00:04:25,060 Es un mismo proceso que podemos llevar a cabo de dos maneras diferentes, con dos métodos distintos. Y queremos saber si esos métodos tienen una precisión que sea comparable. ¿Os acordáis del concepto de precisión? 23 00:04:25,060 --> 00:04:39,529 La precisión era cómo de dispersos están nuestros datos. Una manera de evaluarlo era a través de la desviación o la varianza, 24 00:04:39,670 --> 00:04:44,610 que lo que nos indica es cómo de separados están las distintas medidas que nosotros hemos hecho. 25 00:04:45,870 --> 00:04:52,970 En el caso de la diana, acordaos que si tenemos todos los dardos muy pegados tenemos mucha precisión. 26 00:04:52,970 --> 00:05:06,889 La exactitud en cambio era dar en el centro de la diana, que nuestro valor, nuestro resultado esté muy muy cerca del valor real. Entonces, ¿cómo evaluamos si estos dos métodos tienen realmente la misma precisión? 27 00:05:06,889 --> 00:05:25,290 Lo que hacemos es comparar sus varianzas, comparar cómo de dispersos son los resultados que nos dan, ¿vale? Entonces, para ello utilizamos una prueba que se llama la prueba F y es un test, igual que el de Dixon y el de Grubbs, que lo que se basa es en calcular un estadístico, ¿vale? 28 00:05:25,290 --> 00:05:44,269 Y después compararlo con el de la tabla. Ok, entonces, cuando nosotros comparamos dos varianzas tenemos que plantearnos unas hipótesis, ¿no? Acordaos que planteamos la hipótesis nula y una hipótesis alternativa. 29 00:05:44,269 --> 00:05:51,949 Hacemos nuestra prueba y luego decidimos si aceptamos la nula o la rechazamos y aceptamos la alternativa. 30 00:05:51,949 --> 00:06:10,089 ¿Vale? Entonces, en el caso de cuando comparamos dos varianzas, acordaos que varianza, esto es un fallo muy habitual, acordaos que varianza es S al cuadrado, ¿vale? En un examen nos pueden dar perfectamente como dato la desviación típica. 31 00:06:10,089 --> 00:06:26,970 Es un error muy común no elevarla al cuadrado y no estar teniendo la varianza, ¿vale? Que es lo que estamos comparando. Entonces, nuestra hipótesis nula es que la varianza de nuestro primer resultado es igual que la del segundo, ¿vale? 32 00:06:26,970 --> 00:06:39,889 O sea, que de mi método 1 tiene la misma precisión que mi método 2, ¿vale? Y después tenemos una hipótesis alternativa que podemos plantear de dos maneras distintas, ¿vale? Esto es general para el contraste de hipótesis. 33 00:06:39,889 --> 00:06:45,990 Podemos plantear una hipótesis alternativa que sea, vale, la varianza 1 es distinta que la varianza 2. 34 00:06:46,970 --> 00:06:51,850 En ese caso sería bilateral. Solo quiero saber si son iguales o son distintos. 35 00:06:53,170 --> 00:06:58,550 O puedo querer decir si una de ellas es mayor que la otra. En ese caso es unilateral. 36 00:06:58,550 --> 00:07:09,689 Yo quiero comparar si, como hipótesis nula, la varianza de mi primer método es igual que la varianza de mi segundo método. 37 00:07:09,889 --> 00:07:13,269 Y luego, como alternativa, puedo elegir cómo plantearla, ¿vale? 38 00:07:14,089 --> 00:07:22,069 En el caso, cuando comparamos varianzas, utilizamos siempre esta de aquí por una cuestión de qué es lo que se utiliza por practicidad, ¿no? 39 00:07:22,069 --> 00:07:26,110 Porque es como tenemos las tablas establecidas, ¿vale? Ahora os explico por qué. 40 00:07:26,850 --> 00:07:29,769 Entonces, ¿cómo calculamos nuestro parámetro f? 41 00:07:30,930 --> 00:07:38,889 Lo que hacemos es coger una varianza y dividirla entre la otra y siempre ponemos arriba en el numerador la mayor, ¿vale? 42 00:07:38,889 --> 00:08:07,670 Así conseguimos que nuestra f sea siempre mayor que uno, que es como esta tabulada, ¿vale? Entonces, cogemos, si tenemos dos series de datos, calculamos para cada una de ellas la varianza, dividimos la mayor entre la menor y buscamos en la tabla el valor de esa f, la tabulada, nosotros hemos calculado uno y vamos a buscar la tabulada. 43 00:08:07,670 --> 00:08:11,290 ¿Y cómo la buscamos? En función de los grados de libertad. 44 00:08:12,550 --> 00:08:16,649 Acordaos que los grados de libertad, en este caso, tenemos dos series de valores. 45 00:08:17,490 --> 00:08:22,810 Para cada uno de las series de valores, los grados de libertad es n-1. 46 00:08:23,129 --> 00:08:29,970 Por ejemplo, si yo estoy comparando una serie de 10 mediciones y otra serie de 8 mediciones, 47 00:08:29,970 --> 00:08:34,610 Los grados de libertad de la primera serán 10 menos 1, 9 48 00:08:34,610 --> 00:08:37,850 Y los de la segunda, 8 menos 1, 7 49 00:08:37,850 --> 00:08:42,750 ¿Vale? Muy bien, pues yo calculo mi F y me voy a mi tabla 50 00:08:42,750 --> 00:08:46,750 Que la tengo aquí abierta, creo 51 00:08:46,750 --> 00:08:51,950 Y veis que aquí, ¿lo veis verdad? ¿Me podéis confirmar alguien que me estáis viendo la pantalla? 52 00:08:54,009 --> 00:08:54,549 Sí, se ve 53 00:08:54,549 --> 00:09:14,830 Aquí tenemos la F al alfa 0,05, que acordaos que es la significación que utilizamos por defecto, ¿no? Si no nos dicen nada, al 95%. Luego tenemos otra, por ejemplo, aquí abajo, que es al 0,01, al 99%, ¿vale? 54 00:09:15,429 --> 00:09:17,629 Entonces, ¿cómo se interpreta esta tabla? 55 00:09:18,750 --> 00:09:26,450 Si lo veis aquí, en las columnas se encuentran los valores, los grados de libertad del numerador 56 00:09:26,450 --> 00:09:30,590 y en los renglones los grados de libertad del denominador, ¿vale? 57 00:09:30,809 --> 00:09:39,669 Entonces, si yo por ejemplo tengo en el numerador que eran 10 mediciones, son los grados de libertad 9 58 00:09:39,669 --> 00:09:43,029 y en el denominador que eran 8, grados de libertad 7. 59 00:09:43,029 --> 00:10:05,309 Pues mi parámetro f sería 4,10. ¿Qué hago luego? Pues lo de siempre. Si yo he calculado mi f y este resultado de aquí que yo he calculado de dividir mis varianzas es menor que 4,10, que es lo que está en la tabla, puedo decir que acepto la hipótesis nula. 60 00:10:05,309 --> 00:10:30,370 O sea, que esas varianzas sí que son iguales. Si no, la rechazo y digo que no son iguales. O sea, que si en un ejercicio me preguntan que compare la precisión de dos métodos, si este f calculado me da menor que el f tabulado, yo puedo decir que esos métodos sí tienen la misma precisión, porque sus varianzas podemos decir que son iguales, estadísticamente iguales. 61 00:10:30,370 --> 00:10:49,509 Esto siempre, a veces no digo la coletilla, pero obviamente si un valor es 7,83 y otro es 7,88, a simple vista ya sabemos que no es el mismo número, no son iguales, pero estadísticamente sí que podemos asumir que sean iguales, ¿no? Es a lo que se refiere. 62 00:10:49,509 --> 00:10:54,230 Esto parece un poco lío, pero si queréis hacemos un ejemplo antes de seguir. 63 00:10:55,049 --> 00:11:00,070 Imaginaos, por ejemplo, que yo tengo dos experimentos. 64 00:11:00,250 --> 00:11:04,750 Hago el método 1 y el método 2. 65 00:11:05,490 --> 00:11:07,710 En el método 1 tengo estos datos. 66 00:11:07,870 --> 00:11:16,450 Me los voy a inventar. 6 con 3, 6 con 4, 6 con 3 otra vez, 6 con 5, 6 con 6, 6 con 7. 67 00:11:16,450 --> 00:11:41,220 Y en el método 2 tengo 6.1, 6.7, 6.5, 6.9, 7.2, 6.0, 6.3, 6.4. 68 00:11:41,220 --> 00:11:51,700 Por ejemplo, ¿vale? Este es un método, este es otro método, he medido el parámetro que sea, imaginaos que es concentración, pH, lo que queráis, y he obtenido estos resultados. 69 00:11:51,700 --> 00:12:02,480 Pues voy a calcular para cada uno de ellos la varianza. Calculo, esto lo hacéis con la calculadora, la varianza de esta serie de valores. 70 00:12:02,480 --> 00:12:08,519 Y calculo la varianza de esta serie de valores. 71 00:12:10,899 --> 00:12:20,860 Y me sale que la varianza del primero son 0,038 y la del segundo 0,18. 72 00:12:21,519 --> 00:12:24,419 Ya tengo mis dos varianzas, ¿ahora qué tengo que hacer? 73 00:12:24,899 --> 00:12:25,679 Calcular f. 74 00:12:26,379 --> 00:12:27,679 ¿Y f cómo se calcula? 75 00:12:28,080 --> 00:12:30,299 Dividiendo una varianza entre la otra. 76 00:12:30,299 --> 00:12:47,460 Siempre elijo la mayor en el numerador. En este caso dividiré esta de aquí entre esta de aquí. Y me sale que mi f es 4.8. Ya tengo mi f calculada. 77 00:12:47,460 --> 00:12:57,659 Esta es la F calculada. ¿Ahora qué tengo que hacer? Comparar con la F tabulada. ¿Cómo hago eso? Yéndome a la tabla. 78 00:12:58,299 --> 00:13:06,200 Y lo primero de todo, voy a ver cuántas mediciones tengo en cada uno de mis métodos para ver cómo tengo que buscar en la tabla. 79 00:13:06,200 --> 00:13:29,899 Y tengo en cada una de ellas, tengo 7, ¿no? 7 mediciones, 7 y 7. Por lo tanto, n igual a 7, n igual a 7. Y grados de libertad del primero, 6, 7 menos 1. Y del segundo, lo mismo. 80 00:13:29,899 --> 00:13:44,460 ¿no? Grados de libertad, 6, ¿vale? Esto puede ser, algunas veces me pueden dar que los dos métodos se han hecho el mismo número de mediciones y otras veces que se han hecho distintas, ¿no? 81 00:13:44,899 --> 00:13:55,879 Acordaos que la tabla tiene las dos posibilidades, ¿no? De este método podría haber hecho 15 mediciones y de este 10, por ejemplo, ¿vale? Pero bueno, en este caso hemos hecho 7 de cada uno, 82 00:13:55,879 --> 00:14:07,419 o sea que son 6 grados de libertad para cada uno, he calculado mi F dividiendo la varianza más grande entre la varianza más pequeña y ahora me voy a la tabla. 83 00:14:08,440 --> 00:14:22,960 Entonces, en mi tabla, para 6 grados de libertad en el numerador y 6 en el denominador, me da que mi F tabulada son 4,28. 84 00:14:22,960 --> 00:14:44,820 ¡Joder, qué parecido! Mi F tabulada son 4,28. Todos hemos visto cómo hemos cogido la F, ¿no? Simplemente en la tabla, numerador y denominador. En este caso, en ambos será 6. 6, 6, 4,28. 85 00:14:44,820 --> 00:14:55,440 Ok, entonces, a la vista de estos resultados, si yo os pregunto si estos dos métodos tienen la misma precisión, ¿cuál sería la respuesta? 86 00:15:01,460 --> 00:15:02,480 ¿Se rechaza el dato? 87 00:15:03,419 --> 00:15:03,879 ¿Perdón? 88 00:15:06,419 --> 00:15:09,779 Se rechaza la hipótesis, sí. 89 00:15:09,779 --> 00:15:28,779 Los dos métodos, o sea, se rechaza la hipótesis nula. Los dos métodos no tienen la misma precisión. Se ha rechazado la hipótesis nula, que me decía que ambas varianzas eran iguales. 90 00:15:28,779 --> 00:15:43,450 pero como la F que yo he calculado es mayor que la tabulada, lo rechazo y eso quiere decir que los métodos no tienen la misma precisión. 91 00:15:43,450 --> 00:16:00,460 Hay un método que es más preciso que el otro, porque F calculada es mayor que F tabulada. 92 00:16:00,460 --> 00:16:26,740 ¿Vale? Imaginaos que en vez de tener 6 medidas, esto fuese la varianza, pero yo hubiese hecho 15 medidas. Pues me voy aquí, 16 medidas, 16, 16, perdón, 15, 15, porque 16 medidas, los grados de libertad son 15 y 15, y me da 2,35. 93 00:16:26,740 --> 00:16:44,980 5. Claro, no, peor todavía. Es más pequeño, lo sigo rechazando. Si se diese el caso, por ejemplo, de que he hecho muy poquitas medidas, de que he hecho solo 5 medidas, el valor de 4,4, de los grados de libertad, me da 6,39. 94 00:16:44,980 --> 00:16:57,600 En ese caso, por ejemplo, sí que podría decir que como mi F calculada es menor que la tabulada, acepto la hipótesis nula y digo que sí que las varianzas son iguales. 95 00:17:02,039 --> 00:17:03,500 Estas son las varianzas. 96 00:17:09,460 --> 00:17:11,220 ¿Alguna duda hasta aquí? 97 00:17:11,220 --> 00:17:37,200 Bien, lo que tenemos que hacer cuando nos enfrentamos a un ejercicio de este estilo es ver qué nos están pidiendo y ver los datos que tenemos. Tenemos una serie de mediciones, yo en cuanto tenga una serie de datos, yo puedo calcular la media, la moda, la mediana, la desviación típica, la varianza, con todos estos datos y con estos igual. 98 00:17:37,200 --> 00:18:02,359 Entonces, en este caso, si me piden que compare precisiones, me están pidiendo que compare las varianzas y lo hago con la prueba f. Mi f es s cuadrado del primero entre s cuadrado del segundo, siendo siempre la varianza que pongo arriba, en la parte de arriba de la fórmula, siempre la varianza que sea mayor. 99 00:18:02,359 --> 00:18:06,039 ¿Vale? Aquí pongo la mayor y aquí la menor 100 00:18:06,039 --> 00:18:08,880 Si tienen, por ejemplo, distinto número de medidas 101 00:18:08,880 --> 00:18:13,039 ¿No? Acordaos que nuestra tabla nos dice 102 00:18:13,039 --> 00:18:15,980 Los grados de libertad del numerador y del denominador 103 00:18:15,980 --> 00:18:19,539 Tengo que fijarme bien de cuántas medidas tengo de cada una de estas 104 00:18:19,539 --> 00:18:20,579 De la 1 y de la 2 105 00:18:20,579 --> 00:18:26,099 ¿Vale? Entonces, nada, hacemos esta prueba 106 00:18:26,099 --> 00:18:29,059 Y aceptamos o rechazamos la hipótesis nula 107 00:18:29,059 --> 00:18:31,059 ¿Vale? Aquí tenéis la tabla 108 00:18:31,059 --> 00:18:50,420 ¿Ves? Grados de libertad del numerador y aquí los del denominador. Entonces, si por ejemplo el valor que yo he puesto en la parte de arriba de la fórmula, en el numerador, como tiene una varianza mayor, lo he puesto arriba y imaginaos que tiene eso, pues 8 mediciones. 109 00:18:50,420 --> 00:19:06,140 Y el que he puesto abajo, que tiene una varianza más pequeña, tiene 7 mediciones. Pues tendré que buscar grados de libertad del numerador 8, menos 1, 7 y del denominador 7, menos 1, 6. Tendría que buscar este valor de aquí. 110 00:19:06,140 --> 00:19:13,819 Porque los grados de libertad son n-1 en el numerador y n-1 en el denominador. 111 00:19:19,140 --> 00:19:33,730 Entonces, esa era una de las primeras aplicaciones y ahora vamos a la siguiente, que también es muy habitual, que es comparación de un resultado con un valor de referencia. 112 00:19:33,730 --> 00:19:54,849 Esto cuando se utiliza, por ejemplo, un accidente de tráfico y hay una persona que está involucrada en un accidente y le hacen un análisis de sangre y sale un valor de alcohol. 113 00:19:54,849 --> 00:20:06,910 Y se quiere saber si estadísticamente se puede asumir que el valor ese que nosotros hemos obtenido está por encima del valor de referencia. 114 00:20:08,269 --> 00:20:11,349 Otro caso que igual es más fácil de entender. 115 00:20:12,029 --> 00:20:20,670 Si tenemos por ley que en el etiquetado de un producto sin gluten, por ejemplo, algún tipo de alérgeno, 116 00:20:20,670 --> 00:20:39,150 La concentración de gluten tiene que ser menor de 0,01 ppm. Nosotros podemos hacer una serie de mediciones sobre ese producto y después hacer la media de esas mediciones y estadísticamente compararlo con el valor de referencia. 117 00:20:39,150 --> 00:20:44,150 Y así podemos saber si estadísticamente estamos cumpliendo con la ley o no. 118 00:20:47,009 --> 00:20:50,210 Entonces, el proceso exactamente igual que con la… 119 00:20:50,210 --> 00:20:50,910 Elena, perdona. 120 00:20:50,970 --> 00:20:51,130 Sí. 121 00:20:52,250 --> 00:20:57,349 Hay tablas de estas de los valores de F de una cola y de dos colas. 122 00:20:57,470 --> 00:20:58,609 ¿Da igual la que utilicemos? 123 00:20:59,089 --> 00:21:05,849 No, normalmente, o sea, hay de dos colas, pero no se utiliza normalmente. 124 00:21:05,849 --> 00:21:10,809 Entonces, por lo general, en la prueba F es la única que por defecto utilizamos la de una cola. 125 00:21:11,970 --> 00:21:25,130 Esto es lo que se hace habitualmente y ya relativo al examen, todos los ejercicios que tengan que ver con tablas, 126 00:21:25,130 --> 00:21:32,490 quiero decir, que haya dos niveles de significación o que haya una o dos colas, eso va a estar muy bien definido en el enunciado. 127 00:21:32,710 --> 00:21:35,809 No se va a dejar nada al aire porque si no es muy lioso. 128 00:21:35,809 --> 00:21:40,210 pero en el aula virtual creo que solo os he subido la de una cola 129 00:21:40,210 --> 00:21:43,549 porque es que a diferencia de otras tablas como la T de Student 130 00:21:43,549 --> 00:21:45,309 que son totalmente simétricas 131 00:21:45,309 --> 00:21:48,369 la de la F, si os dais cuenta 132 00:21:48,369 --> 00:21:51,410 es un poco diferente 133 00:21:51,410 --> 00:21:56,130 entonces la que se utiliza habitualmente es la de una cola 134 00:21:56,130 --> 00:21:57,589 entonces las varianzas 135 00:21:57,589 --> 00:22:03,490 ahora veremos que al utilizar una cola o dos colas 136 00:22:03,490 --> 00:22:09,589 lo único que cambia es la tabla en la que miramos al final, que el resto del procedimiento es el mismo. 137 00:22:10,130 --> 00:22:17,410 Y lo que pasa, por ejemplo, cuando utilizamos la TED Student de una o dos colas, es que uno es un poco más restrictivo que el otro, 138 00:22:17,569 --> 00:22:24,609 pero el procedimiento es el mismo y en la mayoría de los casos, de hecho, si rechazamos con una cola, rechazamos con dos y viceversa. 139 00:22:24,609 --> 00:22:38,549 Pero bueno, como norma general, para el valor de F vamos a tomar el de una cola y la significación 0,05. Aunque sí que existen otras tablas, pero bueno, como referencia. 140 00:22:39,410 --> 00:22:40,009 Vale, gracias. 141 00:22:40,009 --> 00:23:06,410 Nada, luego en la TED Students sí que vamos a utilizar la de una y la de dos colas. La que tenéis subida en el aula virtual, aquí en tablas, tenéis directamente dentro de una misma tabla de la TED Students nivel de significancia de dos colas si lo miráis desde arriba y si lo miráis desde abajo tenéis la de una cola. 142 00:23:06,410 --> 00:23:26,269 ¿Por qué? Porque realmente es la misma tabla, solo que como aquí estamos considerándose en un lateral y aquí los dos, esto se duplica. Esto que aquí es 0,1 en dos colas es 0,05 en una cola. Por eso podemos utilizar la misma tabla. 143 00:23:26,269 --> 00:23:43,789 Bien, os estoy liando con esto, ahora vemos la aplicación práctica, ¿vale? Que igual es más sencillo. Entonces, porque vamos a utilizar la T para lo de la comparación con un valor de referencia, ¿vale? 144 00:23:44,390 --> 00:23:52,630 Entonces, cuando nosotros queremos comparar eso, tenemos un valor de referencia, un valor fijo, un valor, como si fuera un patrón, por ejemplo, 145 00:23:53,269 --> 00:24:02,170 y queremos comparar una serie de medidas que nosotros hemos hecho y queremos decir si son iguales que ese valor o distintas o mayores o menores, ¿vale? 146 00:24:02,170 --> 00:24:11,619 Tenemos que plantear nuestra hipótesis. Nuestra hipótesis nula, como siempre, va a ser que sí que son iguales, 147 00:24:11,619 --> 00:24:27,920 Que la media de mis datos es igual que el valor de referencia. Y luego, como hipótesis alternativa, podemos plantear que la media de mis datos es mayor que el de referencia o menor, dependiendo. 148 00:24:27,920 --> 00:24:44,160 Esto se plantea una de las dos, ¿no? Imaginaos, el valor de referencia es 5 y mi media es 4,5. Pues, hombre, no tiene lógica que yo plantee esta de aquí. Plantearé esta o esta, ¿vale? 149 00:24:44,480 --> 00:24:56,880 Entonces, puedo plantear que la media de mis datos es mayor o menor que el valor de referencia, en función de si es mayor o menor, o simplemente puedo plantear que sea distinta, ¿vale? 150 00:24:56,880 --> 00:25:18,720 Planteo una hipótesis bilateral que simplemente me da igual que sea mayor o que sea menor, lo que quiero saber es que no es lo mismo. Esto lo único que cambia es que como en la tabla miramos en una columna o en otra, uno es un poco más restrictivo que el otro, ¿vale? Pero el procedimiento para hacer el ejercicio es exactamente el mismo, ¿vale? Para obtener nuestro parámetro. 151 00:25:19,319 --> 00:25:20,500 Entonces, ¿cómo lo hacemos? 152 00:25:22,160 --> 00:25:26,059 Bueno, las aplicaciones, lo que os he dicho, comprobar la evidencia de un error sistemático, 153 00:25:26,160 --> 00:25:32,140 decidir si una medida supera o no supera un valor determinado, por ejemplo, una referencia legal. 154 00:25:33,559 --> 00:25:34,700 Entonces, ¿cómo lo hacemos? 155 00:25:35,519 --> 00:25:39,700 Calculamos otro parámetro estadístico, igual que para las varianzas. 156 00:25:40,359 --> 00:25:44,259 Calculábamos la F, ahora calculamos la T, que es la T de Student, 157 00:25:44,440 --> 00:25:46,500 la que hemos estado utilizando para los intervalos de confianza. 158 00:25:46,500 --> 00:26:02,140 Y daos cuenta que cuando nosotros calculábamos nuestro intervalo de confianza, ¿qué hacíamos? Hacíamos mi valor es x media más menos t por s dividido entre raíz de n. 159 00:26:02,140 --> 00:26:09,759 Entonces, al final, esto es despejar la T de esa ecuación, ¿vale? De nuestra ecuación del intervalo de confianza. 160 00:26:09,759 --> 00:26:31,900 Bueno, perdón, pero en este caso tenemos la T calculada, la que nosotros vamos a calcular para luego ver si es mayor o menor que la tabulada, lo que vamos a hacer es coger el valor de referencia menos la media de nuestros datos y todo ello en valor absoluto, ¿vale? 161 00:26:31,900 --> 00:26:47,339 Acordaos que la T siempre tiene que ser positiva. Entonces, me dé lo que me dé en positivo, valor absoluto. Lo divido entre S, la desviación de mi serie de datos, y esta S dividida entre raíz de N. 162 00:26:48,200 --> 00:26:50,900 Otra cosa que n es el número de mediciones. 163 00:26:51,500 --> 00:26:55,319 Y otra cosa también que tenéis que tener mucho cuidado, porque también es un fallo muy habitual, 164 00:26:55,819 --> 00:26:58,819 es que este raíz de n está aquí dividiendo, ¿vale? 165 00:26:58,819 --> 00:27:06,099 Esto es exactamente lo mismo que decir, de calculada es x de referencia menos x media en valor absoluto 166 00:27:06,099 --> 00:27:10,839 multiplicado por raíz de n y dividido entre s, ¿vale? 167 00:27:11,140 --> 00:27:14,839 O sea, este raíz de n, daos cuenta que está dividiendo en el denominador. 168 00:27:15,779 --> 00:27:16,759 Entonces, ¿qué hago? 169 00:27:17,339 --> 00:27:35,720 Entonces, tengo mi serie de datos, que yo he hecho mis medidas, tengo un valor de referencia, pues con mi serie de datos calculo la media, calculo la desviación, veo el número de mediciones que tengo y con estos puedo calcular una T. 170 00:27:35,720 --> 00:28:02,519 ¿Y luego qué hago? Pues me voy a la tabla de la TED Student y busco para los grados de libertad que tenga, por ejemplo, si tengo 10 mediciones buscaré para grados de libertad 9, 10 menos 1, y luego tendré que ver el nivel de significancia, que es, acordaos, si no nos dicen nada, es el 95%, alfa igual a 0,05, 171 00:28:02,519 --> 00:28:19,920 pero me pueden decir alfa igual a 0,01, alfa igual a 0,1, 90%, ¿vale? Lo que sea, por defecto, la del 95, pero eso me da igual, si me dicen cualquier otro valor es simplemente mirar en otra columna en la tabla, ¿vale? 172 00:28:19,920 --> 00:28:44,799 Y ahora, tengo que saber si utilizo la tabla de una cola o de dos colas. Eso va a depender de cómo he planteado yo la hipótesis. Por ejemplo, si yo lo que quiero es saber simplemente si son distintos, o sea, si mi valor medio no es igual que el de referencia, me da igual que sea mayor o menor, solo quiero saber que no es distinto. 173 00:28:44,799 --> 00:29:06,440 Me voy a la tabla de la TED Student de dos colas y, en cambio, si quiero saber si es mayor o es menor, por ejemplo, si me dicen, dime si el nivel de alcohol en sangre de estas medidas supera el límite legal, ahí ya me está diciendo que le diga si es mayor que el límite legal. 174 00:29:06,440 --> 00:29:20,079 Me está diciendo que si mis datos son mayores que el límite legal. Ahí utilizaría una hipótesis alternativa unilateral y en ese caso miraría en la tabla de la TED Student de una cola. 175 00:29:21,079 --> 00:29:31,400 Ejemplo, imaginaos que me dicen al 95%, o sea, alfa igual a 0,05, que quieren saber si mi valor es distinto del de referencia. 176 00:29:32,259 --> 00:29:37,880 Me voy a mi tabla y como solo me ha dicho que sí es distinto, busco el de dos colas. 177 00:29:38,019 --> 00:29:42,980 Me da igual por aquí que por aquí, nivel de significancia, dos colas. 178 00:29:42,980 --> 00:29:51,640 al 95%, pues buscaría el dato en esta columna de aquí, según el n que sea, ¿vale? 179 00:29:51,680 --> 00:29:56,299 Según el número de medidas, pues n-1, que son los grados de libertad, ¿vale? 180 00:29:57,400 --> 00:30:05,079 Ahora, si me dice no, yo lo que quiero es que me digas si es mayor que este valor de referencia. 181 00:30:05,299 --> 00:30:08,960 Vale, ya me están pidiendo solo por un lado, me tengo que ir al de una cola. 182 00:30:08,960 --> 00:30:33,660 Entonces me voy y en vez de mirar en esta fila de aquí, el valor que yo tengo que mirar es en esta fila de aquí, ¿vale? 0,05 de una cola, que es el valor del dato, o sea, de la t, que la t no es un valor adimensional, no me dice nada per se, es la misma que si fuese dos colas 0,1. 183 00:30:33,660 --> 00:30:41,619 Entonces, aquí miraría en esta fila de aquí, para el número de grados de libertad que sean, ¿vale? 184 00:30:41,759 --> 00:30:44,859 Si es de dos colas, en este, al 0,05. 185 00:30:45,299 --> 00:30:50,799 Si es de una cola, me voy aquí y digo, vale, para una cola el 0,05 es esta columna. 186 00:30:51,400 --> 00:30:56,460 Pues en esta columna, para los grados de libertad que sean, ¿vale? 187 00:30:57,960 --> 00:31:01,960 Entonces, el procedimiento, pues el mismo de siempre, calculo mi t. 188 00:31:01,960 --> 00:31:07,380 me voy a plantear mis hipótesis, calculo mi estadístico 189 00:31:07,380 --> 00:31:11,640 que para hacer la comparación con un valor de referencia es la T 190 00:31:11,640 --> 00:31:20,500 después me voy a mi tabla, busco dependiendo de si he planteado mi hipótesis de una o de dos colas 191 00:31:20,500 --> 00:31:27,180 unilateral o bilateral, si tengo que buscar en mi tabla de una o de dos colas 192 00:31:27,180 --> 00:31:31,380 y comparo el valor de la T de la tabla con el que yo he calculado 193 00:31:31,380 --> 00:31:59,750 Y ahora, como siempre, si el valor calculado, el que he calculado yo, es menor que el de la tabla, puedo aceptar la hipótesis nula, ¿vale? Mi valor es igual que el de referencia. En cambio, si planteo mi t es mayor que la t de las tablas, rechazo la hipótesis nula, ¿vale? Y acepto la alternativa, ¿ok? 194 00:31:59,750 --> 00:32:13,539 Entonces, Elena, por así decirlo, el test F es para comparar la precisión de los métodos y el test T la exactitud. 195 00:32:13,980 --> 00:32:24,640 Sí, porque con el test T lo que vamos a comparar es el valor de un resultado con un valor de referencia. 196 00:32:24,640 --> 00:32:36,000 Y vamos a comparar también mediante un test T, que ahora veremos en el siguiente procedimiento, la diferencia que hay entre las medias de dos series de valores. 197 00:32:36,460 --> 00:32:49,200 Lo que hemos hecho con las F es de comparar si la precisión de dos métodos es la misma, lo podemos hacer con un test T para ver si la media que nos dan esos dos métodos la podemos considerar igual también. 198 00:32:49,200 --> 00:33:10,480 Entonces, sí, la F nos da un indicativo de precisión y la T, en este caso, de exactitud, exactamente, porque estamos comparando un valor de referencia con un valor que nosotros tenemos y queremos ver si se parecen entre ellos, si son exactos. 199 00:33:10,480 --> 00:33:17,180 No queremos ver si las mediciones se han hecho igual, que es lo que estábamos viendo en el TSC, justo. 200 00:33:17,180 --> 00:33:47,160 Vale, gracias. 201 00:33:47,180 --> 00:33:57,640 ¿Vale? Porque tenemos los mismos, para que tengamos las mismas cifras significativas. Lo voy a modificar para que no haya lío. Vale. Tiene que ser 50-0-0. 202 00:33:57,640 --> 00:34:07,460 y nosotros lo que hemos hecho ha sido coger 5 grifos, por ejemplo imaginaos en el instituto, 203 00:34:07,460 --> 00:34:12,119 pues yo me he ido a un baño de cada planta y he tomado una muestra de agua, 204 00:34:12,599 --> 00:34:18,760 esa muestra de agua la he analizado en el laboratorio para ver la concentración de nitratos que tiene 205 00:34:18,760 --> 00:34:34,840 Y los resultados que he obtenido han sido estos. 50,23 una muestra, 50,30 otra, 50,58 otra, 51,06 y 50,81. Me dicen, ¿existen evidencias de que se haya sobrepasado el límite legal? 206 00:34:34,840 --> 00:34:57,179 Entonces, lo que me están pidiendo es que yo diga, sí, con un 95%, porque no me dicen lo contrario, así que considero alfa igual a 0,05, me están diciendo que si puedo considerar que la media de estos valores sobrepasa el límite legal, el límite establecido. 207 00:34:57,179 --> 00:35:16,340 He planteado de otra manera, o sea, he dicho de otra manera que no es exacta exacta, pero creo que se entiende bien. Si yo calculo mi intervalo de confianza, sí está dentro este valor. Entonces, me están pidiendo que compare un resultado con un valor de referencia. 208 00:35:16,340 --> 00:35:35,869 ¿Qué es lo primero que hago? Me voy a abrir una hoja de cálculo. Lo primero que hago es, vale, identifico, quiero comparar una serie de valores con un valor de referencia, así que voy a tener que calcular mi estadístico T, ¿no? 209 00:35:35,869 --> 00:35:46,789 Me han dado mi X referencia, que me han dicho que es 50.00 miligramos partido por litro. 210 00:35:47,550 --> 00:35:50,489 Y luego me han dado una serie de mediciones, ¿no? 211 00:35:51,329 --> 00:35:58,389 Mediciones que son 1, 2, 3, 4 y 5. 212 00:35:59,849 --> 00:36:01,289 Vale, las voy a copiar aquí. 213 00:36:01,289 --> 00:36:22,329 Entonces me han dicho que yo en un grifo he tomado una medida y cuando la he analizado me daba 50,23. Otro 50,30. Otro 50,58. Otro 51,06. Y otro 50,81. ¿Vale? 214 00:36:22,329 --> 00:36:47,010 Y me dicen que si hay evidencias de que se ha sobrepasado este límite legal. Pues yo lo que tengo que hacer es calcular mi estadístico T, ¿vale? Que acordaos que es el valor absoluto, voy a pegar aquí la fórmula, de mi valor de referencia menos la media, dividido entre S y multiplicado por raíz de N. 215 00:36:47,010 --> 00:36:55,489 Aquí tenemos la fórmula, ¿no? Entonces, vamos a organizarnos primero para ver los datos que tenemos. 216 00:36:56,250 --> 00:37:01,110 ¿T calculada? Es lo que queremos, ¿no? Queremos calcular T para compararlo con la T tabulada. 217 00:37:01,969 --> 00:37:11,590 ¿Tenemos el valor de referencia? Sí, 50.00 miligramos por litro. Es el valor legal que me dicen que es el máximo que puede tener mi agua, ¿vale? 218 00:37:12,409 --> 00:37:17,030 ¿Tengo mi X media? Pues sí, porque tengo una serie de valores, así que lo puedo calcular, ¿no? 219 00:37:18,349 --> 00:37:22,030 Entonces voy a poner aquí media. 220 00:37:23,429 --> 00:37:26,469 Y hago la media de estos datos de aquí, ¿no? 221 00:37:26,530 --> 00:37:29,789 Que sería sumar todos y dividir entre el número de datos. 222 00:37:30,570 --> 00:37:33,570 Voy con la calculadora, la función X media. 223 00:37:35,349 --> 00:37:37,889 ¿Vale? Hago mi media, ya la tengo. 224 00:37:37,889 --> 00:37:41,530 ¿Qué más necesito? Mi desviación típica, pues la calculo. 225 00:37:41,590 --> 00:38:04,219 Desviación S, la calculo con la calculadora y me da que es 0,347, ya tengo mi media y mi desviación. 226 00:38:04,219 --> 00:38:14,139 Y ahora que más necesito, n, y n es, contar los datos que tengo, 1, 2, 3, 4 y 5, n es igual a 5. 227 00:38:14,139 --> 00:38:38,300 ¿Vale? Pues ya tengo todo, ¿no? Para calcular mi t. Pues me pongo a calcularla. Mi t calculada es igual a mi valor de referencia, que son 50, menos mi media, que son 50.596. 228 00:38:38,300 --> 00:38:46,840 Ahora, esto me da negativo, lo tengo que poner en positivo 229 00:38:46,840 --> 00:38:48,639 No hago el valor absoluto 230 00:38:48,639 --> 00:38:52,260 Ahora, he hecho esta parte de aquí 231 00:38:52,260 --> 00:38:56,780 Divido entre S, mi desviación 232 00:38:56,780 --> 00:39:03,599 Y a la vez divido entre la raíz de N 233 00:39:03,599 --> 00:39:05,000 De mis cinco valores 234 00:39:05,000 --> 00:39:08,739 Y mi resultado es que mi T 235 00:39:08,739 --> 00:39:13,570 A ver si esto lo he hecho bien 236 00:39:13,570 --> 00:39:30,289 Voy a poner los paréntesis. Vale, no. Me faltaba un paréntesis, perdonad. Esto, bueno, lo hacemos con la calculadora y el resultado que me da es que mi t es 3,855. Vale. 237 00:39:30,289 --> 00:39:36,929 Bueno, ¿qué tengo que hacer ahora? Ya tengo mi t calculada, ahora tendré que ir a buscar mi t tabulada, ¿no? 238 00:39:37,809 --> 00:39:46,750 Lo primero, ¿qué me decía mi ejercicio? Me daba una serie de datos, un valor de referencia y me decía que si se superaba ese valor de referencia. 239 00:39:46,750 --> 00:39:52,349 Me decía h sub 0 que x es igual a x de referencia 240 00:39:52,349 --> 00:40:00,230 Y h alternativa, mi hipótesis alternativa, me decía que si mi valor supera el de referencia 241 00:40:00,230 --> 00:40:03,469 No me decía que si era distinto, me decía que si lo superaba 242 00:40:03,469 --> 00:40:04,889 ¿Esto qué significa? 243 00:40:05,590 --> 00:40:09,349 Que tengo que utilizar, es unilateral 244 00:40:09,349 --> 00:40:15,369 Y por lo tanto, tengo que utilizar la tabla de una cola 245 00:40:15,369 --> 00:40:24,320 Si me hubiese dicho, ¿puedo afirmar que el resultado de las mediciones es distinto que el de referencia? 246 00:40:24,699 --> 00:40:29,400 Utilizaría la de 2, pero como me dice, si lo excede, o sea, si es mayor que 247 00:40:29,400 --> 00:40:35,139 Esta es mi hipoteca alternativa, es unilateral y mi tabla es la de una cola 248 00:40:35,139 --> 00:40:44,000 Pues voy a ello, me tengo que ir entonces para n5, n-1 igual a 4 y una cola 249 00:40:44,000 --> 00:41:04,500 Y como no me dicen nada, el alfa al 95%, ¿vale? Pues me voy a mi tabla del 95% de una cola y tengo que buscar en esta columna de aquí el n-1 grados de libertad igual a 4. 250 00:41:04,500 --> 00:41:20,739 Pues me dice que es 2,13, ¿no? El nivel de significancia de una cola, este es el 0,05, 4, 2,13. 251 00:41:20,739 --> 00:41:44,429 Ok, mi t tabulada es igual a 2,13. Esta es mi t calculada. ¿Esto qué quiere decir? Mi t calculada es mayor que mi t tabulada y por lo tanto rechazo mi hipótesis nula. 252 00:41:44,429 --> 00:41:47,989 solamente acepto mi hipótesis nula 253 00:41:47,989 --> 00:41:49,829 cuando lo que yo he calculado es menor 254 00:41:49,829 --> 00:41:52,190 que lo de la tabla, en este caso es mayor 255 00:41:52,190 --> 00:41:54,230 así que rechazo la hipótesis nula 256 00:41:54,230 --> 00:41:55,769 y acepto 257 00:41:55,769 --> 00:41:57,550 la hipótesis alternativa 258 00:41:57,550 --> 00:42:00,030 por lo tanto, como respuesta 259 00:42:00,030 --> 00:42:02,150 al ejercicio, sí que puedo afirmar 260 00:42:02,150 --> 00:42:04,269 que se ha sobrepasado el límite 261 00:42:04,269 --> 00:42:04,610 legal 262 00:42:04,610 --> 00:42:18,179 ¿cómo lo ves? 263 00:42:21,519 --> 00:42:22,280 más o menos 264 00:42:22,280 --> 00:42:25,239 has dicho que se rechaza la hipótesis 265 00:42:25,239 --> 00:42:25,719 nula, ¿verdad? 266 00:42:25,719 --> 00:42:39,800 Te rechaza, sí, porque mi t calculada es mayor que mi t tabulada. Por lo tanto, rechazo la hipótesis nula y acepto la alternativa. Por lo tanto, mi media sí que es mayor que mi valor de referencia. 267 00:42:39,800 --> 00:42:48,449 lo que os he dicho al principio 268 00:42:48,449 --> 00:42:51,150 que no tiene sentido, o sea que la hipótesis unilateral 269 00:42:51,150 --> 00:42:53,489 solamente tiene sentido hacia un lado 270 00:42:53,489 --> 00:42:57,650 es porque si aquí mi media es 5,59 271 00:42:57,650 --> 00:43:00,329 yo no puedo plantear una hipótesis que diga 272 00:43:00,329 --> 00:43:03,050 mi media es menor que 50 273 00:43:03,050 --> 00:43:04,909 porque eso ya sé que no 274 00:43:04,909 --> 00:43:08,489 solamente puede ser o mayor o igual, pero menor no va a ser 275 00:43:08,489 --> 00:43:29,489 ¿Vale? Entonces, hemos visto dos de las aplicaciones que tenemos con esta estadística inferencial para aplicarla y comparar. 276 00:43:29,489 --> 00:43:41,989 Lo primero, hemos comparado las precisiones de dos métodos y ahora hemos comparado un resultado que hemos obtenido a base de unas mediciones con un valor que tenemos estándar, de referencia. 277 00:43:45,809 --> 00:43:56,150 Ahora, el siguiente test que podemos hacer es el de comparar las medias de dos series de medidas. 278 00:43:56,150 --> 00:44:04,329 ¿Vale? Aquí, si os acordáis, en el primero que hemos hecho, este de aquí, esto era el método 1 y esto era el método 2, ¿no? 279 00:44:04,329 --> 00:44:14,409 Y hemos comparado si eran igual de precisos. Hemos cogido y hemos calculado sus varianzas y luego hemos calculado la f y así hemos dicho que los métodos, 280 00:44:14,469 --> 00:44:22,369 bueno, en este caso no tienen la misma precisión, hemos rechazado la hipótesis nula que nos decía que sí que tienen la misma precisión, ¿vale? 281 00:44:22,369 --> 00:44:35,550 Hipótesis nula, iguales. Hipótesis alternativa, no iguales. Y lo hemos hecho con nuestro test F, pero ahora imaginaos que lo que yo quiero comparar no son las varianzas, la precisión. 282 00:44:35,550 --> 00:44:48,329 Yo quiero comparar las medias que me dan estos dos datos, estos dos estudios. Entonces, la media del primero, ¿cuánto es? Pues me hago la media con mis datos. 283 00:44:48,329 --> 00:44:52,130 Meto estos datos en la calculadora y calculo la media 284 00:44:52,130 --> 00:44:54,869 Del segundo, lo mismo 285 00:44:54,869 --> 00:44:56,289 Me hago la media 286 00:44:56,289 --> 00:44:59,110 Con estos datos 287 00:44:59,110 --> 00:45:06,670 Esta es 6,514 y esta es 6,542 288 00:45:06,670 --> 00:45:11,329 Ya a priori parecen muy, muy, muy... 289 00:45:11,329 --> 00:45:11,730 ¿Lorena? 290 00:45:12,050 --> 00:45:12,289 Sí 291 00:45:12,289 --> 00:45:15,250 Sí, dime 292 00:45:15,250 --> 00:45:17,989 Una pregunta 293 00:45:17,989 --> 00:45:24,949 En las tablas de T, cuando se busca el número, no se resta, ¿verdad? El grado de libertad. 294 00:45:24,969 --> 00:45:32,090 Sí, sí, sí, estos grados de libertad. Teníamos cinco medidas, entonces hemos buscado cinco menos uno, que es cuatro. 295 00:45:32,730 --> 00:45:37,829 Sí. Ah, vale, vale, gracias, estaba confundida, gracias. 296 00:45:37,949 --> 00:45:50,059 Nada, nada. Ah, estaba en el Excel, perdona. Vale, entonces, he comparado mis varianzas y he llegado a la conclusión de que no son iguales. 297 00:45:50,059 --> 00:46:02,559 Ahora puedo hacer un test para decir si mis medias son iguales estadísticamente, si las puedo considerar que estos dos métodos, el resultado final que me dan es el mismo, o sea, quedaría igual que lo hiciese con un método o con el otro. 298 00:46:02,559 --> 00:46:21,539 Ya sé que la precisión no es la misma, pero podemos ver si las medias son comparables o no. ¿Cómo hacemos eso? Tenemos nuestras medias, que a priori son muy parecidas, y vamos a calcular otra vez un estadístico T para compararlo con el de las tablas. 299 00:46:21,539 --> 00:46:31,860 ¿Qué pasa aquí? Que esto parece muy lioso, pero es porque hay que hacer mucho cálculo de suma-resta, no hay cálculos complicados. 300 00:46:32,579 --> 00:46:45,059 Entonces, bueno, vamos a ello. Si quiero comparar las medias de dos series de medidas, lo mismo, mi hipótesis nula, voy a plantear que sí, que las medias son iguales. 301 00:46:45,059 --> 00:46:57,460 Por el método A y por el método B, yo obtengo dos valores de dos medias y puedo decir con mi hipótesis nula que esas dos medias son lo mismo, que son iguales. 302 00:46:57,840 --> 00:47:08,880 Ahora, mi hipótesis alternativa, ¿cómo puede ser? Unilateral, ¿esta media es mayor que esta? O bilateral, ¿esta media es distinta que esta? 303 00:47:08,880 --> 00:47:28,800 Me da igual si mayor o menor, pero distinta. ¿Vale? Entonces, ¿cómo lo hacemos? Calculando nuestro estadístico t, como el que hemos calculado para comparar con un valor de referencia, el que buscamos en la tabla de la t de Student, pues lo vamos a calcular también para nuestras dos series de medidas. 304 00:47:28,800 --> 00:47:37,659 ¿Qué es lo que pasa? Que vamos a calcularlo con una fórmula o con otra dependiendo de lo que nos da la prueba F, ¿vale? 305 00:47:37,860 --> 00:47:49,559 Que acordaos que era la que nos indica si las varianzas son iguales o no, siempre estadísticamente iguales o no, ¿vale? 306 00:47:50,099 --> 00:47:53,099 Entonces, ¿para qué puedo querer yo utilizar este test? 307 00:47:53,099 --> 00:48:21,380 Por ejemplo, si quiero comparar los resultados obtenidos por dos métodos distintos sobre la misma muestra, lo que hemos dicho antes, yo cojo una muestra de agua o de suelo o de un medicamento, voy a hacer unos análisis para obtener un parámetro con un método y con otro método y quiero saber si el resultado que obtengo es realmente el mismo, si estadísticamente puedo decir que es exactamente el mismo resultado. 308 00:48:23,099 --> 00:48:30,619 También para comparar los resultados del análisis de dos muestras distintas, ¿para qué? Para ver si esas muestras puedo decir que son iguales, ¿no? 309 00:48:30,619 --> 00:48:44,880 Por ejemplo, dos aplicaciones. Entonces, ¿cómo lo hacemos? Calculamos nuestro parámetro t. Antes de que os asustéis con nada de esto, todas estas fórmulas las tenéis en el examen disponibles. 310 00:48:44,880 --> 00:49:13,840 En el examen, para todos los ejercicios de estadística, tenéis los de calcular una serie de parámetros en un intervalo de confianza, tenéis los de rechazar resultados que puedan ser dudosos, comparación de dos series de medidas, ya sea la precisión, la media o un valor de referencia, etc. 311 00:49:14,880 --> 00:49:32,159 Aparte de las hojas del examen, tenéis un taco fotocopiado en el que tenéis todas las tablas y estas fórmulas. Las fórmulas de comparación, de ensayos estadísticos, de comparación de series de medidas, tenéis todas las fórmulas. 312 00:49:32,159 --> 00:50:00,460 No os tenéis que saber nada de esto, ¿vale? Ni esto, ni esto, para que no os asustéis, ¿vale? Porque luego viene otra que es más complicada y además se os pone para que se utiliza. No te dicen exactamente cómo aplicarlo en el ejercicio, pero sí que te dicen, pues, esta es la T que se calcula para muestras que provienen de muestras homogéneas, que tienen la misma varianza, ¿vale? 313 00:50:00,460 --> 00:50:17,719 ¿Esto qué quiere decir? Que yo he hecho la prueba F, que es dividir la varianza de uno entre la del otro, compararlo con la tabla y ver si el F calculado es mayor o menor. 314 00:50:17,719 --> 00:50:31,480 ¿Vale? Esto quiere decir que yo he hecho la prueba F y he dicho que sí que tienen la misma varianza, que son homogéneas. He aceptado la hipótesis nula. O sea, la F que yo he calculado es menor que la F tabulada. ¿Vale? 315 00:50:31,480 --> 00:50:54,619 En ese caso, que esa prueba ya la he hecho, digo, vale, pues para calcular mi t tengo que utilizar esta fórmula de aquí, ¿vale? Que es un poco liosa porque es, bueno, liosa no, a lo que voy con esto, siempre es, hay mucho dato que meter en la calculadora, pero si os dais cuenta son sumas, restas, multiplicaciones, divisiones. 316 00:50:54,619 --> 00:51:04,099 No tiene mayor complejidad que, bueno, pues cambiar este valor por su valor real y este, y este, y este, y no equivocarnos al meter los datos. 317 00:51:04,739 --> 00:51:13,840 Entonces, esto para el examen se hace por partes, se hace despacito, se repite un par de veces para que no nos bailen los números en la calculadora, ¿vale? 318 00:51:13,840 --> 00:51:33,639 Entonces, calcularía mi t como la media de mi primera serie de valores menos la media de mi segunda serie de valores, y esto en valor absoluto, o sea, me dé lo que me dé, sea este más grande o más pequeño que este, me dé lo que me dé positivo, ¿vale? 319 00:51:33,639 --> 00:51:48,559 Y lo divido entre S por la raíz de 1 dividido entre el número de repeticiones de la primera serie de valores más 1 dividido entre el número de repeticiones de la segunda serie de valores, ¿vale? 320 00:51:48,559 --> 00:52:14,679 Y diréis, ¿y esta S qué es? ¿La S del primero o la del segundo? Pues es una ponderación de los dos. Entonces, la calculo primero para poder, antes de calcular la T tengo que calcular la S y la calculo como N sub 1, o sea, el número de mediciones de mi primer experimento por la varianza de mi primer experimento más N sub 2, 321 00:52:14,679 --> 00:52:23,840 el número de repeticiones del segundo experimento menos uno por la varianza del segundo experimento 322 00:52:23,840 --> 00:52:33,420 dividido entre n sub uno más n sub dos menos dos, ¿vale? Lo que digo, esto parece un poco, 323 00:52:35,119 --> 00:52:42,099 es un poco lío porque hay mucha fórmula y muy larga y demás, pero si os dais cuenta 324 00:52:42,099 --> 00:52:58,320 Eso, si tenemos todos los datos, es simplemente sustituir a la fórmula, ¿vale? Entonces, yo calculo mi t de student, ¿ok? Tengo mi t calculada y ahora tengo que ver si mi t calculada es mayor o menor que la t tabulada, ¿vale? 325 00:52:58,320 --> 00:53:14,460 Pues me voy a mi tabla de la TED Student y busco por los grados de libertad de estas dos series de valores, que es n1 más n2 menos 2. 326 00:53:14,460 --> 00:53:27,300 Por ejemplo, si del primer experimento he hecho 10 repeticiones y del segundo 8, mis grados de libertad son 10 más 8 menos 2, o sea, 16. 327 00:53:27,300 --> 00:53:41,679 Entonces, en mi tabla de la TED Student me tendría que ir a 16, ¿vale? Ya he calculado los grados de libertad. Cuando solo teníamos una serie de valores, acordaos que era n-1, ¿vale? 328 00:53:41,679 --> 00:54:04,719 Aquí es n1 más n2 menos 2, que es lo mismo que decir n1 menos 1 más n2 menos 1. Si haces esa suma, te sale n1 más n2 menos 1 menos 1, que es lo mismo que n1 más n2 menos 2. 329 00:54:04,719 --> 00:54:08,900 Esperadme un segundín 330 00:54:08,900 --> 00:54:10,900 que estoy viendo que me queda poca batería 331 00:54:10,900 --> 00:54:17,099 ¿Te puedo hacer mientras una pregunta, Elena? 332 00:54:17,539 --> 00:54:18,159 ¿El qué, perdona? 333 00:54:18,539 --> 00:54:19,860 ¿Te puedo hacer mientras una pregunta? 334 00:54:20,019 --> 00:54:20,360 Sí, claro 335 00:54:20,360 --> 00:54:24,079 Entonces, esto de la comparación 336 00:54:24,079 --> 00:54:26,039 de las dos medias de la TED Student 337 00:54:26,039 --> 00:54:27,860 ¿sólo nos lo planteamos? 338 00:54:28,480 --> 00:54:29,179 Si vemos que 339 00:54:29,179 --> 00:54:31,840 la precisión es 340 00:54:31,840 --> 00:54:32,960 similar, ¿no? 341 00:54:33,820 --> 00:54:35,239 Si no, ¿no nos lo planteamos? 342 00:54:35,239 --> 00:54:53,159 No, realmente se puede analizar incluso con precisiones diferentes si las medias son iguales, que es un caso, pues el que sin querer con estos datos nos ha salido aquí, ¿no? Tenemos que nuestros métodos no tienen la misma precisión, pero vemos que las medias son muy parecidas. 343 00:54:53,159 --> 00:54:57,159 Entonces, podemos evaluar si estas medias son iguales o no. 344 00:54:57,320 --> 00:55:01,400 ¿Qué pasa? Que como nuestra f nos ha dicho que no son homogéneas, 345 00:55:01,639 --> 00:55:05,559 en vez de utilizar la fórmula que acabamos de utilizar, utilizamos una distinta. 346 00:55:07,320 --> 00:55:12,199 Entonces, el paso cuando queremos comparar medias es, lo primero, calculamos la f. 347 00:55:12,920 --> 00:55:17,179 Y vemos si las varianzas son iguales o no son iguales. 348 00:55:17,380 --> 00:55:20,800 ¿Que las varianzas son iguales? Utilizamos esta fórmula. 349 00:55:20,800 --> 00:55:24,280 que las variantes no son iguales 350 00:55:24,280 --> 00:55:25,679 utilizamos esta de aquí 351 00:55:25,679 --> 00:55:27,199 ¿vale? 352 00:55:27,860 --> 00:55:29,099 que ahora vamos a ella 353 00:55:29,099 --> 00:55:30,440 vale, vale 354 00:55:30,440 --> 00:55:32,159 entonces, lo primero 355 00:55:32,159 --> 00:55:36,800 en casi casi todos estos ejercicios 356 00:55:36,800 --> 00:55:39,619 lo primero que hay que calcular siempre es la f 357 00:55:39,619 --> 00:55:41,119 que además es muy fácil 358 00:55:41,119 --> 00:55:43,179 porque eso, si vamos a recordarlo 359 00:55:43,179 --> 00:55:44,440 para calcular la f 360 00:55:44,440 --> 00:55:47,199 cogemos y calculamos la varianza 361 00:55:47,199 --> 00:55:49,219 de cada una de nuestras series de medidas 362 00:55:49,219 --> 00:55:55,519 y dividimos la mayor entre la menor, buscamos en la tabla por número de grados de libertad, 363 00:55:55,860 --> 00:56:00,239 denumerador, o sea, lo que está arriba en la ecuación, y denominador, lo que está abajo, 364 00:56:00,960 --> 00:56:08,239 y comparamos. Si nuestra f tabulada, calculada, la que hemos calculado nosotros, es menor que la tabulada, 365 00:56:08,739 --> 00:56:11,980 decimos que sí, que las varianzas son homogéneas, que tienen igual varianza, 366 00:56:12,460 --> 00:56:17,920 y si no, lo rechazamos y que tienen distinta, ¿vale? Y ese es el primer paso, calcular la f. 367 00:56:18,619 --> 00:56:26,219 Ahora, nos dicen, pues compárame, aparte de la precisión, compárame si los resultados obtenidos son iguales, si las medias se puede decir que son iguales. 368 00:56:26,679 --> 00:56:28,300 Digo, vale, pues te voy a hacer la prueba T. 369 00:56:29,280 --> 00:56:41,679 Si en la prueba F, comparando las varianzas, yo he obtenido que sí que son iguales, calculo la T de esta manera, ¿vale?, con estas fórmulas. 370 00:56:42,219 --> 00:56:52,860 Ahora, si me ha salido la prueba F y que no, he rechazado la hipótesis nula y he dicho que las varianzas no son iguales, utilizo esta fórmula de aquí, ¿vale? 371 00:56:54,000 --> 00:57:05,780 Ahora os cuento esto. Esta fórmula de aquí es calcular la T, ¿y cómo la calculo? El valor absoluto, las barras acordaos que es valor absoluto, o sea, me dé lo que me dé en positivo, 372 00:57:05,780 --> 00:57:12,900 de la media de la primera serie de valores menos la media de la segunda serie de valores 373 00:57:12,900 --> 00:57:18,940 y lo divido entre la raíz cuadrada de la varianza del primero al cuadrado 374 00:57:18,940 --> 00:57:25,800 dividido entre el número de mediciones del primero más la varianza del segundo 375 00:57:25,800 --> 00:57:33,139 he dicho la varianza al cuadrado y no es la varianza, perdón, es la desviación al cuadrado que es la varianza, perdón 376 00:57:33,139 --> 00:57:39,099 más la varianza del segundo dividido entre el número de mediciones del segundo. 377 00:57:39,400 --> 00:57:40,960 Y ya con esto tengo calculada mi T. 378 00:57:41,380 --> 00:57:47,900 ¿Ahora qué pasa? Que tengo que ver con qué lo comparo en mi tabla. 379 00:57:48,079 --> 00:57:52,420 En la tabla de la T de Student tengo que ver para qué grados de libertad miro yo. 380 00:57:53,139 --> 00:57:58,559 ¿Y cómo se calculan? Pues con esta fórmula de aquí, que os tengo esta pegada porque hay varias, 381 00:57:58,559 --> 00:58:17,659 Es una aproximación, no son exactas y esto es muy tedioso. No es difícil, pero es tedioso porque tienes que meter muchos datos en la calculadora. Al final, si os dais cuenta, es la varianza del primero entre el número de valores del primero más la varianza del segundo entre el número de valores del segundo. 382 00:58:17,659 --> 00:58:37,059 Todo eso lo tengo que elevar al cuadrado. Mi recomendación es que en el examen os lo hagáis a trocitos para no equivocaros metiendo datos, porque no es difícil, pero eso, pues si tienes que dividir 3,8 entre 5 más 2,7 entre 4, todo ello al cuadrado, al final es un poco lío, ¿vale? 383 00:58:37,059 --> 00:58:59,239 Y luego dividido entre eso, aquí sí que es la varianza al cuadrado, ¿no? Ese cuadrado al cuadrado, ¿vale? Y el número de valores al cuadrado, etc. O sea, es seguir esta fórmula, que reitero que no os tenéis que saber para nada y que esto todo lo tenéis en una hoja en el examen que os dice comparación de las medias de dos series de medidas. 384 00:58:59,239 --> 00:59:07,000 Y te dice, para varianzas homogéneas, y te da esta fórmula de la T y esta fórmula de la S, ¿vale? 385 00:59:07,380 --> 00:59:19,400 Y para muestras estadísticas que no son homogéneas, que no tienen igual varianza, y te da esta T y esta fórmula para calcular los grados de libertad, ¿vale? 386 00:59:20,280 --> 00:59:29,320 Entonces, lo de siempre, si calculo mi t calculada es menor que mi t tabulada, acepto la hipótesis nula. 387 00:59:29,320 --> 00:59:41,079 Puedo decir que las medias son iguales. Si mi t calculada, esta de aquí, es mayor que la que está en las tablas, rechazo la hipótesis nula, que quiere decir que no son iguales las medias. 388 00:59:41,079 --> 00:59:52,110 Y igual que hacíamos en el caso anterior, podemos plantear nuestra hipótesis unilateral o bilateral 389 00:59:52,110 --> 00:59:57,230 El ejercicio va a ser igual, quiero decir, la T la tenemos que calcular de la misma manera 390 00:59:57,230 --> 01:00:06,409 Los grados de libertad, si es el caso de variazas distintas, lo calculamos también de la misma manera 391 01:00:06,409 --> 01:00:19,610 Lo único que cambia cuando yo planteo la hipótesis unilateral o bilateral es que al final cuando yo me voy a mi tabla tendré que buscar en una columna o en otra. 392 01:00:21,030 --> 01:00:31,369 Si es de dos colas que es bilateral y es alfa igual a 0,05 buscaré en esta columna y si es de una cola buscaré en esta columna 393 01:00:31,369 --> 01:00:38,369 que es la que se corresponde con el nivel de significancia de una cola para alfa igual a 0,05. 394 01:00:41,699 --> 01:00:45,400 Elena, ¿qué diferencia hay entre la fórmula de la foto con la que hay debajo? 395 01:00:46,380 --> 01:00:48,039 A ver, a ver... 396 01:00:48,039 --> 01:00:52,719 Si vuelves a la presentación, ¿debajo de esa foto tienes puesta una o era otra diapositiva? 397 01:00:54,960 --> 01:00:55,880 No, debajo... 398 01:00:55,880 --> 01:00:57,420 Ah, es otra diapositiva, vale, vale. 399 01:00:57,519 --> 01:00:58,539 Sí, sí, sí, esto... 400 01:00:58,539 --> 01:01:01,179 Y eso es la S ponderada, ¿no? 401 01:01:01,179 --> 01:01:03,480 Ah, esta de aquí, sí. Esta es la S ponderada. 402 01:01:03,480 --> 01:01:15,639 Esto es, como en el caso de que tengamos las varianzas homogéneas, la fórmula para calcular la T es esta de aquí, incluye esta S, que se calcula así, la S ponderada. 403 01:01:16,079 --> 01:01:21,139 Entonces, en este caso, ¿cómo nos enfrentamos a un ejercicio de estos? Imaginaos. 404 01:01:21,519 --> 01:01:33,099 Vale, vale, perdona, y entonces, antes de que se me vaya la pregunta, ¿y cuando los resultados no son homogéneos, la S tiene otra fórmula para ponderar? 405 01:01:33,099 --> 01:01:35,559 No existe el concepto de S 406 01:01:35,559 --> 01:01:36,940 Es S1 y S2 407 01:01:36,940 --> 01:01:38,440 Aquí no utilizamos la ponderada 408 01:01:38,440 --> 01:01:43,139 ¿Y entonces la fórmula de la derecha a qué se refiere? 409 01:01:43,599 --> 01:01:45,480 Esto es para los grados de libertad 410 01:01:45,480 --> 01:01:46,380 Esto quiere decir 411 01:01:46,380 --> 01:01:47,260 Yo calculo mi T 412 01:01:47,260 --> 01:01:50,400 Mi T con S1 y S2 413 01:01:50,400 --> 01:01:52,079 No necesito una S ponderada 414 01:01:52,079 --> 01:01:54,000 Porque para esta fórmula no la necesito 415 01:01:54,000 --> 01:01:55,400 Y digo, vale, tengo mi T 416 01:01:55,400 --> 01:01:57,760 Imagínate que mi T me da 3,87 417 01:01:57,760 --> 01:02:00,380 Vale, ahora yo me tengo que ir a la tabla 418 01:02:00,380 --> 01:02:02,239 Y tengo que comparar con 419 01:02:02,239 --> 01:02:04,900 un número de grados de libertad 420 01:02:04,900 --> 01:02:07,099 entonces, los grados de libertad 421 01:02:07,099 --> 01:02:08,719 se calculan con esta fórmula 422 01:02:08,719 --> 01:02:11,179 imagínate que yo hago con mis datos 423 01:02:11,179 --> 01:02:12,820 esto y me da el resultado 7 424 01:02:12,820 --> 01:02:14,920 pues yo me voy a mi tabla de la TED 425 01:02:14,920 --> 01:02:17,239 Student y busco para grados de libertad 426 01:02:17,239 --> 01:02:17,639 7 427 01:02:17,639 --> 01:02:21,099 esta fórmula de aquí 428 01:02:21,099 --> 01:02:21,840 todo este 429 01:02:21,840 --> 01:02:25,019 churro, es sólo 430 01:02:25,019 --> 01:02:27,360 para saber dónde tengo que buscar en mi tabla 431 01:02:27,360 --> 01:02:30,800 o sea, pero te va a dar un número 432 01:02:30,800 --> 01:02:32,639 más o menos tirando a un número 433 01:02:32,639 --> 01:02:33,539 redondo 434 01:02:33,539 --> 01:02:36,039 muchas veces da por ejemplo 435 01:02:36,039 --> 01:02:38,699 hay veces que te puede dar 436 01:02:38,699 --> 01:02:41,239 2,80 y algo, redondeas 437 01:02:41,239 --> 01:02:43,460 ¿por qué? porque esto es una aproximación 438 01:02:43,460 --> 01:02:45,039 son herramientas estadísticas que son 439 01:02:45,039 --> 01:02:45,440 un poco 440 01:02:45,440 --> 01:02:49,119 no quiero decir que la estadística 441 01:02:49,119 --> 01:02:51,119 esté inventada, pero bueno, que la adaptamos 442 01:02:51,119 --> 01:02:51,880 un poco a 443 01:02:51,880 --> 01:02:54,880 al tipo de ensayos que nosotros 444 01:02:54,880 --> 01:02:56,900 queremos hacer, entonces aquí 445 01:02:56,900 --> 01:02:59,039 hay distintos criterios 446 01:02:59,039 --> 01:03:11,239 De hecho, para calcular esta fórmula de aquí, yo al final os he puesto esta porque antes tenía puesta otra, pero creo que esta es la menos difícil de equivocarse cuando haces los cálculos. 447 01:03:11,239 --> 01:03:34,500 Todas son iguales, pero a lo mejor eso también, como arrastramos tantísimos valores, por ejemplo, compañeros vuestros, un mismo valor de varianza para cada muestra, simplemente por los decimales que arrastras ya a lo mejor te daba un número distinto aquí. 448 01:03:34,500 --> 01:03:48,880 Sí, distinto, pero bueno, siempre... Me acuerdo una vez un caso que a algunos les dio 32 y a otros 33 grados de libertad. Aún así, se aceptaba o se rechazaba de las dos maneras porque había mucho margen, ¿vale? 449 01:03:48,880 --> 01:04:18,579 Pero sí, da un número que no es un número exacto, pero se aproxima al número entero más cercano. Yo sé que todo esto es muy lioso, pero luego ya veréis, hoy no vamos a hacer ejercicios porque ya no va a dar tiempo, pero ya veréis que es solo plantearnos qué nos están pidiendo, qué fórmulas tenemos que utilizar y sustituir en las fórmulas, ¿vale? 450 01:04:18,579 --> 01:04:22,349 entonces 451 01:04:22,349 --> 01:04:24,130 eso creo que ya no lo vamos 452 01:04:24,130 --> 01:04:26,789 lo de las medidas emparejadas creo que no lo vamos a dar hoy 453 01:04:26,789 --> 01:04:28,409 porque ya va a ser demasiada información 454 01:04:28,409 --> 01:04:31,030 así que mejor 455 01:04:31,030 --> 01:04:31,949 si os parece bien 456 01:04:31,949 --> 01:04:34,949 hacemos una recapitulación de todo lo que hemos visto 457 01:04:34,949 --> 01:04:37,030 de cómo se plantean las hipótesis 458 01:04:37,030 --> 01:04:38,369 cómo se miran las tablas 459 01:04:38,369 --> 01:04:39,409 y demás 460 01:04:39,409 --> 01:04:44,639 y el próximo día 461 01:04:44,639 --> 01:04:47,199 lo podemos dedicar entero a ejercicios de esto 462 01:04:47,199 --> 01:04:50,639 si os parece 463 01:04:50,639 --> 01:05:03,940 y a terminar la última parte de esta parte del tema, que es la comparación de dos series de medidas emparejadas, que es ya el último caso que tenemos. 464 01:05:04,519 --> 01:05:14,780 Tenemos cinco tipos de ejercicios. Cuando nos dan dos series de datos y nos piden que comparemos precisión, varianza, 465 01:05:14,780 --> 01:05:19,659 Lo que hacemos es una prueba f, que es dividir una varianza entre la otra, ¿vale? 466 01:05:19,880 --> 01:05:29,500 Luego tenemos otro tipo de ejercicio que nos dan una serie de datos, una serie de medidas y nos piden que las comparemos con un valor de referencia, ¿vale? 467 01:05:30,159 --> 01:05:39,760 Ahí lo hacemos calculando la t con la fórmula de x referencia menos x media dividido entre s partido de raíz de n. 468 01:05:40,460 --> 01:05:49,860 Luego, nos pueden decir que calculemos si hay diferencia entre las medias de dos series de medidas. 469 01:05:50,280 --> 01:05:57,920 ¿Cómo hacemos eso? Pues primero evaluamos si las varianzas son iguales o no y luego aplicamos las fórmulas. 470 01:05:59,019 --> 01:06:06,159 Y el último ejercicio que tenemos de este tipo es comparar dos series de medidas emparejadas. 471 01:06:06,159 --> 01:06:18,039 ¿Esto qué quiere decir? Os lo adelanto. Las series de medidas emparejadas son aquellas que podemos comparar por parejas, como su propio nombre indica. 472 01:06:18,199 --> 01:06:30,760 Un ejemplo, imaginaos que vamos a hacer un estudio clínico y estamos 10 personas y esas 10 personas a cada una de nosotras nos miden la tensión arterial. 473 01:06:30,760 --> 01:06:34,659 luego nos dan una pastilla que baja la tensión supuestamente 474 01:06:34,659 --> 01:06:37,179 y luego nos vuelven a medir la tensión 475 01:06:37,179 --> 01:06:40,440 yo para hacer ese análisis 476 01:06:40,440 --> 01:06:43,260 yo lo que voy a comparar es mi tensión antes de la pastilla 477 01:06:43,260 --> 01:06:45,159 con mi misma tensión después 478 01:06:45,159 --> 01:06:49,340 la tensión del segundo que estaba en el este 479 01:06:49,340 --> 01:06:52,579 antes y después, del tercero antes y después 480 01:06:52,579 --> 01:06:56,159 no tiene sentido que yo compare mi tensión con la de otro 481 01:06:56,159 --> 01:06:58,559 porque no tiene ningún tipo de sentido 482 01:06:58,559 --> 01:07:00,659 para ver el efecto de esa medicación 483 01:07:00,659 --> 01:07:04,239 Entonces a eso se le llaman medidas emparejadas. 484 01:07:04,880 --> 01:07:11,300 Otro ejemplo, si por ejemplo estamos en el laboratorio y sobre unas muestras que tenemos, 485 01:07:11,400 --> 01:07:17,460 la muestra 1, la 2, la 3, la 4, la 5, hacemos una medición de lo que sea, pH. 486 01:07:18,079 --> 01:07:24,760 Después hacemos un proceso entre medias que puede ser calentar y luego volvemos a medir el pH. 487 01:07:24,760 --> 01:07:35,760 Pues yo compararé la medida que tenía del 1 antes con la medida del 1 después, la del 2 de antes con la del 2 de después, la del 3 de antes con la del 3 de después. 488 01:07:36,300 --> 01:07:40,639 No compararé la 1 de antes con la 3 de después porque eso no me da información, ¿vale? 489 01:07:40,719 --> 01:07:50,139 Entonces ese es el último caso que tenemos, que lo vemos ya el próximo día para no aturullaros más. 490 01:07:51,019 --> 01:07:55,099 Entonces, resumiendo, prueba F para comparar varianzas. 491 01:07:55,539 --> 01:07:58,019 Hipótesis nula, que las varianzas son iguales. 492 01:07:58,139 --> 01:08:03,420 Hipótesis alternativa, en este caso en concreto la planteamos siempre unilateral por la tabla, por practicidad. 493 01:08:04,159 --> 01:08:07,239 Pero técnicamente la podemos plantear de las dos maneras. 494 01:08:07,820 --> 01:08:09,340 ¿Cuándo es una hipótesis bilateral? 495 01:08:09,800 --> 01:08:15,539 Cuando yo solo planteo que mis varianzas, o que mis medias, o que lo que sea, son distintas. 496 01:08:15,860 --> 01:08:17,060 ¿Cuándo es unilateral? 497 01:08:17,359 --> 01:08:20,020 Cuando planteo que sea mayor que o menor. 498 01:08:20,140 --> 01:08:31,399 ¿Vale? ¿Cómo calculamos F? Calculo la varianza de uno, la varianza del otro y divido la varianza más grande entre la más pequeña. 499 01:08:32,000 --> 01:08:45,079 ¿Vale? Tengo ya mi F calculada. Ahora me voy a mi tabla de F y busco, para el nivel de significación que quiera, ¿vale? 500 01:08:45,859 --> 01:08:50,500 Busco por los grados de libertad del numerador y del denominador, ¿vale? 501 01:08:50,800 --> 01:09:01,720 Busco el valor que sea, este por ejemplo sería que el valor del numerador, o sea, el que tenía una varianza más grande, he tomado 9 medidas, por eso aquí son 8. 502 01:09:02,140 --> 01:09:13,920 Y el del denominador, que es el más pequeño, es que había 10 medidas y por eso he tomado aquí 9, entonces en este caso, pues 3,23, ¿vale? 503 01:09:13,920 --> 01:09:32,159 Ya tengo mi f, ¿ahora qué hago? La comparo con la que yo he calculado y siempre el mismo criterio. Si la que yo he calculado es menor que la tabulada, acepto la hipótesis nula. Si la que yo he calculado es mayor que la tabulada, rechazo la hipótesis nula, ¿vale? 504 01:09:33,079 --> 01:09:36,300 ¿Acepto la hipótesis nula? Que las varianzas son iguales. 505 01:09:36,739 --> 01:09:42,199 ¿Rechazo la hipótesis nula? Que no son iguales, ¿vale? La que haya planteado. 506 01:09:44,579 --> 01:09:50,119 Ahora, para comparar un resultado con un valor de referencia, lo mismo, planteo mis hipótesis. 507 01:09:50,119 --> 01:09:54,079 ¿Hipótesis nula? Mi resultado sí que es igual que el de referencia. 508 01:09:54,340 --> 01:09:57,100 ¿Mi alternativa? Pues unilateral o bilateral. 509 01:09:57,100 --> 01:10:05,319 La unilateral, que mi resultado es mayor o que es menor que una referencia, y la bilateral, que es distinto. 510 01:10:07,479 --> 01:10:16,520 Calculo mi t con esta fórmula, acordaos del valor absoluto, no puede salir negativa, y lo comparo con la tabla. 511 01:10:18,039 --> 01:10:23,720 Si t calculada es mayor que la t tabulada, se rechaza la hipótesis nula. 512 01:10:23,720 --> 01:10:27,760 si t calculada es menor que t tabulada 513 01:10:27,760 --> 01:10:29,659 se acepta la hipótesis nula 514 01:10:29,659 --> 01:10:33,720 si acepto la hipótesis nula es que son iguales 515 01:10:33,720 --> 01:10:35,539 si la rechazo es que no 516 01:10:35,539 --> 01:10:41,039 y lo último que hemos visto hoy 517 01:10:41,039 --> 01:10:43,960 la comparación de las medias de dos series 518 01:10:43,960 --> 01:10:45,600 hipótesis nula 519 01:10:45,600 --> 01:10:50,159 oye, esperad un momento, no me digáis que no he puesto 520 01:10:50,159 --> 01:10:54,770 ay, qué susto, pensaba que no había puesto a grabar 521 01:10:54,770 --> 01:11:13,569 Ahora que estamos acabando, sí, sí, estamos grabando. Perdón. Vale, ahora, comparar las medias de dos series de medidas, ¿vale? Mi hipótesis nula, que las medias son iguales. Mi hipótesis alternativa, que son distintas o que una es mayor que la otra, ¿vale? 522 01:11:13,569 --> 01:11:19,270 ¿Cómo hago para calcular mi estadístico cuando quiero comparar dos medias? 523 01:11:19,270 --> 01:11:32,270 Lo hago en dos pasos. Primero, calculo la prueba F, calculo si la precisión es similar o no, o sea, si las varianzas son iguales o no, si es homogéneo o no. 524 01:11:32,270 --> 01:11:39,729 ¿Vale? Calculo mi prueba F. Según lo que haya obtenido en mi prueba F, calculo mi estadístico T. 525 01:11:40,329 --> 01:11:47,329 Y eso lo calcularé con una fórmula distinta según si las varianzas me han salido iguales o no me han salido iguales. 526 01:11:48,510 --> 01:11:54,890 ¿Que las varianzas me han salido que sí que son homogéneas? Calculo con esta fórmula mi T. 527 01:11:54,890 --> 01:12:01,810 ¿Vale? Primero calculo esta S ponderada, esta de aquí, la meto aquí el resultado y calculo mi T. 528 01:12:02,270 --> 01:12:16,909 Vale, ahora me voy a mi tabla de la T de Student y busco para este número de grados de libertad el valor y si mi T calculada es mayor que mi T tabulada, retoce la hipótesis nula, eso siempre igual, ¿vale? 529 01:12:17,689 --> 01:12:29,210 Ahora, que me ha dado el otro caso, que mis varianzas provienen de muestras estadísticas que no son homogéneas, que la varianza no es igual, pues calculo así mi T de Student, ¿vale? 530 01:12:29,210 --> 01:12:32,369 con esta fórmula de aquí y para buscar en mi tabla 531 01:12:32,369 --> 01:12:35,390 tengo que buscar por este número 532 01:12:35,390 --> 01:12:37,670 de grados de libertad, esto cuando yo lo haga 533 01:12:37,670 --> 01:12:40,250 todo esto tan críptico me dará un número, me dará el 7 534 01:12:40,250 --> 01:12:43,130 pues me voy a mi tabla y busco para el valor 535 01:12:43,130 --> 01:12:46,729 n menos u, o sea grados de libertad igual a 7 536 01:12:46,729 --> 01:12:48,750 y 537 01:12:48,750 --> 01:12:53,569 la aplicación de esto ya la dejamos 538 01:12:53,569 --> 01:12:56,590 para el próximo día porque si no creo que es mucha mucha información 539 01:12:56,590 --> 01:13:02,590 Así que no sé si tenéis comentarios.