1 00:00:00,620 --> 00:00:09,060 Hola, vamos a ver lo que nos queda de tema y ya a partir de aquí lo único que haremos con este tema es terminar los ejercicios del libro. 2 00:00:11,160 --> 00:00:19,280 Nosotros ya sabemos lo que es inferir. Inferir en estadística es sacar conclusiones a partir de los datos que nosotros conocemos. 3 00:00:20,160 --> 00:00:26,739 Ya hemos visto, si nosotros conocíamos la distribución de una población, consumir de su desviación típica, 4 00:00:26,739 --> 00:00:31,920 cómo podíamos decir que se comportaba cualquier muestra 5 00:00:31,920 --> 00:00:34,380 que cogíamos nosotros de tamaño mínimo 6 00:00:34,380 --> 00:00:37,820 a partir de esa población. 7 00:00:38,719 --> 00:00:40,899 De acuerdo, veíamos que todo esto se hacía 8 00:00:40,899 --> 00:00:44,020 por medio del teorema central del índice. 9 00:00:44,219 --> 00:00:49,039 Si el tamaño de la muestra era mayor que 30, 10 00:00:50,280 --> 00:00:54,000 entonces siempre se aproximaba a una normal. 11 00:00:54,000 --> 00:00:58,320 pero si la población ya tenía una distribución normal 12 00:00:58,320 --> 00:01:00,399 me daba igual el tamaño de la muestra 13 00:01:00,399 --> 00:01:02,899 porque siempre se aproxima también a un lado 14 00:01:02,899 --> 00:01:07,319 el segundo punto, lo que nosotros hacemos es al contrario 15 00:01:07,319 --> 00:01:09,939 ahora, lo que nosotros conocemos 16 00:01:09,939 --> 00:01:12,459 que este es el caso más genérico 17 00:01:12,459 --> 00:01:15,540 lo que pasa en la realidad normalmente 18 00:01:15,540 --> 00:01:20,359 nosotros conocemos una muestra elegida a la A 19 00:01:20,359 --> 00:01:22,640 entonces lo que tenemos que hacer 20 00:01:22,640 --> 00:01:24,879 a inferir esos datos 21 00:01:24,879 --> 00:01:25,939 a la población 22 00:01:25,939 --> 00:01:27,640 entera 23 00:01:27,640 --> 00:01:30,359 entonces, ¿cómo hacemos esto? 24 00:01:31,959 --> 00:01:32,840 lo podemos 25 00:01:32,840 --> 00:01:35,219 hacer con estimaciones puntuales 26 00:01:35,219 --> 00:01:36,819 que la estimación puntual es 27 00:01:36,819 --> 00:01:37,459 media de 28 00:01:37,459 --> 00:01:40,939 la muestra, media de la población 29 00:01:40,939 --> 00:01:42,579 desviación típica de la muestra 30 00:01:42,579 --> 00:01:44,099 desviación típica de la población 31 00:01:44,099 --> 00:01:46,439 pero aquí 32 00:01:46,439 --> 00:01:48,379 lo que pasa es que no sabemos exactamente 33 00:01:48,379 --> 00:01:50,680 la aproximación del valor de la muestra 34 00:01:50,680 --> 00:01:51,840 al valor de la población 35 00:01:51,840 --> 00:02:07,200 O también lo podemos hacer por intervalos. Por intervalos, nosotros decimos que la media de la población va a estar entre estos valores de este intervalo. Un valor mínimo y un valor máximo. Y estos intervalos se llaman intervalos de confianza. 36 00:02:07,200 --> 00:02:16,759 El intervalo de confianza es el intervalo más uno en el cual nosotros vamos a poder asegurar que está en la media de la población. 37 00:02:18,120 --> 00:02:22,020 O también lo podemos hacer por el nivel de confianza. 38 00:02:22,020 --> 00:02:27,020 Por el nivel de confianza es que nosotros calculamos la probabilidad. 39 00:02:27,020 --> 00:02:40,009 Probabilidad. Sabemos que se da con una probabilidad de un 90% o se da con una probabilidad de un 95%, etc. 40 00:02:41,469 --> 00:02:49,710 Entonces, ¿qué es importante aquí? La longitud del intervalo, la mayoría de la muestra y el nivel de confianza. 41 00:02:49,710 --> 00:03:05,430 Todas estas variables están relacionadas con las conductas. Y esto es lo que nos va a dar la seguridad de que nosotros estamos consiguiendo un intervalo bueno para poder inferir esa media a la población. 42 00:03:05,430 --> 00:03:29,240 Y lo otro que podemos, la otra forma de inferir es, a nosotros nos afirman que la altura, por ejemplo, de una población, yo no puedo asegurar que si no tengo ningún valor más, entonces, ¿qué es lo que hacemos? 43 00:03:29,240 --> 00:03:51,580 Esto es una hipótesis, no lo afirman, no lo sabemos. Pero nosotros sí podemos extraer una muestra al azar y estudiar esa muestra. Y a raíz de esa muestra nosotros vemos si nos podemos fiar, si no nos podemos fiar. Esto se conoce contraste de hipótesis. 44 00:03:51,580 --> 00:04:07,530 ¿De acuerdo? Pero esto es la contraste de hipótesis, no la vamos a dar esto. Valdaremos la tensión de hipótesis un poquito al final, pero no vamos a verlo. ¿De acuerdo? No. Esto es fácil. 45 00:04:07,530 --> 00:04:39,589 Ahora vamos a ver el intervalo de confianza. 46 00:04:39,610 --> 00:04:42,089 de la población va a estar 47 00:04:42,089 --> 00:04:44,050 entre, en este 48 00:04:44,050 --> 00:04:46,149 intervalo. Y siempre 49 00:04:46,149 --> 00:04:48,029 también tenemos que tener en cuenta 50 00:04:48,029 --> 00:04:49,930 que el número de 51 00:04:49,930 --> 00:04:52,230 el tamaño de la muestra 52 00:04:52,230 --> 00:04:54,209 n es mayor que 30 53 00:04:54,209 --> 00:04:55,050 o 54 00:04:55,050 --> 00:04:57,689 que la distribución 55 00:04:57,689 --> 00:04:59,769 de la población es normal 56 00:04:59,769 --> 00:05:02,110 para poder asegurar 57 00:05:02,110 --> 00:05:03,949 que es un nivel 58 00:05:03,949 --> 00:05:05,870 de confianza único. Entonces, 59 00:05:05,990 --> 00:05:08,089 si nos fijamos en este intervalo 60 00:05:08,089 --> 00:05:09,370 de confianza 61 00:05:09,610 --> 00:05:12,629 A nosotros nos podría parecer raro, pero no. 62 00:05:13,670 --> 00:05:17,629 Nosotros, por el problema central del límite, teníamos este mismo intervano. 63 00:05:17,629 --> 00:05:22,730 Lo que pasa es que lo que conocíamos era la media de la población. 64 00:05:23,269 --> 00:05:28,509 Y aquí, donde tenemos ahora media de la muestra, teníamos la media de la población. 65 00:05:28,990 --> 00:05:29,529 Era luz. 66 00:05:30,529 --> 00:05:31,689 Y aquí, lo mismo. 67 00:05:33,589 --> 00:05:36,990 Matemáticamente, se hace de la misma forma. 68 00:05:36,990 --> 00:05:53,670 Lo que pasa es que en este caso es el intervalo donde vamos a encontrarnos la media de la población y en el otro caso era el intervalo en el cual nosotros nos encontramos la media de la muestra. 69 00:05:54,290 --> 00:05:54,629 ¿De acuerdo? 70 00:05:55,110 --> 00:05:59,290 El intervalo que nosotros nos encontramos la media de la muestra era este. 71 00:05:59,290 --> 00:06:22,259 Que lo que es lo mismo, lo que quería decir es que la media era mayor que el límite inferior del intervalo y era menor que el límite superior del intervalo, que lo tenemos por aquí, la media. 72 00:06:22,259 --> 00:06:44,819 Entonces, ahora, nosotros tenemos una inequación. Si sumamos o restamos una cantidad positiva, la inequación no cambia de signo. Entonces, si nosotros ahora mismo restamos a la inequación, todos los términos en la inequación, menos nu, ¿qué es lo que tenemos? 73 00:06:44,819 --> 00:06:47,600 nu menos nu, cero. 74 00:06:48,519 --> 00:06:49,519 Entonces nos queda 75 00:06:49,519 --> 00:06:52,180 nos queda 76 00:06:52,180 --> 00:06:53,740 aquí se va la nu 77 00:06:53,740 --> 00:06:55,579 se va la nu 78 00:06:55,579 --> 00:06:57,740 y aparece aquí porque la hemos 79 00:06:57,740 --> 00:06:58,279 restado 80 00:06:58,279 --> 00:07:01,100 y aquí también se va. 81 00:07:01,519 --> 00:07:03,500 Lo que hemos hecho ha sido restar aquí nu 82 00:07:03,500 --> 00:07:06,079 restar aquí nu y restar aquí nu. 83 00:07:08,879 --> 00:07:09,360 Ahora bien, 84 00:07:09,879 --> 00:07:10,939 como vimos en cuarto 85 00:07:10,939 --> 00:07:13,240 y nosotros tenemos este intervalo 86 00:07:13,240 --> 00:07:15,000 una cantidad 87 00:07:15,000 --> 00:07:18,240 negativa 88 00:07:18,240 --> 00:07:19,959 menor que una variable 89 00:07:19,959 --> 00:07:21,379 y menor 90 00:07:21,379 --> 00:07:24,560 que la cantidad positiva 91 00:07:24,560 --> 00:07:25,500 esto es 92 00:07:25,500 --> 00:07:28,199 lo que nosotros veíamos como 93 00:07:28,199 --> 00:07:30,800 entorno de intervalo 94 00:07:30,800 --> 00:07:32,459 ¿de acuerdo? y lo podríamos poner 95 00:07:32,459 --> 00:07:34,139 como valor a salud 96 00:07:34,139 --> 00:07:35,839 es lo mismo 97 00:07:35,839 --> 00:07:38,220 si desarrollamos después 98 00:07:38,220 --> 00:07:38,939 el valor a salud 99 00:07:38,939 --> 00:07:41,300 entonces esto 100 00:07:41,300 --> 00:07:43,160 es lo mismo que decir que el valor a salud 101 00:07:43,160 --> 00:07:44,920 es la media menos 1 102 00:07:44,920 --> 00:07:46,540 es menos que 103 00:07:46,540 --> 00:07:48,519 la cantidad en positivo 104 00:07:48,519 --> 00:07:51,199 porque la cantidad en positivo es positivo 105 00:07:51,199 --> 00:07:53,100 ahora bien 106 00:07:53,100 --> 00:07:54,519 también me da igual 107 00:07:54,519 --> 00:07:56,420 calcular el valor absoluto 108 00:07:56,420 --> 00:07:57,439 de la media muestra 109 00:07:57,439 --> 00:08:00,939 que el valor absoluto 110 00:08:00,939 --> 00:08:02,600 de la media muestra 111 00:08:02,600 --> 00:08:03,680 menos 112 00:08:03,680 --> 00:08:06,240 la media muestra 113 00:08:06,240 --> 00:08:07,759 que lo tengo aquí 114 00:08:07,759 --> 00:08:09,680 como da lo mismo 115 00:08:09,680 --> 00:08:11,579 pues lo cambio 116 00:08:11,579 --> 00:08:13,660 lo cambio 117 00:08:13,660 --> 00:08:15,500 ahora 118 00:08:15,500 --> 00:08:17,459 lo que hacemos ahora 119 00:08:17,459 --> 00:08:19,139 quita el valor absoluto 120 00:08:19,139 --> 00:08:20,819 ¿cómo quita el valor absoluto? 121 00:08:21,439 --> 00:08:22,560 tenemos que 122 00:08:22,560 --> 00:08:24,459 quitando el valor absoluto 123 00:08:24,459 --> 00:08:27,160 cuando es positiva es menor que esta 124 00:08:27,160 --> 00:08:30,500 pero cuando es negativa 125 00:08:30,500 --> 00:08:32,220 ¿qué es lo que pasa? 126 00:08:33,159 --> 00:08:34,899 que será mayor 127 00:08:34,899 --> 00:08:37,279 que la cantidad que tenemos aquí 128 00:08:37,279 --> 00:08:38,100 que es negativo 129 00:08:38,100 --> 00:08:40,360 es negativo porque 130 00:08:40,360 --> 00:08:42,600 el valor absoluto es un número negativo 131 00:08:42,600 --> 00:08:51,679 lo que no se hace es cambiarnos de signo el número y si sumamos en la media 132 00:08:51,679 --> 00:08:56,419 muestra todos los términos de la elevación 133 00:08:56,419 --> 00:09:03,799 pues tenemos esto en el centro tendríamos no menos la media muestra más la media 134 00:09:03,799 --> 00:09:10,320 muestra y se va y nos queda solo no y este es el intervalo nuestro de 135 00:09:10,320 --> 00:09:14,340 confianza me da igual escribirlo así escribirlo así 136 00:09:14,360 --> 00:09:16,519 así como lo tengo aquí arriba 137 00:09:16,519 --> 00:09:18,080 ¿de acuerdo? 138 00:09:21,549 --> 00:09:23,110 pero esto, ¿cuándo pasa? 139 00:09:23,250 --> 00:09:24,590 cuando nosotros conocemos 140 00:09:24,590 --> 00:09:27,110 la desviación típica de la población 141 00:09:27,110 --> 00:09:28,710 que es lo que estoy utilizando 142 00:09:28,710 --> 00:09:30,950 si yo no conozco la desviación típica 143 00:09:30,950 --> 00:09:32,389 de la población, ¿qué es lo que tengo que hacer? 144 00:09:32,730 --> 00:09:34,970 tengo que hacer una aproximación de la desviación típica 145 00:09:34,970 --> 00:09:36,250 de la población 146 00:09:36,250 --> 00:09:37,250 y la 147 00:09:37,250 --> 00:09:41,049 aproximación 148 00:09:41,049 --> 00:09:42,409 que hago es 149 00:09:42,409 --> 00:09:43,970 la aproximación cuando 150 00:09:43,970 --> 00:09:46,909 hacíamos, cuando creamos la desviación típica 151 00:09:46,950 --> 00:09:49,330 en estadística 152 00:09:49,330 --> 00:09:53,480 y es esta 153 00:09:53,480 --> 00:09:55,120 normalmente 154 00:09:55,120 --> 00:09:57,440 la mejor 155 00:09:57,440 --> 00:09:59,399 aproximación que podemos dar 156 00:09:59,399 --> 00:10:01,320 es con S sub n-1 157 00:10:01,320 --> 00:10:03,659 ¿de acuerdo? pero si 158 00:10:03,659 --> 00:10:05,139 la muestra es muy grande 159 00:10:05,139 --> 00:10:07,379 esta no sirve 160 00:10:07,379 --> 00:10:08,500 de la que vamos a utilizar 161 00:10:08,500 --> 00:10:11,879 entonces cambiamos, lo único que hemos cambiado aquí 162 00:10:11,879 --> 00:10:13,080 si nosotros no conocemos 163 00:10:13,080 --> 00:10:15,000 la desviación típica de la 164 00:10:15,000 --> 00:10:17,539 población, lo único que cambiamos es 165 00:10:17,539 --> 00:10:24,580 la desviación típica de la población por la desviación típica de la muestra y con eso ya 166 00:10:24,580 --> 00:10:33,100 tendríamos el intervalo de confianza para la media. Ahora vamos a ver el error que podemos 167 00:10:33,100 --> 00:10:41,700 nosotros cometer, el error que llamamos admisible. El error que llamamos admisible simplemente es la 168 00:10:41,700 --> 00:10:54,659 diferencia entre la media muscular y la media de la población. Y ese error admisible es 169 00:10:54,659 --> 00:11:05,210 este. Lo vamos a llamar error admisible. ¿Qué es lo que tenemos? Cuanto mayor sea esto, 170 00:11:05,210 --> 00:11:08,320 que es lo que va a pasar 171 00:11:08,320 --> 00:11:11,059 que mayor va a ser el error 172 00:11:11,059 --> 00:11:12,360 es decir 173 00:11:12,360 --> 00:11:15,159 cuanto mayor sea 1 menos alfa 174 00:11:15,159 --> 00:11:17,500 la probabilidad 175 00:11:17,500 --> 00:11:18,340 de que esta sea mayor 176 00:11:18,340 --> 00:11:20,519 será esto 177 00:11:20,519 --> 00:11:23,360 el error 178 00:11:23,360 --> 00:11:25,100 será que podemos 179 00:11:25,100 --> 00:11:26,559 cometer mayor 180 00:11:26,559 --> 00:11:29,460 cuanto mayor es el tamaño 181 00:11:29,460 --> 00:11:30,080 de la muestra 182 00:11:30,080 --> 00:11:31,659 el error va a ser más pequeño 183 00:11:31,659 --> 00:11:33,840 porque el tamaño de la muestra 184 00:11:33,840 --> 00:11:34,779 está dividiendo 185 00:11:34,779 --> 00:11:43,299 el error va a ser más pequeño, evidentemente. 186 00:11:44,220 --> 00:11:45,480 Ahora, ¿qué es lo que pasa? 187 00:11:45,720 --> 00:11:50,799 Nosotros nos pueden decir que calculemos, nos dan un error fijo, ¿vale? 188 00:11:50,940 --> 00:11:54,179 Y nos piden a lo mejor calcular el tamaño de la muestra. 189 00:11:54,740 --> 00:11:59,139 Conocemos el error y nos dan el nivel de confianza. 190 00:11:59,799 --> 00:12:01,940 Tenemos que calcular el tamaño de la muestra. 191 00:12:01,940 --> 00:12:23,450 Lo único que tenemos que hacer es despejar y calcular. También nos pueden dar el error. Conocemos el tamaño de la muestra y tenemos que calcular el nivel de confianza. 192 00:12:23,450 --> 00:12:47,789 Entonces, el nivel de confianza queda 1 menos alfa. Como es 1 menos alfa, yo no lo tengo en la fórmula, pero voy calculando la alfa en este dato. Despejo este dato, lo calculo, me voy a las círculos de la normal tiro 1 y recojo el dato para conocer alfa medios. 193 00:12:47,789 --> 00:12:51,929 Una vez que conozco alfa medios, puedo conocer cuánto vale alfa. 194 00:12:52,129 --> 00:12:55,830 Si conozco alfa, ya sé cuánto vale 1 menos alfa. 195 00:12:57,370 --> 00:12:59,850 Como podemos ver, este es el error. 196 00:13:00,610 --> 00:13:02,289 El error es esta distancia. 197 00:13:03,470 --> 00:13:05,409 Esta distancia que tenemos aquí. 198 00:13:06,769 --> 00:13:07,250 ¿De acuerdo? 199 00:13:07,509 --> 00:13:09,649 Y está la tabla que ya vimos también en el caso. 200 00:13:10,929 --> 00:13:12,350 Venga, muchas gracias. 201 00:13:12,710 --> 00:13:13,110 Hasta luego.