1 00:00:00,370 --> 00:00:06,870 Vamos a hacer ahora muchos ejercicios para poner en práctica ya por fin todo lo que estamos aprendiendo en estos vídeos. 2 00:00:06,969 --> 00:00:13,390 Los ejercicios que vamos a hacer ahora, en este vídeo y en el siguiente, todos están sacados de exámenes de selectividad de Madrid. 3 00:00:13,810 --> 00:00:16,649 De selectividad de la PAU, de la EBAU, como lo vayan a llamar. 4 00:00:16,969 --> 00:00:20,370 Entonces en este vídeo primero vamos a hacer ejercicios que son los más típicos. 5 00:00:21,030 --> 00:00:29,030 Generalmente tienen dos apartados. El primero pide un intervalo de confianza y el segundo te pide qué tamaño debe tener la muestra o algo relacionado con el error. 6 00:00:29,030 --> 00:00:40,229 ¿Vale? ¿Cuánta gente debería haber encuestado para que el error fuera menor que no sé qué valor? ¿De acuerdo? Y en el siguiente vídeo ya veremos casos un poquito más extraños, que preguntan las cosas de otra manera, me dan otros datos, etc. No son tan típicos, ¿vale? 7 00:00:40,590 --> 00:00:50,270 Venga, pues empezamos aquí. El primer ejercicio dice, la altura en centímetros de los individuos de una población se puede aproximar por una distribución normal de desviación típica igual a 20 centímetros, ¿vale? 8 00:00:50,270 --> 00:00:55,549 tengo una población, no sé la media de altura que tiene esa población, sé que la desviación típica 9 00:00:55,549 --> 00:01:01,350 es 20 centímetros. A. En una muestra aleatoria simple de 500 individuos, o sea, cojo 500 individuos 10 00:01:01,350 --> 00:01:07,030 y se obtiene una altura media de 174 centímetros. Esta es la media muestral. Obténgase un intervalo 11 00:01:07,030 --> 00:01:12,209 de confianza del 95% para mu, para la media poblacional. O sea, dime entre qué dos valores 12 00:01:12,209 --> 00:01:19,109 hay un 95% de seguridad de que estará la media de la población. Es un apartado muy típico que 13 00:01:19,109 --> 00:01:23,390 tenemos que saber hacer con fluidez. Entonces la población de media desconocida y desviación 14 00:01:23,390 --> 00:01:30,370 típica 20 y mi muestra de 500 individuos y la media muestral era 174. Con esto me piden 15 00:01:30,370 --> 00:01:35,689 el intervalo de confianza al 95% para la media de la población. Pues ya sabéis que en el 16 00:01:35,689 --> 00:01:40,209 intervalo de confianza es el área que encierran dos valores simétricos, z alfa medios y menos 17 00:01:40,209 --> 00:01:46,810 z alfa medios. Si aquí dentro está el 95% de confianza, fuera se queda el 5%, repartido 18 00:01:46,810 --> 00:01:57,069 así, 2,5 a la derecha, 2,5 a la izquierda. Como en la tabla no puedo buscar dos valores que encierren un 95%, yo lo que hago en la tabla es buscar un valor, el z alfa medios, 19 00:01:57,510 --> 00:02:10,469 que deje a su izquierda al, en este caso, 95 más 2,5, o sea, al 97,5% de la población, o sea, al 0,975, que ya es lo que busco en la tabla. Esto sonará porque lo hemos visto 20 00:02:10,469 --> 00:02:20,370 en vídeos anteriores. Y el famoso valor que deja, busco por aquí dentro el 0,975 y el famoso valor que deja a su izquierda esto era el 1,96 famoso, ¿vale? 21 00:02:20,370 --> 00:02:28,469 Que ya algunos incluso lo sabréis. Con esto saco el error. El error era Z alfa medios por desviación típica entre raíz de n. Entonces Z alfa medios es 1,96, 22 00:02:28,689 --> 00:02:39,030 la desviación era 20, el número de individuos era 500 y me sale 1,753, ¿vale? Entonces ya sé que el intervalo de confianza es media menos error y media más error. 23 00:02:39,030 --> 00:03:00,689 Así que en este caso es 174, que era la media que me había salido en mi muestra, menos 1,753, 174 más 1,753. Y este es el intervalo de confianza que me sale. Tengo un 95% de seguridad de que entre estos dos valores, entre 172,247 y 175,753, está la media de altura de esa población. 24 00:03:01,689 --> 00:03:19,210 Apartado B. ¿Cuál debe ser el tamaño mínimo de la muestra para que el correspondiente intervalo de confianza para mu al 90% tenga una amplitud? Esto también es muy típico. Ahora me preguntan, ¿y qué tamaño debería tener la muestra para que...? Otra cosa. Ahora lo que me preguntan es la N, el número de individuos que debería haber en la muestra. 25 00:03:19,210 --> 00:03:30,009 Y aquí dice, quieren que el intervalo de confianza, el 90%, tenga de amplitud a lo sumo 5 centímetros. Esto de amplitud no es que sea un término matemático que tengamos que conocer específico de este tema. 26 00:03:30,110 --> 00:03:40,050 Lo que me dicen es que el intervalo de confianza que yo construya, que va de un valor a otro, tenga como mucho una amplitud de 5 centímetros. ¿Y cómo le saco yo partido a este dato? 27 00:03:40,050 --> 00:03:54,090 Pues porque ya sabéis que el intervalo de confianza es media menos error y media más error. Entonces, al final, si la amplitud era 5 centímetros, lo que me viene a decir es que el error es a lo sumo de 2,5 centímetros. 28 00:03:54,469 --> 00:04:07,870 ¿Entendéis? O sea, parto la amplitud en 2 y yo sé que no quieren que el error supere los 2,5 centímetros. Cojo la fórmula del error, que ya sabéis que es esta, z alfa medios por deviación típica partido raíz de n, y que eso sea menor o igual que 2,5. 29 00:04:07,870 --> 00:04:30,629 Ahora el zeta de alfa medios, lo que pasa es que lo tengo que volver a calcular, porque antes me habían pedido 95% y ahora 90%, entonces rápidamente, pues si aquí dentro queda el 90%, fuera queda el 10%, repartido así, 5 y 5, así que busco un zeta de alfa medios que a su izquierda deje el 90 más 5, o sea 95%, o sea que en la tabla tengo que buscar 0,95. 30 00:04:30,629 --> 00:04:43,730 Me voy a la tabla y si lo recordáis ocurría esto. Busco el 0,95 y tenía 0,9495 y 0,9505. Uno se queda corto y otro se pasa por lo mismo. Entonces lo que hago es coger el valor intermedio. 31 00:04:43,730 --> 00:04:57,509 entre 1,64 y 1,65, pues 1,645. Vuelvo al ejercicio, venga, el error queríamos que no fuera superior a 2,5, entonces cojo la fórmula y ya voy sustituyendo 1,645, 32 00:04:57,870 --> 00:05:07,430 la desviación sigue siendo 20, n es lo que no conozco, pero sé que me debería dar a lo sumo 2,5, entonces raíz de n que está dividiendo se va al otro lado multiplicando 33 00:05:07,430 --> 00:05:12,310 y 2,5 entonces que estará multiplicando se viene dividiendo, se intercambian los dos. 34 00:05:12,769 --> 00:05:16,850 Mira a ver todo lo que me da eso, raíz de n tiene que ser mayor o igual que 13,16, 35 00:05:17,269 --> 00:05:23,790 la raíz se va al otro lado como cuadrado, o sea que n tiene que ser mayor o igual que 173,18, 36 00:05:23,790 --> 00:05:27,889 o sea que n tiene que ser 174 personas como poco. 37 00:05:28,029 --> 00:05:33,709 Como poco deberíamos preguntar a 174 personas para que el intervalo de confianza al 90% 38 00:05:33,709 --> 00:05:36,790 tuviera de amplitud a lo sumo 5 centímetros. 39 00:05:37,430 --> 00:05:57,149 Otro ejercicio. La cantidad de fruta medida en gramos que contienen los botes de mermelada de una cooperativa se puede aproximar mediante una variable aleatoria con distribución normal de desviación típica de 10 gramos. Fijaos, los ejercicios van a tener mucha literatura, pero al fin y al cabo, ir a los datos. Tengo una desviación típica de 10 gramos y me hablan de la cantidad de fruta que contiene unos botes de mermelada. 40 00:05:57,149 --> 00:06:02,449 ¿Vale? Ah, se seleccionó una muestra aleatoria simple de 100 botes, vale, cogen 100 botes 41 00:06:02,449 --> 00:06:07,170 Y la cantidad total de fruta que contenían fue de 16.000 gramos, todos los botes 42 00:06:07,170 --> 00:06:11,550 Determines un intervalo de confianza al 95% para la media de la población 43 00:06:11,550 --> 00:06:15,990 Bueno, pues tengo una población de media desconocida, de variación típica 10 44 00:06:15,990 --> 00:06:22,050 Y he cogido una muestra de 100 botes y la cantidad total que tenían era 16.000 gramos 45 00:06:22,050 --> 00:06:27,910 Entonces la media, ¿vale? Divido 16.000 entre 100 y me sale la media de fruta que tiene cada bote. 46 00:06:28,050 --> 00:06:31,009 160 gramos tienen de media en esa muestra. 47 00:06:31,310 --> 00:06:34,149 Y me pide el intervalo de confianza al 95%. 48 00:06:34,149 --> 00:06:37,449 Bueno, lo vamos a hacer esto un poco más rápido porque ya hemos hecho uno de estos. 49 00:06:37,990 --> 00:06:41,769 Tengo la fórmula de error, que es Z alfa medios por desviación típica partido raíz de N. 50 00:06:42,250 --> 00:06:47,269 Como Z alfa medios es el del 95%, ya lo he calculado antes, que era 1,96, ¿vale? 51 00:06:47,329 --> 00:06:50,350 Por 10 entre raíz de 100, total que sale 1,96. 52 00:06:50,350 --> 00:07:12,449 El intervalo de confianza es media muestral menos error, media muestral más error. O sea, 160 menos 1,96, 160 más 1,96 y este es el intervalo de confianza, o sea, tengo el 95% de confianza de que entre estos dos valores está la media de gramos de fruta que tienen los botes de esa cooperativa, de esa fábrica. 53 00:07:12,449 --> 00:07:27,069 B. A partir de una muestra aleatoria simple de 64 botes, vale, ahora cogen una muestra de 64 botes, se ha obtenido un intervalo de confianza para la media poblacional con un error de estimación de 2,35 gramos. Determínese el nivel de confianza utilizado. 54 00:07:27,069 --> 00:07:28,629 Fijaos, ahora me dan el error 55 00:07:28,629 --> 00:07:30,449 También me dan el número de botes 56 00:07:30,449 --> 00:07:31,649 Y lo que me preguntan es 57 00:07:31,649 --> 00:07:34,029 ¿Qué nivel de confianza tiene ese intervalo? 58 00:07:34,389 --> 00:07:34,589 ¿Vale? 59 00:07:35,490 --> 00:07:37,029 Cuando no sepáis por dónde tirar 60 00:07:37,029 --> 00:07:38,509 Ir a las fórmulas que conocéis 61 00:07:38,509 --> 00:07:39,769 Y vamos sacando cosas 62 00:07:39,769 --> 00:07:41,449 Por ejemplo, la muestra 63 00:07:41,449 --> 00:07:43,290 Yo sé que tiene 64 botes 64 00:07:43,290 --> 00:07:44,910 Y que el error es 2,35 65 00:07:44,910 --> 00:07:46,990 Bueno, pues voy a utilizar la fórmula del error 66 00:07:46,990 --> 00:07:47,910 Que era esta 67 00:07:47,910 --> 00:07:51,110 Error era Z alfa medios por desviación típica partido raíz de N 68 00:07:51,110 --> 00:07:53,149 Conozco el error, conozco la desviación 69 00:07:53,149 --> 00:07:53,930 Conozco N 70 00:07:53,930 --> 00:07:56,730 De aquí lo que puedo sacar es el Z de alfa medios 71 00:07:56,730 --> 00:07:59,189 raíz de 64 que está dividiendo 72 00:07:59,189 --> 00:08:01,170 se va multiplicando y el 10 que está arriba 73 00:08:01,170 --> 00:08:03,370 multiplicando se va dividiendo, en total me sale 74 00:08:03,370 --> 00:08:04,389 que z alfa medios es 75 00:08:04,389 --> 00:08:07,389 1,88 y ¿cómo utilizo 76 00:08:07,389 --> 00:08:09,189 yo eso? pues como sabéis 77 00:08:09,189 --> 00:08:11,209 el nivel de confianza era 78 00:08:11,209 --> 00:08:13,449 el área que quedaba encerrada entre dos valores simétricos 79 00:08:13,449 --> 00:08:15,410 z alfa medios y menos z de alfa 80 00:08:15,410 --> 00:08:17,430 medios, en este caso sé que z alfa medios 81 00:08:17,430 --> 00:08:19,310 es 1,88 y 82 00:08:19,310 --> 00:08:21,269 menos z alfa medios pues menos 1,88 83 00:08:21,269 --> 00:08:23,470 y quiero saber que nivel de confianza 84 00:08:23,470 --> 00:08:25,089 haya encerrado entre ellos dos 85 00:08:25,089 --> 00:08:37,730 Pues es un ejercicio de los que hemos visto en los primeros vídeos. Quiero calcular el área que hay entre dos valores, y el área que hay entre dos valores era el área que queda por debajo del mayor menos el área que queda por debajo del menor. 86 00:08:38,049 --> 00:08:48,090 La probabilidad de estar por debajo de 1,88 menos la probabilidad de estar por debajo de menos 1,88. La probabilidad de estar por debajo de 1,88, eso se mirará en la tabla, ¿vale? Porque ya está. 87 00:08:48,090 --> 00:09:06,070 Pero el otro, que es un número negativo, había que cambiarle el signo y el símbolo. Es la probabilidad de estar por encima de 1,88. Y la probabilidad de estar por encima de era 1 menos la probabilidad de estar por debajo de, ¿os acordáis? Bueno, es un poco lío, pero esto cuando lo vas escribiendo tú, lo haces con calma y veréis que no os equivocáis. 88 00:09:06,070 --> 00:09:30,470 Entonces, esto ya lo miro en la tabla, esto ya lo miro en la tabla, resulta que da 0,9699 menos 1 menos 0,9699, total 0,9398 es el área que queda encerrado. Entonces, el nivel de confianza es 93,98%, que yo imagino que han dado estos datos para que digamos que es, en definitiva, un 94% de confianza que tenía ese intervalo que han obtenido ellos. 89 00:09:30,470 --> 00:09:44,149 ¿Vale? Y terminamos con un último apartado que dice, en cierta región el gasto familiar realizado en gas natural medido en euros durante un mes determinado se puede aproximar a una distribución normal de media 250 y desviación típica 65. 90 00:09:44,409 --> 00:09:52,710 Fíjate, aquí sí que conocen la media de la población, claro, como es el gas y se lo cobran a todo el mundo, aquí sí que a todo el mundo sí que le han preguntado o tienen un contador para saber cuánto gasta. 91 00:09:52,710 --> 00:10:08,929 Entonces en este caso sí que se conoce la media de la población que es 250 euros de gasto medio tiene esa población. Y me preguntan, se toma una muestra aleatoria simple de 81 familias, cojo 81 familias, ¿cuál es la probabilidad de que la media muestral sea superior a 230 euros? 92 00:10:08,929 --> 00:10:20,330 O sea, en esa población la media de gasto es 250, pero han cogido 81 familias y se preguntan cuál es la probabilidad de que la media de esa muestra de 81 familias supere los 230 euros. 93 00:10:21,070 --> 00:10:27,190 Vamos a ir organizándonos. Tengo una población que sigue una distribución normal conocida de media 250 y desviación típica de 75. 94 00:10:27,909 --> 00:10:37,250 Cojo una muestra de 81, entonces como es una muestra, la muestra se distribuye de esta manera, la media es la misma y luego es desviación típica partido de raíz de n. 95 00:10:37,250 --> 00:10:38,909 entonces mis datos son 96 00:10:38,909 --> 00:10:41,370 250 y 75 97 00:10:41,370 --> 00:10:43,169 partidos por radio 81 y me preguntan 98 00:10:43,169 --> 00:10:44,870 la probabilidad de que la media 99 00:10:44,870 --> 00:10:47,210 de esas 81 familias sea superior 100 00:10:47,210 --> 00:10:48,889 a 230 euros 101 00:10:48,889 --> 00:10:51,230 bueno, pues entonces ya sabéis 102 00:10:51,230 --> 00:10:53,169 que la fórmula para tipificar, ahora usamos 103 00:10:53,169 --> 00:10:55,090 esta, ¿vale? para convertir 104 00:10:55,090 --> 00:10:57,350 mi 230 en una Z 105 00:10:57,350 --> 00:10:59,149 que pueda mirar en la tabla, yo quiero 106 00:10:59,149 --> 00:11:01,210 mirar en la tabla la probabilidad de que Z sea superior a un valor 107 00:11:01,210 --> 00:11:03,009 tengo que tipificar el 230 108 00:11:03,009 --> 00:11:05,309 utilizo esta fórmula, como estamos hablando 109 00:11:05,309 --> 00:11:06,970 de muestras, pues abajo 110 00:11:06,970 --> 00:11:19,970 en el denominador es desviación típica a partir de raíz de n. Total que me sale 230, 950, tal, tal, menos 2,4. O sea, la probabilidad de que la media de esa muestra de familias, 111 00:11:19,990 --> 00:11:30,250 de 81 familias, sea superior a 230 es la probabilidad de que z sea superior a menos 2,4. Como es un número negativo, es la probabilidad de que z sea menor que 2,4. 112 00:11:30,250 --> 00:11:44,789 Y esto lo miro en la tabla. He tipificado el 230, lo he convertido en 2,4. Miro la tabla y me queda 0,9918. O sea, la probabilidad de que la media de esas 81 familias, el gasto sea superior al 130 es 0,9918.