1 00:00:00,000 --> 00:00:05,200 Vamos con el segundo vídeo de ejercicios de distribución normal extraídos de la 2 00:00:05,200 --> 00:00:08,740 selectividad de Madrid o de la PAU de Madrid. Como he dicho en el vídeo 3 00:00:08,740 --> 00:00:11,919 anterior han quedado los casos más típicos, lo que siempre suelen preguntar 4 00:00:11,919 --> 00:00:15,060 y en este vídeo vamos a atender algunos ejercicios más raros que he visto 5 00:00:15,060 --> 00:00:20,239 algunos años, que en definitiva si controlamos el tema al final lo 6 00:00:20,239 --> 00:00:22,899 podemos ir sacando y si no lo controlamos pues para eso están estos 7 00:00:22,899 --> 00:00:26,859 vídeos. Venga un ejercicio que dice la producción por hectárea medida en 8 00:00:26,859 --> 00:00:35,240 kilogramos por hectárea de un olivar se puede aproximar por una distribución, por una variable aleatoria con distribución normal de desviación típica igual a 1.000 kilogramos por hectárea, ¿vale? 9 00:00:35,920 --> 00:00:45,079 A partir de una muestra aleatoria simple de 400 parcelas de una hectárea, o sea, esa es la muestra, han cogido 400 parcelas de una hectárea, se ha obtenido, y me dan estos valores, 10 00:00:45,240 --> 00:00:52,579 como intervalo de confianza para la media poblacional expresado en kilogramos por hectárea. O sea, ya me dan el intervalo de confianza, que esto es una cosa que no habíamos visto antes, 11 00:00:52,579 --> 00:01:00,859 que ya me lo den. Determínese la media de la muestra y el nivel de confianza utilizado para construir el intervalo. Fijaos que curioso, me dan ya el intervalo de confianza hecho 12 00:01:00,859 --> 00:01:10,420 y me piden la media de la muestra y qué nivel de confianza han utilizado para hacer este intervalo. Bueno, pues tengo mi población, distribución normal, no conozco la media, 13 00:01:10,500 --> 00:01:19,340 la desviación típica es 1000. Cojo una muestra de 400 parcelas y me ha salido este intervalo de confianza. Como vosotros ya sabéis, el intervalo de confianza se construye 14 00:01:19,340 --> 00:01:29,400 de esta manera. Media muestral menos error y media muestral más error. De manera que la media muestral estaría justo en el centro del intervalo de confianza. 15 00:01:29,540 --> 00:01:40,540 Y luego, si le sumo el error, pues me da ese valor de la derecha, el 10.082,95, y si le resto el error, pues me daría ese valor de la izquierda, ¿no? El 9.917, etc. 16 00:01:40,540 --> 00:02:04,299 En definitiva, que yo sé que la media muestral es el valor que esté entre medias de esos dos, el que esté entre medias de 9917 y 10082, o sea que haré la media de esos dos valores para sacar la media muestral y la diferencia de la media muestral a los extremos será el error cuando reste la media menos 9917 o el 10082 menos la media, ese será el error, ¿vale? 17 00:02:04,299 --> 00:02:12,780 O sea, no es un ejercicio difícil, lo que pasa es que no es típico que me vayan a pedir esto. Entonces, la media muestral hago, fijaos, sumo esos dos valores y los divido entre dos. 18 00:02:12,939 --> 00:02:20,680 Hago una media de toda la vida, los sumo, los divido entre dos y me sale, mira que bien, justo 10.000, ¿vale? Pues la media muestral es justo 10.000, es el valor que está en el centro. 19 00:02:21,259 --> 00:02:33,159 Y por lo tanto, el error es o bien 10.082,25 menos 10.000 o bien 10.000 menos 9.917,75. Cualquiera de estos dos me tiene que dar lo mismo, que es 82,25, ¿vale? 20 00:02:33,159 --> 00:02:45,120 Ya tengo la media muestral, que es lo primero que me pedían, y ahora ya tengo el error, que es 82,25. ¿A dónde voy yo con esto? Pues cojo la fórmula del error, como sé que ya da 82,25, es igual a la fórmula. 21 00:02:45,539 --> 00:02:56,379 Sé que la desviación es 10.000, sé que n es 400, y con esto saco z de alfa medios, que me da 1,645. A ver si a alguien ya le suena esta cifra de 1,645. 22 00:02:56,719 --> 00:03:00,840 Recordad que me están pidiendo qué nivel de confianza se ha utilizado en ese intervalo. 23 00:03:01,199 --> 00:03:07,259 Quienes recordéis esta cifra, a lo mejor ya suena que será 90%, y que no, pues vamos a ver qué hacemos con esto. 24 00:03:08,259 --> 00:03:13,099 Quiero saber el nivel de confianza, que es lo que queda entre menos z alfa medios y z alfa medios. 25 00:03:13,099 --> 00:03:20,580 Sé que z alfa medios es 1,645, pues el otro, menos 1,645, y quiero conocer el área que encierran entre ellos. 26 00:03:20,580 --> 00:03:28,379 Pues la probabilidad de estar entre dos valores, si recordáis, era la probabilidad de estar por debajo del mayor menos la probabilidad de estar por debajo del menor. 27 00:03:28,639 --> 00:03:37,000 La probabilidad de estar por debajo del mayor, estupendo. La otra, como es un valor negativo, giro el símbolo y cambio el signo, o sea que es la probabilidad de estar por encima de. 28 00:03:37,580 --> 00:03:43,639 Este ya lo miramos en la tabla y el otro, como es la probabilidad de estar por encima de, es 1 menos la probabilidad de estar por debajo de. 29 00:03:43,639 --> 00:04:01,340 Al mirar en la tabla este valor y este, que es el mismo, pues me queda 0,95 menos 1 menos 0,95, o sea, 0,9. Luego, la confianza que habían utilizado era un 90%. Es el área que queda entre esos dos valores, 0,9, pues era un 90% de confianza. 30 00:04:01,340 --> 00:04:04,199 otro ejercicio, el tiempo dedicado cada día a escuchar 31 00:04:04,199 --> 00:04:05,860 música por los estudiantes de secundaria 32 00:04:05,860 --> 00:04:08,259 de una cierta ciudad, es una variable aleatoria 33 00:04:08,259 --> 00:04:09,800 con distribución normal de desviación típica 34 00:04:09,800 --> 00:04:11,800 igual a 15 minutos, vale, tengo 35 00:04:11,800 --> 00:04:13,560 una población y entonces 36 00:04:13,560 --> 00:04:16,100 dicen que el tiempo dedicado 37 00:04:16,100 --> 00:04:18,000 a escuchar música es una variable con distribución 38 00:04:18,000 --> 00:04:19,899 normal de desviación típica de 15 minutos, vale 39 00:04:19,899 --> 00:04:22,019 se toma una muestra aleatoria 40 00:04:22,019 --> 00:04:23,420 simple de 10 estudiantes 41 00:04:23,420 --> 00:04:25,860 y se obtienen los siguientes tiempos, a veces 42 00:04:25,860 --> 00:04:27,920 ocurre, de vez en cuando los ejercicios 43 00:04:27,920 --> 00:04:29,939 me dan los resultados que se han obtenido 44 00:04:29,939 --> 00:04:31,920 entonces han cogido 10 estudiantes 45 00:04:31,920 --> 00:04:33,740 no van a coger 500 y darme 46 00:04:33,740 --> 00:04:36,240 los datos, pero de 10 pues si me lo dan 47 00:04:36,240 --> 00:04:38,360 entonces yo me tendré que encargar 48 00:04:38,360 --> 00:04:39,740 de calcular la media muestral 49 00:04:39,740 --> 00:04:42,240 que tampoco es tan difícil, lo sumo y lo divido entre 10 50 00:04:42,240 --> 00:04:42,540 ¿vale? 51 00:04:43,639 --> 00:04:46,279 A, determine si un intervalo de confianza al 99% 52 00:04:46,279 --> 00:04:48,079 para el tiempo medio diario dedicado a escuchar 53 00:04:48,079 --> 00:04:49,459 música por un estudiante, ¿vale? 54 00:04:49,699 --> 00:04:51,459 entonces como digo, la novedad que tiene esto 55 00:04:51,459 --> 00:04:53,759 la población, no conozco la media, la elevación es 15 56 00:04:53,759 --> 00:04:56,000 cojo una muestra de 10 y la media 57 00:04:56,000 --> 00:04:58,040 muestral no me la dan, pero bueno 58 00:04:58,040 --> 00:05:02,939 lo calculamos, sumo todos esos valores, entonces lo sumamos con calma, ¿vale? No nos vayamos 59 00:05:02,939 --> 00:05:06,720 a equivocar al copiarlos. Divido entre 10, vale, pues ya tengo la media muestral que 60 00:05:06,720 --> 00:05:12,839 era 66. Y ahora ya me piden un intervalo de confianza del 99% para esto. ¿Cómo hago 61 00:05:12,839 --> 00:05:17,079 el intervalo de confianza? Pues ya sabéis, son dos valores que encierran el 99% de manera 62 00:05:17,079 --> 00:05:22,959 que fuera quedado el 1%. Distribuido así, 0,5 para allá, 0,5 para acá. O sea que en 63 00:05:22,959 --> 00:05:29,319 la tabla tendré que buscar un Z de alfa medios que deje a su izquierda el 99 más el 0,5%, 64 00:05:29,319 --> 00:05:37,779 o sea, el 99,5%, o sea, 0,995. Me voy a la tabla, busco por aquí y si lo veis vamos 65 00:05:37,779 --> 00:05:49,899 a encontrar un 0,9949 y 0,9951, o sea, será el valor entre el 2,57 y 2,58, o sea, 2,575, 66 00:05:49,899 --> 00:05:52,740 ¿Vale? Pues vuelvo al ejercicio 67 00:05:52,740 --> 00:05:54,720 El error que tiene esta fórmula 68 00:05:54,720 --> 00:05:56,199 Es igual al 2,575 69 00:05:56,199 --> 00:05:58,120 Que viene en la tabla, por 15 70 00:05:58,120 --> 00:06:00,079 Que era la desviación típica, partido de raíz de 10 71 00:06:00,079 --> 00:06:01,560 Que eran 10 estudiantes, y me da 72 00:06:01,560 --> 00:06:03,860 12,214 73 00:06:03,860 --> 00:06:05,579 Pues el intervalo de confianza es 74 00:06:05,579 --> 00:06:07,920 Media menos error, media más error 75 00:06:07,920 --> 00:06:10,240 La media me había dado 66, pues 66 76 00:06:10,240 --> 00:06:12,160 Menos eso, 66 más esto 77 00:06:12,160 --> 00:06:14,180 Y en definitiva el intervalo de confianza 78 00:06:14,180 --> 00:06:15,740 El 99% es este 79 00:06:15,740 --> 00:06:18,680 Entre 53,786 minutos 80 00:06:18,680 --> 00:06:24,899 y 78,214 minutos de tiempo medio que escuchan música los estudiantes de esa población. 81 00:06:25,800 --> 00:06:31,779 Apartado B. Calcúlese el tamaño muestral mínimo necesario para que la mayor diferencia entre la media de la muestra 82 00:06:31,779 --> 00:06:36,279 y la media poblacional sea menor que 5 minutos con un nivel de confianza del 99%. 83 00:06:36,279 --> 00:06:40,379 Este ejercicio es típico y ya sabéis hacerlo, lo que pasa que lo preguntan de una manera muy rara. 84 00:06:41,000 --> 00:06:46,199 Que la mayor diferencia entre la media de la muestra y la media poblacional sea menor que 5 minutos. 85 00:06:46,480 --> 00:06:47,819 ¿Cómo se come eso? Pues mirad. 86 00:06:48,680 --> 00:06:59,060 Yo tengo aquí la media de la muestra, ¿vale? Que acordaos que era 66, pero bueno, tengo la media de la muestra y cuando le sumo el error y le resto el error, saco dos valores que hacen el intervalo de confianza, 87 00:06:59,060 --> 00:07:08,360 mi intervalo de confianza entre x1 y x2. Y el intervalo de confianza lo que me dice es que la media de la población se mueve entre esos dos valores, ¿vale? Estará entre esos dos valores. 88 00:07:08,360 --> 00:07:25,639 Entonces, cuando han dicho que quieren que la mayor diferencia entre la media de la muestra y la media poblacional, pues mirad, como la media de la muestra está en el medio, la mayor diferencia entre la media de la muestra y la media de la población es si la media de la población me sale totalmente a la izquierda o totalmente a la derecha. 89 00:07:25,639 --> 00:07:46,259 Y esta sería la mayor diferencia que podría haber. Es que si la media de la población me sale justo en los extremos del intervalo. En definitiva, ¿esa diferencia qué es? Pues el error de la media al valor más bajo y de la media muestral al valor más alto, justo eso es el error. O sea que toda esta vuelta es para pedir, quiero que el error sea inferior a 5 minutos. 90 00:07:46,259 --> 00:07:48,199 pero en vez de decir el error han dicho 91 00:07:48,199 --> 00:07:50,279 la mayor diferencia que pueda haber 92 00:07:50,279 --> 00:07:52,319 entre la media muestral y la media poblacional 93 00:07:52,319 --> 00:07:54,360 total, el error, ¿vale? 5 minutos 94 00:07:54,360 --> 00:07:56,220 o sea que como quieren que el error 95 00:07:56,220 --> 00:07:58,180 sea menor o igual que 5 minutos y esta es la 96 00:07:58,180 --> 00:07:58,920 fórmula del error 97 00:07:58,920 --> 00:08:02,079 como han pedido el 99% de confianza 98 00:08:02,079 --> 00:08:04,199 utilizo la zeta de alfa medios que ya he sacado antes 99 00:08:04,199 --> 00:08:06,300 el 2,575, la desviación 100 00:08:06,300 --> 00:08:08,240 era 15, n es lo que me piden ahora 101 00:08:08,240 --> 00:08:10,120 ¿qué tamaño muestral? cuando 102 00:08:10,120 --> 00:08:12,220 preguntan qué tamaño muestral es, a cuánta 103 00:08:12,220 --> 00:08:14,120 gente tengo que preguntar en esa muestra 104 00:08:14,120 --> 00:08:15,439 ¿cuánta gente tiene que ver en la muestra? 105 00:08:15,439 --> 00:08:17,500 menor o igual que 5, pues ya sabéis 106 00:08:17,500 --> 00:08:19,759 raíz de n se va multiplicando, el 5 se va 107 00:08:19,759 --> 00:08:21,699 dividiendo, opero todo eso 108 00:08:21,699 --> 00:08:23,660 la raíz se va como al cuadrado y entonces 109 00:08:23,660 --> 00:08:25,279 n tiene que ser mayor o igual que 110 00:08:25,279 --> 00:08:26,939 59,67, o sea 111 00:08:26,939 --> 00:08:29,519 que tengo que preguntar a 60 personas 112 00:08:29,519 --> 00:08:31,360 tengo que coger una muestra de 60 personas 113 00:08:31,360 --> 00:08:33,460 para que el error sea 114 00:08:33,460 --> 00:08:35,340 menor de 5 minutos, para que la mayor 115 00:08:35,340 --> 00:08:37,139 de las diferencias entre la media de la muestra 116 00:08:37,139 --> 00:08:39,480 y la media de la población, pues sea eso