1 00:00:12,210 --> 00:00:17,410 Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES 2 00:00:17,410 --> 00:00:22,070 arquitecto Pedro Gumiel de Alcalá de Henares y os doy la bienvenida a esta serie de videoclases 3 00:00:22,070 --> 00:00:33,590 de la unidad PR6 dedicada a la inferencia estadística. En la videoclase de hoy estudiaremos 4 00:00:33,590 --> 00:00:50,359 los intervalos de confianza. Vamos a iniciar esta videoclase en esta sección de estimación 5 00:00:50,359 --> 00:00:56,679 por intervalo, hablando, definiendo cuáles son los intervalos de confianza. En este caso 6 00:00:56,679 --> 00:01:01,939 no hablamos de una estimación puntual puesto que no tenemos un único valor numérico en el estimador 7 00:01:01,939 --> 00:01:07,959 sino que vamos a tener dos. Vamos a tener un cierto intervalo que va a tener un límite inferior y un 8 00:01:07,959 --> 00:01:13,939 límite superior, un intervalo dentro de la recta real, así que tenemos dos estimadores y lo que 9 00:01:13,939 --> 00:01:19,319 vamos a hacer es no dar un único valor como estimador sino que vamos a dar un intervalo 10 00:01:19,319 --> 00:01:25,459 limitado, insisto, por esos dos estimadores, el límite inferior y el límite superior. En el caso 11 00:01:25,459 --> 00:01:32,379 de un intervalo de confianza, ese intervalo no se construye de cualquier manera, sino que tiene 12 00:01:32,379 --> 00:01:38,120 que cumplir con estas características que vamos a ver a continuación. Ese intervalo de confianza 13 00:01:38,120 --> 00:01:44,819 va a ser un intervalo simétrico centrado en el estadístico muestral. Así pues, lo que vamos a 14 00:01:44,819 --> 00:01:52,359 hacer es, en el caso en el que queramos estudiar como parámetro poblacional la media, por ejemplo, 15 00:01:52,359 --> 00:01:58,319 vamos a construir un intervalo simétrico centrado en la media muestral. 16 00:01:58,840 --> 00:02:03,439 Si queremos estudiar como parámetro poblacional la proporción, la proporción poblacional, 17 00:02:03,939 --> 00:02:10,139 vamos a construir un intervalo simétrico centrado alrededor de la proporción muestral. 18 00:02:10,800 --> 00:02:15,300 El estimador, los estimadores, puesto que son dos, son los extremos del intervalo 19 00:02:15,300 --> 00:02:20,340 y van a estar centrados en un estadístico, en un valor muestral, 20 00:02:20,340 --> 00:02:26,479 pero que no va a formar parte per se del propio estimador. El estimador es el intervalo, va a estar 21 00:02:26,479 --> 00:02:33,159 centrado en el valor del estadístico muestral. Y ese intervalo, aparte de estar centrado en el 22 00:02:33,159 --> 00:02:39,319 estadístico muestral, va a tener una cierta amplitud. Y la amplitud se va a calcular para que 23 00:02:39,319 --> 00:02:46,860 el parámetro poblacional se encuentre dentro del intervalo de confianza, se encuentre dentro de los 24 00:02:46,860 --> 00:02:53,879 dos estadísticos con probabilidad 1 menos alfa. Y esta probabilidad 1 menos alfa es lo que se llama 25 00:02:53,879 --> 00:03:02,300 nivel de confianza. En un momento dado, más adelante en los ejercicios, se nos pedirá que construyamos 26 00:03:02,300 --> 00:03:09,780 un intervalo de confianza con un nivel de confianza 0,90. Bien, pues lo que queremos es que dentro del 27 00:03:09,780 --> 00:03:15,819 intervalo que construyamos se encuentre el parámetro poblacional con una probabilidad igual a 0,9. 28 00:03:15,819 --> 00:03:31,979 Y esa probabilidad es 1 menos alfa. A alfa se le denomina nivel de significación y representa el riesgo, como podéis ver aquí, de que el parámetro poblacional no esté contenido dentro del intervalo de confianza, lo cual tiene todo el sentido del mundo. 29 00:03:31,979 --> 00:03:49,979 Por ejemplo, si construyo el estimador, el intervalo, formado por esa pareja de valores reales que delimitan el intervalo, para que el parámetro poblacional se encuentre dentro con una probabilidad 1 menos alfa, la probabilidad de que se encuentre fuera será evidentemente alfa. 30 00:03:49,979 --> 00:03:56,319 A alfa se le llama nivel de significación y a 1 menos alfa se le llama nivel de confianza. 31 00:03:57,080 --> 00:04:06,280 Tened cuidado que no se nos pida construir un intervalo de confianza con un nivel de significación 0,05 o con un nivel de confianza 0,95. 32 00:04:06,659 --> 00:04:09,360 Es equivalente, pero es importante no confundir esos dos valores. 33 00:04:11,159 --> 00:04:13,939 ¿Cómo se construyen los intervalos de confianza? 34 00:04:13,939 --> 00:04:16,779 Aquí tenemos estos resultados. 35 00:04:16,779 --> 00:04:40,019 Para la proporción poblacional, el intervalo de confianza con ese nivel de confianza 1 menos alfa, que se representa aquí como subíndice, para la proporción poblacional, que es el argumento de este intervalo de confianza y que se debe representar aquí, viene dado por el intervalo que viene dado por este límite inferior y este límite superior. 36 00:04:40,019 --> 00:04:47,019 los dos estadísticos que mencionaba. Se van a construir como el valor de la proporción muestral 37 00:04:47,019 --> 00:04:54,139 menos z alfa medios, que ahora discutiré, por raíz cuadrada de p por 1 menos p dividido entre la raíz 38 00:04:54,139 --> 00:05:00,379 de n. En cuanto al otro, al extremo superior, se construye de una forma similar, p más, en lugar de 39 00:05:00,379 --> 00:05:08,480 menos, z alfa medios, la raíz cuadrada de p por 1 menos p dividido entre la raíz de n. Y aquí lo que 40 00:05:08,480 --> 00:05:15,980 tenemos en este numerador raíz cuadrada de p por 1 menos p es la varianza para una distribución 41 00:05:15,980 --> 00:05:21,420 binomial, perdón, la varianza, la desviación típica y aquí tenemos exactamente lo mismo. 42 00:05:22,699 --> 00:05:27,779 En el caso de la media poblacional el intervalo de confianza con nivel de confianza 1 menos alfa 43 00:05:27,779 --> 00:05:33,339 para la media poblacional mu se puede determinar de dos maneras. Si la varianza poblacional es 44 00:05:33,339 --> 00:05:37,959 conocida como habíamos mencionado anteriormente la vamos a utilizar y lo que tenemos sería como 45 00:05:37,959 --> 00:05:44,000 extremo inferior del intervalo x barra la media muestral menos z alfa medios por sigma entre la 46 00:05:44,000 --> 00:05:52,779 raíz de n. Sigma entre la raíz de n es la desviación típica de la distribución de las medias muestrales 47 00:05:52,779 --> 00:05:57,740 y en el extremo superior se construye de la misma manera de forma análoga pero en lugar de restar 48 00:05:57,740 --> 00:06:04,160 sumar la media muestral más z alfa medios sigma entre la raíz de n. Esto si sigma, la desviación 49 00:06:04,160 --> 00:06:09,160 típica poblacional desconocida. En el caso en el que la varianza, la desviación típica poblacional 50 00:06:09,160 --> 00:06:14,939 sea desconocida, lo que vamos a utilizar es en lugar de esta, la desviación típica, la varianza 51 00:06:14,939 --> 00:06:23,000 muestral. Volváis a la videoclase anterior donde hablamos de estimación puntual. Vamos a hacer esto 52 00:06:23,000 --> 00:06:27,740 considerando siempre que el tamaño de la población, el tamaño de la muestra son suficientemente 53 00:06:27,740 --> 00:06:34,540 grandes como para que la varianza muestral sea estimador centrado y eficiente para la 54 00:06:34,540 --> 00:06:40,759 variaza poblacional y la podamos utilizar directamente quién es este zeta alfa medios 55 00:06:40,759 --> 00:06:47,000 que aparece aquí repetidamente bueno pues zeta alfa medios es la abscisa de la distribución 56 00:06:47,000 --> 00:06:55,639 normal estándar que deja a la izquierda un área de probabilidad uno menos alfa medios en principio 57 00:06:55,639 --> 00:07:02,019 Puede parecer todo esto un poco confuso porque tenemos el nivel de confianza 1 menos alfa, el nivel de significación alfa. 58 00:07:02,759 --> 00:07:12,220 Aquí tenemos una abstisa zeta alfa medios, pero luego me dejan que deja a la izquierda un área de probabilidad 1 menos alfa medios. 59 00:07:13,220 --> 00:07:16,319 Puede resultar muy confuso todo esto, pero en el fondo tiene mucho sentido. 60 00:07:16,319 --> 00:07:24,540 A ver, veamos. Estamos construyendo un intervalo de confianza y este nivel de confianza 1 menos alfa me indica que 61 00:07:24,540 --> 00:07:32,740 la probabilidad de que la media esté contenida dentro, la media poblacional, esté contenida dentro de este intervalo de confianza es 1 menos alfa. 62 00:07:34,279 --> 00:07:44,060 Dado que aquí estamos hablando de una distribución normal y estándar, supongamos que estamos con realmente una población estándar y supongamos que realmente la media fuera 0. 63 00:07:44,060 --> 00:08:05,540 En ese caso tenemos un intervalo simétrico con una probabilidad de realizar dos abscisas, una a la izquierda y otra a la derecha, simétricas, así pues si una fuera, por ejemplo, la de la derecha 1,2, la de la izquierda sería menos 1,2, y la idea está en que la probabilidad contenida entre esas dos abscisas va a ser 1 menos alfa. 64 00:08:05,540 --> 00:08:14,139 Nivel de significación alfa es la probabilidad de que la media no se encuentre, la media poblacional, no se encuentre dentro del intervalo de confianza. 65 00:08:14,139 --> 00:08:21,139 Y ahora fijaos, esta probabilidad alfa se va a repartir a la izquierda y a la derecha del intervalo. 66 00:08:22,819 --> 00:08:33,659 Habrá una cierta probabilidad de que si la media no está dentro del intervalo, sea menor que el extremo inferior o bien mayor que el extremo superior. 67 00:08:33,659 --> 00:08:41,399 Puesto que el intervalo es simétrico, esas dos probabilidades son iguales y esa probabilidad alfa se reparte por mitades. 68 00:08:41,919 --> 00:08:49,519 Alfa medios es la probabilidad de que la media poblacional esté por debajo del extremo inferior del intervalo 69 00:08:49,519 --> 00:08:56,519 y alfa medios será la probabilidad de que la media poblacional se encuentre por encima del extremo superior del intervalo. 70 00:08:58,179 --> 00:09:02,279 De ahí zeta alfa medios. Ese alfa medios me recuerda eso. 71 00:09:02,279 --> 00:09:09,039 alfa partido por 2 es la probabilidad de que la media poblacional no se encuentre dentro del 72 00:09:09,039 --> 00:09:14,320 intervalo bien porque esté por debajo del extremo inferior alfa medios bien porque se encuentre por 73 00:09:14,320 --> 00:09:22,659 encima del extremo superior el otro alfa medios que suman alfa ahora este zeta alfa medios de esas 74 00:09:22,659 --> 00:09:26,980 dos abstizas que he mencionado anteriormente el extremo inferior y el extremo superior se 75 00:09:26,980 --> 00:09:31,899 correspondería en la distribución normal estándar con el extremo superior deja a 76 00:09:31,899 --> 00:09:36,240 la derecha alfa medios y consecuentemente deja a la izquierda una 77 00:09:36,240 --> 00:09:42,940 probabilidad uno menos alfa medios todo cobra sentido y desde luego cobrará 78 00:09:42,940 --> 00:09:47,080 mucho más sentido cuando resolvamos los ejercicios que guardan relación con esta 79 00:09:47,080 --> 00:09:51,700 parte con esto que hemos visto ya podemos resolver estos ejercicios 3 y 4 80 00:09:51,700 --> 00:09:58,960 que resolveremos en clase resolveremos en alguna vídeo clase posterior en el 81 00:09:58,960 --> 00:10:05,799 aula virtual de la asignatura tenéis disponibles otros recursos y cuestionarios. Asimismo tenéis 82 00:10:05,799 --> 00:10:11,179 más información en las fuentes bibliográficas y en la web. No dudéis en traer vuestras dudas 83 00:10:11,179 --> 00:10:16,299 e inquietudes a clase o al foro de dudas en el aula virtual. Un saludo y hasta pronto.