Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

09 Intervalo de confianza para la media poblacional

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 13 de abril de 2020 por Francisco G.

64 visualizaciones

Este vídeo pertenece a una lista de 11 vídeos en los que intento explicar la distribución normal y ejercicios.

Descargar la transcripción

Estamos ya terminando pero todavía nos queda un último concepto. Es un poco difícil pero ya es como la culminación de todas estas cosas que hemos ido aprendiendo sobre la distribución normal y es el intervalo de confianza para la media poblacional. 00:00:00
Bueno, pues como siempre, imaginaos que estamos queriendo medir la estatura media en España, ¿de acuerdo? Coger todo un país y conocer su estatura media. Yo lo que hago no es calcular la estatura de todos los individuos, sino que cojo una muestra y calculo la media de esa muestra, la media muestral. 00:00:12
Y la gran pregunta entonces es, ¿vale, la media muestral es igual a la media poblacional? ¿Yo puedo tener la certeza de que la media de esa muestra que he escogido es igual a la media auténtica de toda la población española? Bueno, pues supongamos que tomamos una muestra de 100 personas, ¿vale? N es igual a 100. Y entonces obtenemos una media muestral de 169 centímetros, ¿vale? La media muestral, la X con la rayita, es 169. 00:00:29
entonces podríamos afirmar con bastante certeza 00:00:54
que la media de la población 00:00:57
la auténtica media de toda la población 00:00:59
está entre, pues vamos a ver 00:01:00
si la media muestra, nos ha salido 00:01:03
169 centímetros 00:01:04
yo creo que la media de estatura 00:01:06
en España está entre 100 y 238 00:01:08
hombre pues sí, puedo afirmar 00:01:11
que la media de estatura estará entre 100 00:01:12
y 238, incluso podría afirmar 00:01:14
un poco más, puedo pensar que está 00:01:16
entre 120 y 218 00:01:18
estoy cogiendo estos valores porque son simétricos 00:01:21
en torno a 169, ¿vale? Puedo apurar un poco más. ¿Puedo pensar que la media estatura en España está entre 140 y 198? 00:01:23
Hombre, pues sí. Pues seguro que la media está por debajo de 198 y por encima de 140, pues también. 00:01:31
¿Puedo entonces esperar que la media de la población, por ejemplo, esté entre 160 y 178? 00:01:36
Pues hombre, no sé. Hemos cogido 100 personas a medio de 169. Venga, vamos a poner que sí. 00:01:43
¿Puedo decir entonces que la media en España está entre 168 y 170? Pues aquí ya yo tengo mis dudas. Solo porque he acogido 100 personas y la media me dé 169 es un poco arriesgado pensar que, venga, pues todos los españoles la media está entre 168 y 170. No. 00:01:48
¿Puedo decir entonces, si mi muestra salió a 169, que la media auténtica de la población española es 169? Pues no. Eso ya genera muchísimas dudas. No porque haya cogido 100 personas y me dé 169, esa es la media de la población. 00:02:04
Y en esto consiste un poco los intervalos de confianza. Yo tengo la media de la muestra que he obtenido. Cojo una muestra y obtengo una media, ¿vale? 00:02:18
Y quiero encontrar dos valores entre los cuales decir con cierta seguridad que estará la media de la población, ¿vale? Yo tengo un x1 que sea más bajito y un x2 que sea más alto. Y decir, mira, seguro que entre estos dos valores la media de la población se va moviendo. Puede que sea como mucho esto y como poco esto, ¿vale? 00:02:26
que es lo bueno, que como yo sé que las medias de las muestras tienen una distribución normal y conozco sus fórmulas, pues puedo llegar a conocer con qué nivel de confianza doy ese intervalo. 00:02:46
Es decir, yo puedo decir, mira, entre este valor y este hay una cierta probabilidad, hay una cierta seguridad de que estará la auténtica media de la población. Y esto es lo que es el intervalo de confianza para mu, para la media poblacional. 00:02:59
A partir de la media muestral puedo generar un intervalo de confianza dentro del cual tenemos cierta seguridad de que estará la media poblacional 00:03:12
O sea, yo no te voy a decir la media poblacional seguro que es esta 00:03:19
Pero te puedo dar una seguridad de que está entre este valor y este otro valor 00:03:21
Eso es el intervalo de confianza para la media poblacional 00:03:26
Bueno, vosotros ya habíamos aprendido a calcular intervalos de confianza 00:03:29
Pues este z alfa medios y menos z alfa medios, ¿lo recordáis? 00:03:35
eran valores simétricos en torno al 0 y usábamos una distribución normal 0,1 de las que puedo utilizar las tablas. Y ahora lo que quiero es encontrar en mi ejercicio 00:03:38
dos valores x1 y x2 que generen ese mismo intervalo dentro del cual seguramente esté la media poblacional. Y ya sabemos que como yo tengo la media de las muestras, 00:03:46
Pues eso sigue una distribución normal de media mu y desviación igual a desviación poblacional partido de raíz de n, ¿vale? Entonces, mirad, voy a tipificar, tengo ahí x1 a la izquierda, quiero conocer cuánto es el valor de menos z alfa medios, ¿vale? De menos z alfa medios, entonces siguiendo la fórmula, la tengo aquí, menos z alfa medios es igual a x1 menos media partido de desviación típica partido de raíz de n. 00:03:57
Os suena estar la fórmula de tipificar, solo que en vez de ser partido de desviación típica, es partido de desviación típica partido raíz de n, porque estoy con las medias de las muestras. Y quiero despejar x1, ¿vale? Entonces, mirad, todo lo que hay abajo que es sigma partido de raíz de n, todo eso que está dividiendo se va multiplicando a menos z alfa medios. 00:04:23
Y luego la media muestral menos media muestral se va sumando al otro lado, o sea que esto queda así, ¿vale? x1 será la media muestral menos z alfa medios por sigma partido de raíz de n, ¿vale? Estupendo. 00:04:43
Y ahora por la derecha x2, ¿vale? Ese valor cuando lo tipifique o cuando lo destipifique, cuando averigue cuánto es, tengo que z alfa medios es igual a x2 menos la media partido de desviación típica partido de raíz de n. 00:04:56
Entonces, desviación típica partido raíz de n, la parte del denominador será a la otra lado multiplicando y menos media muestral será a otro lado sumando. 00:05:07
Quedará algo así, x2 es x, o sea, la media muestral, más z alfa medios por desviación típica partido raíz de n. 00:05:15
Entonces, fijaos a la izquierda en esto, esta cosita, z alfa medios por desviación partido raíz de n, lo voy a llamar error, ¿vale? 00:05:21
Se llama error, de manera que a la derecha, pues también aparece esta cosita, ¿vale? También es el error, ¿vale? 00:05:27
Entonces, el intervalo de confianza que yo busco va de x1 a x2, y si os fijáis en las fórmulas que hemos hecho aquí a los lados, el intervalo de confianza es media muestral menos error y media muestral más error. 00:05:33
Los extremos de ese intervalo de confianza, el valor más bajo y el valor más alto es media muestral menos error y media muestral más error. 00:05:47
En definitiva, toda la fórmula es media muestral menos z alfa medios por desviación típica a partir de raíz de n, coma, y el otro valor es media muestral más el error, z alfa medios por desviación típica a partir de raíz de n. 00:05:54
Y con esta fórmula es como vamos a obtener los intervalos de confianza a partir de la media muestral para la media poblacional. 00:06:06
Entonces, importantísimo, sabemos que el error tiene esta fórmula, hay que aprendérselo. El error es el z alfa medios por desviación típica a partir de raíz de n, ¿vale? 00:06:14
Entonces, supongamos que tenemos una muestra, por ejemplo, de 100 personas, ¿vale? Tengo una muestra de 100 personas, calculo la media de esta muestra de 100 personas, le sumo el error y me da el x2, le resto el error y me da el x1 y con esto he obtenido el intervalo de confianza, ¿vale? Con esas 100 personas, pues diría, el intervalo de confianza va de x1 a x2, estupendo. 00:06:22
pero, y ya sé entonces 00:06:44
que la media de la población 00:06:46
pues está entre esos dos valores moviéndose 00:06:48
¿vale? pero imaginemos 00:06:50
que en vez de coger una muestra de 100 personas, cojo una muestra 00:06:52
de 10.000 personas 00:06:54
si yo en vez de calcular la estatura de 100 personas 00:06:55
se lo calculo para 10.000 personas 00:06:58
mirad, he calculado 00:07:00
muchísima más gente, y como eso está 00:07:02
dividiendo, resulta que el error 00:07:03
me sale mucho más pequeño 00:07:06
cuanta más gente cojo en la 00:07:07
muestra, si cojo una muestra de 10.000 personas 00:07:10
pues esa media que me salga 00:07:12
de 10.000 personas es una media mucho más precisa, mucho más fiable, es mucho más centrada seguro, porque en 10.000 personas ya sería raro que me salieran 00:07:14
muchas altas o muchas bajitas. Al final unas compensan con otras y una muestra, si tiene una n muy elevada, el error es muy pequeño. Entonces ahora lo que haría es 00:07:22
tengo la media de esas 10.000 personas, le sumo el error, que resulta que ahora es mucho más pequeñito, y saco x2. Le resto el error, que es más pequeñito, y tengo x1 00:07:31
y por lo tanto el intervalo de confianza es mucho más estrecho. Cuantas más personas tenga en mi muestra, menor será el error y puedo precisar mucho más 00:07:41
el intervalo de confianza. Digo, mira, ahora tengo mucha más certeza porque es que le he preguntado a 10.000 personas. Entonces la media de esa muestra 00:07:51
realmente es mucho más precisa y ahora yo puedo asegurar que la media de la población se mueve entre estos dos valores más estrechos. 00:07:57
¿vale? es decir 00:08:05
que a partir de la media muestral 00:08:07
yo cojo una muestra y a partir de la media muestral 00:08:09
genero un intervalo de confianza dentro del cual 00:08:11
tengo cierta seguridad de que se encuentra la media poblacional 00:08:12
¿vale? como el intervalo de confianza 00:08:15
es la media muestral menos el error 00:08:17
y la media muestral más el error 00:08:18
y el error tiene esta fórmula 00:08:20
cuanto más grande sea la muestra 00:08:22
cuanto más grande sea n 00:08:25
más fiable será la media muestral 00:08:26
que obtengo, más pequeño será el error 00:08:29
y más específico será el intervalo 00:08:31
de confianza 00:08:33
vamos a verlo con un ejemplo 00:08:33
el tiempo diario que los adultos de una determinada ciudad 00:08:35
dedican a actividades deportivas expresado en minutos 00:08:38
se puede aproximar por una variable aleatoria 00:08:40
con distribución normal de desviación típica 00:08:42
20 minutos, ¿vale? 00:08:44
tengo unas personas que dedican tiempo a actividades deportivas 00:08:45
no sé la media de lo que calculan 00:08:48
o sea, de lo que dedican 00:08:50
pero la desviación típica es 20 minutos, ¿vale? 00:08:51
entonces, A, para una muestra aleatoria simple 00:08:54
250 habitantes 00:08:56
cojo a 250 habitantes 00:08:58
y se ha obtenido un tiempo medio de dedicación 00:08:59
actividades deportivas de 90 minutos diarios. 00:09:02
Calcúlese un intervalo de confianza 00:09:04
al 90% para Mu. 00:09:06
O sea, he cogido una muestra de 250 personas 00:09:08
y de esa muestra me sale 00:09:10
que practican deporte una media 00:09:12
de 90 minutos diarios. Vale, pues sabiendo que 00:09:14
esas 250 personas dedican 90 minutos diarios, 00:09:16
hazme un intervalo de confianza 00:09:19
al 90% para la media de 00:09:20
toda la población. Dame dos valores, 00:09:22
como si te digo, mira, pues el 90% de la gente 00:09:24
practica deporte entre 80 y 00:09:26
100 minutos. Por ejemplo, hazme un intervalo 00:09:28
de confianza con una seguridad del 90%. 00:09:30
¿Vale? Tengo 00:09:32
mi población entonces, que no conozco 00:09:34
la media, pero sí la desviación típica 00:09:36
que es 20. Y luego cojo una muestra 00:09:38
de 250 personas, de esas 250 00:09:39
la media me sale 90 00:09:42
y me piden el intervalo de confianza 00:09:43
al 90% 00:09:46
para mu, para la media poblacional, ¿no? 00:09:47
Sácame un intervalo de confianza dentro 00:09:50
del cual está la media de la población 00:09:51
con un 90% de seguridad. 00:09:53
¿Vale? Tengo aquí mis valores, z alfa 00:09:56
medios, menos z alfa medios. 00:09:57
recordad como se calculaban intervalos de confianza 00:09:58
quiero dos valores 00:10:02
que me encierran al 90% de la gente 00:10:03
como en la tabla no puedo mirar dos valores 00:10:05
solo puedo mirar el área por debajo 00:10:07
de un valor, entonces sé 00:10:09
que lo que queda fuera es el 10% 00:10:11
repartido, 5% por arriba 00:10:13
5% por abajo, o sea que en el fondo 00:10:15
busco un valor que a su izquierda 00:10:17
está dejando al 90% más al 5% 00:10:19
o sea 95% 00:10:22
total, que tengo que buscar en la tabla 00:10:23
que valor deja por debajo 00:10:25
al 0,95. Entonces, y vamos a la tabla, aquí ocurría una cosa, que tengo el 0,95 está entre este y este, ¿no? De manera que era entre 1,64 y 1,65, 00:10:27
o sea que Z alfa medios era 1,645, ¿vale? Pues ya está. Error, tenía esta fórmula, ¿vale? Z alfa medios por sigma partido raíz de n. Vale, pues ya tengo 00:10:39
que la Z alfa medios es 1,645, sigma es 20, partido de raíz de 250 y esto me sale 2,08. Así que mi 00:10:49
intervalo de confianza es la media muestral menos error y media muestral más error. O sea, 90 menos 00:10:58
2,08 y 90 más 2,08. O sea, ya tengo el intervalo de confianza. Está entre 87,92 y 92,08. Es decir, 00:11:03
Yo sé que la media del tiempo que dedica al deporte esa población está entre 87,92 y 92,08 con un 90% de certeza. Yo no te voy a decir cuánto es la media de la población, pero está entre esos dos valores con un 90% de seguridad. En eso consiste encontrar un intervalo con una cierta confianza. 00:11:13
Y luego, este que hemos hecho es el ejercicio más típico 00:11:35
Y luego, este apartado B también es muy típico 00:11:38
Que me digan 00:11:40
¿Qué tamaño mínimo debe tener una muestra aleatoria simple 00:11:40
Para que el error máximo cometido en la estimación 00:11:44
De la media poblacional por la media muestral 00:11:46
Sea menor que un minuto 00:11:48
Con el mismo nivel de confianza del 90%? 00:11:50
¿Qué narices significa esto? 00:11:52
Bueno, a ver, ahora lo que me piden es 00:11:53
¿Qué tamaño de muestra a cuántas personas debería entrevistar 00:11:55
Para que el error sea menor que uno? 00:11:58
Con esa misma confianza del 90% 00:12:01
A mí antes el error lo he calculado 00:12:03
verdad, era 1,645, aquí en N había puesto 250 personas, y con eso el error me salía 2,08, ¿vale? Ese era el error que tenía, y luego el error, ¿para qué me servía? 00:12:05
Pues hacía media menos error y media más error, y entonces mi intervalo de confianza me daba este. Pero ahora quieren, dicen, no, mira, vamos a hacer una cosa, 00:12:14
quiero que el error sea más pequeño, quiero que me ajustes mucho más ese intervalo de confianza, ¿vale? Entonces debería entrevistar a más personas para poder ganar 00:12:23
certeza y saber que la media de esa muestra es mucho más precisa. Es un apartado muy típico, como digo, que es ¿y a cuánta gente debería 00:12:31
entrevistar para reducir el error? Para que mi intervalo de confianza sea más ajustado, ¿vale? Entonces, mirad, yo ahora quiero que el error, 00:12:38
antes daba 2,08, yo ahora quiero que el error sea menor o igual que 1. Quiero que el error no supere el 1. Entonces, cojo la fórmula del error, 00:12:46
z alfa medios por sigma partido raíz de n y quiero que sea menor o igual que 1, ¿vale? Sigma sigue siendo el mismo, z alfa medios sigue siendo el mismo 00:12:54
porque siguen queriendo un nivel de confianza del 90%, o sea que yo usaría la tabla y llegaría a mí mismo 1,645, pero n es lo que me piden ahora, 00:13:02
¿a cuánta gente debería entrevistar para que el error me dé menos que 1? Voy poniendo los datos, 1,645 por 20 partido raíz de n, menor o igual que 1, 00:13:12
Entonces, ahora, esa raíz de n que está dividiendo se va a ir al otro lado multiplicando y el 1 que estará multiplicando se va a venir dividiendo. O sea, que me queda esto. Lo que quiero es despejar n. Opero todos esos números, me dan 32,9 y raíz de n tiene que ser mayor o igual que eso. 00:13:20
Entonces la raíz pasa al otro lado como al cuadrado, total que me dice que n tiene que ser mayor o igual que 1082,41. Debería entrevistar a una cantidad mayor o igual a 1082,41 personas. En definitiva, a 1083 personas. He pasado de encuestar a 250 a coger a 1083 si quiero ahora que el error se me reduzca y no supere el 1. 00:13:36
por cierto, cuando hagáis todos los ejercicios 00:13:59
siempre hay que redondear hacia arriba 00:14:01
veis que ha salido 1.082,4 00:14:03
pero no lo dejo en 1.082 porque me piden 00:14:05
que el error sea menor o igual 00:14:07
que 1 y de eso al despejar me queda 00:14:09
que la n tiene que ser mayor o igual 00:14:11
que lo que me dé, entonces mi respuesta 00:14:13
es, si quieres que el error en el 00:14:15
intervalo de confianza no sea 00:14:17
mayor que un minuto, entonces hay que 00:14:19
entrevistar por lo menos a 1.083 00:14:21
personas 00:14:23
Materias:
Matemáticas
Autor/es:
Paco Gil
Subido por:
Francisco G.
Licencia:
Reconocimiento - Compartir igual
Visualizaciones:
64
Fecha:
13 de abril de 2020 - 11:57
Visibilidad:
Público
Centro:
IES VICTORIA KENT
Duración:
14′ 25″
Relación de aspecto:
16:10 El estándar usado por los portátiles de 15,4" y algunos otros, es ancho como el 16:9.
Resolución:
1280x800 píxeles
Tamaño:
45.54 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid