Activa JavaScript para disfrutar de los vídeos de la Mediateca.
09 Intervalo de confianza para la media poblacional
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Este vídeo pertenece a una lista de 11 vídeos en los que intento explicar la distribución normal y ejercicios.
Estamos ya terminando pero todavía nos queda un último concepto. Es un poco difícil pero ya es como la culminación de todas estas cosas que hemos ido aprendiendo sobre la distribución normal y es el intervalo de confianza para la media poblacional.
00:00:00
Bueno, pues como siempre, imaginaos que estamos queriendo medir la estatura media en España, ¿de acuerdo? Coger todo un país y conocer su estatura media. Yo lo que hago no es calcular la estatura de todos los individuos, sino que cojo una muestra y calculo la media de esa muestra, la media muestral.
00:00:12
Y la gran pregunta entonces es, ¿vale, la media muestral es igual a la media poblacional? ¿Yo puedo tener la certeza de que la media de esa muestra que he escogido es igual a la media auténtica de toda la población española? Bueno, pues supongamos que tomamos una muestra de 100 personas, ¿vale? N es igual a 100. Y entonces obtenemos una media muestral de 169 centímetros, ¿vale? La media muestral, la X con la rayita, es 169.
00:00:29
entonces podríamos afirmar con bastante certeza
00:00:54
que la media de la población
00:00:57
la auténtica media de toda la población
00:00:59
está entre, pues vamos a ver
00:01:00
si la media muestra, nos ha salido
00:01:03
169 centímetros
00:01:04
yo creo que la media de estatura
00:01:06
en España está entre 100 y 238
00:01:08
hombre pues sí, puedo afirmar
00:01:11
que la media de estatura estará entre 100
00:01:12
y 238, incluso podría afirmar
00:01:14
un poco más, puedo pensar que está
00:01:16
entre 120 y 218
00:01:18
estoy cogiendo estos valores porque son simétricos
00:01:21
en torno a 169, ¿vale? Puedo apurar un poco más. ¿Puedo pensar que la media estatura en España está entre 140 y 198?
00:01:23
Hombre, pues sí. Pues seguro que la media está por debajo de 198 y por encima de 140, pues también.
00:01:31
¿Puedo entonces esperar que la media de la población, por ejemplo, esté entre 160 y 178?
00:01:36
Pues hombre, no sé. Hemos cogido 100 personas a medio de 169. Venga, vamos a poner que sí.
00:01:43
¿Puedo decir entonces que la media en España está entre 168 y 170? Pues aquí ya yo tengo mis dudas. Solo porque he acogido 100 personas y la media me dé 169 es un poco arriesgado pensar que, venga, pues todos los españoles la media está entre 168 y 170. No.
00:01:48
¿Puedo decir entonces, si mi muestra salió a 169, que la media auténtica de la población española es 169? Pues no. Eso ya genera muchísimas dudas. No porque haya cogido 100 personas y me dé 169, esa es la media de la población.
00:02:04
Y en esto consiste un poco los intervalos de confianza. Yo tengo la media de la muestra que he obtenido. Cojo una muestra y obtengo una media, ¿vale?
00:02:18
Y quiero encontrar dos valores entre los cuales decir con cierta seguridad que estará la media de la población, ¿vale? Yo tengo un x1 que sea más bajito y un x2 que sea más alto. Y decir, mira, seguro que entre estos dos valores la media de la población se va moviendo. Puede que sea como mucho esto y como poco esto, ¿vale?
00:02:26
que es lo bueno, que como yo sé que las medias de las muestras tienen una distribución normal y conozco sus fórmulas, pues puedo llegar a conocer con qué nivel de confianza doy ese intervalo.
00:02:46
Es decir, yo puedo decir, mira, entre este valor y este hay una cierta probabilidad, hay una cierta seguridad de que estará la auténtica media de la población. Y esto es lo que es el intervalo de confianza para mu, para la media poblacional.
00:02:59
A partir de la media muestral puedo generar un intervalo de confianza dentro del cual tenemos cierta seguridad de que estará la media poblacional
00:03:12
O sea, yo no te voy a decir la media poblacional seguro que es esta
00:03:19
Pero te puedo dar una seguridad de que está entre este valor y este otro valor
00:03:21
Eso es el intervalo de confianza para la media poblacional
00:03:26
Bueno, vosotros ya habíamos aprendido a calcular intervalos de confianza
00:03:29
Pues este z alfa medios y menos z alfa medios, ¿lo recordáis?
00:03:35
eran valores simétricos en torno al 0 y usábamos una distribución normal 0,1 de las que puedo utilizar las tablas. Y ahora lo que quiero es encontrar en mi ejercicio
00:03:38
dos valores x1 y x2 que generen ese mismo intervalo dentro del cual seguramente esté la media poblacional. Y ya sabemos que como yo tengo la media de las muestras,
00:03:46
Pues eso sigue una distribución normal de media mu y desviación igual a desviación poblacional partido de raíz de n, ¿vale? Entonces, mirad, voy a tipificar, tengo ahí x1 a la izquierda, quiero conocer cuánto es el valor de menos z alfa medios, ¿vale? De menos z alfa medios, entonces siguiendo la fórmula, la tengo aquí, menos z alfa medios es igual a x1 menos media partido de desviación típica partido de raíz de n.
00:03:57
Os suena estar la fórmula de tipificar, solo que en vez de ser partido de desviación típica, es partido de desviación típica partido raíz de n, porque estoy con las medias de las muestras. Y quiero despejar x1, ¿vale? Entonces, mirad, todo lo que hay abajo que es sigma partido de raíz de n, todo eso que está dividiendo se va multiplicando a menos z alfa medios.
00:04:23
Y luego la media muestral menos media muestral se va sumando al otro lado, o sea que esto queda así, ¿vale? x1 será la media muestral menos z alfa medios por sigma partido de raíz de n, ¿vale? Estupendo.
00:04:43
Y ahora por la derecha x2, ¿vale? Ese valor cuando lo tipifique o cuando lo destipifique, cuando averigue cuánto es, tengo que z alfa medios es igual a x2 menos la media partido de desviación típica partido de raíz de n.
00:04:56
Entonces, desviación típica partido raíz de n, la parte del denominador será a la otra lado multiplicando y menos media muestral será a otro lado sumando.
00:05:07
Quedará algo así, x2 es x, o sea, la media muestral, más z alfa medios por desviación típica partido raíz de n.
00:05:15
Entonces, fijaos a la izquierda en esto, esta cosita, z alfa medios por desviación partido raíz de n, lo voy a llamar error, ¿vale?
00:05:21
Se llama error, de manera que a la derecha, pues también aparece esta cosita, ¿vale? También es el error, ¿vale?
00:05:27
Entonces, el intervalo de confianza que yo busco va de x1 a x2, y si os fijáis en las fórmulas que hemos hecho aquí a los lados, el intervalo de confianza es media muestral menos error y media muestral más error.
00:05:33
Los extremos de ese intervalo de confianza, el valor más bajo y el valor más alto es media muestral menos error y media muestral más error.
00:05:47
En definitiva, toda la fórmula es media muestral menos z alfa medios por desviación típica a partir de raíz de n, coma, y el otro valor es media muestral más el error, z alfa medios por desviación típica a partir de raíz de n.
00:05:54
Y con esta fórmula es como vamos a obtener los intervalos de confianza a partir de la media muestral para la media poblacional.
00:06:06
Entonces, importantísimo, sabemos que el error tiene esta fórmula, hay que aprendérselo. El error es el z alfa medios por desviación típica a partir de raíz de n, ¿vale?
00:06:14
Entonces, supongamos que tenemos una muestra, por ejemplo, de 100 personas, ¿vale? Tengo una muestra de 100 personas, calculo la media de esta muestra de 100 personas, le sumo el error y me da el x2, le resto el error y me da el x1 y con esto he obtenido el intervalo de confianza, ¿vale? Con esas 100 personas, pues diría, el intervalo de confianza va de x1 a x2, estupendo.
00:06:22
pero, y ya sé entonces
00:06:44
que la media de la población
00:06:46
pues está entre esos dos valores moviéndose
00:06:48
¿vale? pero imaginemos
00:06:50
que en vez de coger una muestra de 100 personas, cojo una muestra
00:06:52
de 10.000 personas
00:06:54
si yo en vez de calcular la estatura de 100 personas
00:06:55
se lo calculo para 10.000 personas
00:06:58
mirad, he calculado
00:07:00
muchísima más gente, y como eso está
00:07:02
dividiendo, resulta que el error
00:07:03
me sale mucho más pequeño
00:07:06
cuanta más gente cojo en la
00:07:07
muestra, si cojo una muestra de 10.000 personas
00:07:10
pues esa media que me salga
00:07:12
de 10.000 personas es una media mucho más precisa, mucho más fiable, es mucho más centrada seguro, porque en 10.000 personas ya sería raro que me salieran
00:07:14
muchas altas o muchas bajitas. Al final unas compensan con otras y una muestra, si tiene una n muy elevada, el error es muy pequeño. Entonces ahora lo que haría es
00:07:22
tengo la media de esas 10.000 personas, le sumo el error, que resulta que ahora es mucho más pequeñito, y saco x2. Le resto el error, que es más pequeñito, y tengo x1
00:07:31
y por lo tanto el intervalo de confianza es mucho más estrecho. Cuantas más personas tenga en mi muestra, menor será el error y puedo precisar mucho más
00:07:41
el intervalo de confianza. Digo, mira, ahora tengo mucha más certeza porque es que le he preguntado a 10.000 personas. Entonces la media de esa muestra
00:07:51
realmente es mucho más precisa y ahora yo puedo asegurar que la media de la población se mueve entre estos dos valores más estrechos.
00:07:57
¿vale? es decir
00:08:05
que a partir de la media muestral
00:08:07
yo cojo una muestra y a partir de la media muestral
00:08:09
genero un intervalo de confianza dentro del cual
00:08:11
tengo cierta seguridad de que se encuentra la media poblacional
00:08:12
¿vale? como el intervalo de confianza
00:08:15
es la media muestral menos el error
00:08:17
y la media muestral más el error
00:08:18
y el error tiene esta fórmula
00:08:20
cuanto más grande sea la muestra
00:08:22
cuanto más grande sea n
00:08:25
más fiable será la media muestral
00:08:26
que obtengo, más pequeño será el error
00:08:29
y más específico será el intervalo
00:08:31
de confianza
00:08:33
vamos a verlo con un ejemplo
00:08:33
el tiempo diario que los adultos de una determinada ciudad
00:08:35
dedican a actividades deportivas expresado en minutos
00:08:38
se puede aproximar por una variable aleatoria
00:08:40
con distribución normal de desviación típica
00:08:42
20 minutos, ¿vale?
00:08:44
tengo unas personas que dedican tiempo a actividades deportivas
00:08:45
no sé la media de lo que calculan
00:08:48
o sea, de lo que dedican
00:08:50
pero la desviación típica es 20 minutos, ¿vale?
00:08:51
entonces, A, para una muestra aleatoria simple
00:08:54
250 habitantes
00:08:56
cojo a 250 habitantes
00:08:58
y se ha obtenido un tiempo medio de dedicación
00:08:59
actividades deportivas de 90 minutos diarios.
00:09:02
Calcúlese un intervalo de confianza
00:09:04
al 90% para Mu.
00:09:06
O sea, he cogido una muestra de 250 personas
00:09:08
y de esa muestra me sale
00:09:10
que practican deporte una media
00:09:12
de 90 minutos diarios. Vale, pues sabiendo que
00:09:14
esas 250 personas dedican 90 minutos diarios,
00:09:16
hazme un intervalo de confianza
00:09:19
al 90% para la media de
00:09:20
toda la población. Dame dos valores,
00:09:22
como si te digo, mira, pues el 90% de la gente
00:09:24
practica deporte entre 80 y
00:09:26
100 minutos. Por ejemplo, hazme un intervalo
00:09:28
de confianza con una seguridad del 90%.
00:09:30
¿Vale? Tengo
00:09:32
mi población entonces, que no conozco
00:09:34
la media, pero sí la desviación típica
00:09:36
que es 20. Y luego cojo una muestra
00:09:38
de 250 personas, de esas 250
00:09:39
la media me sale 90
00:09:42
y me piden el intervalo de confianza
00:09:43
al 90%
00:09:46
para mu, para la media poblacional, ¿no?
00:09:47
Sácame un intervalo de confianza dentro
00:09:50
del cual está la media de la población
00:09:51
con un 90% de seguridad.
00:09:53
¿Vale? Tengo aquí mis valores, z alfa
00:09:56
medios, menos z alfa medios.
00:09:57
recordad como se calculaban intervalos de confianza
00:09:58
quiero dos valores
00:10:02
que me encierran al 90% de la gente
00:10:03
como en la tabla no puedo mirar dos valores
00:10:05
solo puedo mirar el área por debajo
00:10:07
de un valor, entonces sé
00:10:09
que lo que queda fuera es el 10%
00:10:11
repartido, 5% por arriba
00:10:13
5% por abajo, o sea que en el fondo
00:10:15
busco un valor que a su izquierda
00:10:17
está dejando al 90% más al 5%
00:10:19
o sea 95%
00:10:22
total, que tengo que buscar en la tabla
00:10:23
que valor deja por debajo
00:10:25
al 0,95. Entonces, y vamos a la tabla, aquí ocurría una cosa, que tengo el 0,95 está entre este y este, ¿no? De manera que era entre 1,64 y 1,65,
00:10:27
o sea que Z alfa medios era 1,645, ¿vale? Pues ya está. Error, tenía esta fórmula, ¿vale? Z alfa medios por sigma partido raíz de n. Vale, pues ya tengo
00:10:39
que la Z alfa medios es 1,645, sigma es 20, partido de raíz de 250 y esto me sale 2,08. Así que mi
00:10:49
intervalo de confianza es la media muestral menos error y media muestral más error. O sea, 90 menos
00:10:58
2,08 y 90 más 2,08. O sea, ya tengo el intervalo de confianza. Está entre 87,92 y 92,08. Es decir,
00:11:03
Yo sé que la media del tiempo que dedica al deporte esa población está entre 87,92 y 92,08 con un 90% de certeza. Yo no te voy a decir cuánto es la media de la población, pero está entre esos dos valores con un 90% de seguridad. En eso consiste encontrar un intervalo con una cierta confianza.
00:11:13
Y luego, este que hemos hecho es el ejercicio más típico
00:11:35
Y luego, este apartado B también es muy típico
00:11:38
Que me digan
00:11:40
¿Qué tamaño mínimo debe tener una muestra aleatoria simple
00:11:40
Para que el error máximo cometido en la estimación
00:11:44
De la media poblacional por la media muestral
00:11:46
Sea menor que un minuto
00:11:48
Con el mismo nivel de confianza del 90%?
00:11:50
¿Qué narices significa esto?
00:11:52
Bueno, a ver, ahora lo que me piden es
00:11:53
¿Qué tamaño de muestra a cuántas personas debería entrevistar
00:11:55
Para que el error sea menor que uno?
00:11:58
Con esa misma confianza del 90%
00:12:01
A mí antes el error lo he calculado
00:12:03
verdad, era 1,645, aquí en N había puesto 250 personas, y con eso el error me salía 2,08, ¿vale? Ese era el error que tenía, y luego el error, ¿para qué me servía?
00:12:05
Pues hacía media menos error y media más error, y entonces mi intervalo de confianza me daba este. Pero ahora quieren, dicen, no, mira, vamos a hacer una cosa,
00:12:14
quiero que el error sea más pequeño, quiero que me ajustes mucho más ese intervalo de confianza, ¿vale? Entonces debería entrevistar a más personas para poder ganar
00:12:23
certeza y saber que la media de esa muestra es mucho más precisa. Es un apartado muy típico, como digo, que es ¿y a cuánta gente debería
00:12:31
entrevistar para reducir el error? Para que mi intervalo de confianza sea más ajustado, ¿vale? Entonces, mirad, yo ahora quiero que el error,
00:12:38
antes daba 2,08, yo ahora quiero que el error sea menor o igual que 1. Quiero que el error no supere el 1. Entonces, cojo la fórmula del error,
00:12:46
z alfa medios por sigma partido raíz de n y quiero que sea menor o igual que 1, ¿vale? Sigma sigue siendo el mismo, z alfa medios sigue siendo el mismo
00:12:54
porque siguen queriendo un nivel de confianza del 90%, o sea que yo usaría la tabla y llegaría a mí mismo 1,645, pero n es lo que me piden ahora,
00:13:02
¿a cuánta gente debería entrevistar para que el error me dé menos que 1? Voy poniendo los datos, 1,645 por 20 partido raíz de n, menor o igual que 1,
00:13:12
Entonces, ahora, esa raíz de n que está dividiendo se va a ir al otro lado multiplicando y el 1 que estará multiplicando se va a venir dividiendo. O sea, que me queda esto. Lo que quiero es despejar n. Opero todos esos números, me dan 32,9 y raíz de n tiene que ser mayor o igual que eso.
00:13:20
Entonces la raíz pasa al otro lado como al cuadrado, total que me dice que n tiene que ser mayor o igual que 1082,41. Debería entrevistar a una cantidad mayor o igual a 1082,41 personas. En definitiva, a 1083 personas. He pasado de encuestar a 250 a coger a 1083 si quiero ahora que el error se me reduzca y no supere el 1.
00:13:36
por cierto, cuando hagáis todos los ejercicios
00:13:59
siempre hay que redondear hacia arriba
00:14:01
veis que ha salido 1.082,4
00:14:03
pero no lo dejo en 1.082 porque me piden
00:14:05
que el error sea menor o igual
00:14:07
que 1 y de eso al despejar me queda
00:14:09
que la n tiene que ser mayor o igual
00:14:11
que lo que me dé, entonces mi respuesta
00:14:13
es, si quieres que el error en el
00:14:15
intervalo de confianza no sea
00:14:17
mayor que un minuto, entonces hay que
00:14:19
entrevistar por lo menos a 1.083
00:14:21
personas
00:14:23
- Materias:
- Matemáticas
- Autor/es:
- Paco Gil
- Subido por:
- Francisco G.
- Licencia:
- Reconocimiento - Compartir igual
- Visualizaciones:
- 64
- Fecha:
- 13 de abril de 2020 - 11:57
- Visibilidad:
- Público
- Centro:
- IES VICTORIA KENT
- Duración:
- 14′ 25″
- Relación de aspecto:
- 16:10 El estándar usado por los portátiles de 15,4" y algunos otros, es ancho como el 16:9.
- Resolución:
- 1280x800 píxeles
- Tamaño:
- 45.54 MBytes