Activa JavaScript para disfrutar de los vídeos de la Mediateca.
08 Inferencia estadística
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Este vídeo pertenece a una lista de 11 vídeos en los que intento explicar la distribución normal y ejercicios.
Vamos a entrar ya en la inferencia estadística. ¿Qué es la inferencia estadística? Bueno, pues la inferencia estadística trata de averiguar características de una población a partir del estudio de una muestra de esta.
00:00:00
¿De acuerdo? Si yo quiero conocer tendencias, datos, parámetros, lo que sea de una población, como por ejemplo de un país, yo muchas veces no puedo encuestar a todo el país. Lo que hago es estudiar una muestra, un conjunto de individuos de esa gran población. Yo solo estudio una muestra.
00:00:13
Por ejemplo, imaginad que queremos conocer cuál es la estatura media en España, ¿vale? ¿Qué es lo que tendría que hacer para obtener esta media de estatura en España? Pues lo justo, lo realmente justo sería coger a todos los españoles, a partir de una determinada edad, que ya sepa que van a medir eso, que no van a crecer más, y medirles. Medir a todos los españoles y calcular la media de eso.
00:00:28
Pero como comprenderéis, es prácticamente una tarea imposible conseguir eso, estar midiendo a todos los españoles. Entonces, ¿qué es lo que se hace? Pues se coge una muestra de españoles, un pequeño, o no tan pequeño, pero en cualquier caso, un conjunto de españoles.
00:00:49
y de ellos saco una media de estatura, una media que por cierto tiene este símbolo, es una X con una rayita encima. ¿Por qué este símbolo distinto? Porque esta es la media muestral.
00:01:04
Esto significa que es la media de una muestra, mientras que Mu es la media de toda la población, lo que yo realmente quiero averiguar, pero cojo una muestra y hago la media de su estatura
00:01:16
y esa es la media muestral. Entonces, ¿cómo consigo yo la media de una muestra? Pues muy fácil, me pongo por ejemplo en la puerta de un pabellón de baloncesto
00:01:25
esperando que salgan los chicos de entrenar y entonces les voy midiendo y saco la media de altura. ¿Esa muestra me vale? Pues hombre, no, porque precisamente en un pabellón de baloncesto
00:01:33
seguro que hay chicos muy altos, entonces no sería una muestra que sea más representativa, no sería una muestra justa, porque esa gente va a medir seguramente más de lo que mide
00:01:42
por lo general un individuo español.
00:01:51
Entonces, ¿qué es lo que puedo hacer? Pues mira, me pongo
00:01:53
en la puerta de un bingo, porque para jugar
00:01:55
al bingo no hay que ser ni alto ni bajito, ¿verdad?
00:01:57
Y mido todas las personas que salen de ahí.
00:01:59
Pues hombre, tampoco.
00:02:01
Porque a lo mejor en el bingo solo tengo
00:02:03
una representación de gente ya
00:02:05
con determinada edad, porque no es un juego
00:02:07
al que vaya gente de todas las edades.
00:02:09
Lo que quiero decir con esto es que para coger
00:02:11
una muestra representativa,
00:02:13
si es que es lo que se quiere coger, que muchas veces
00:02:15
no, pero deberíamos querer coger una muestra
00:02:17
representativa, fiel del reflejo
00:02:19
de la sociedad, tenemos que coger una muestra
00:02:21
que mantenga las proporciones
00:02:23
de esa población, o sea, la proporción
00:02:25
entre chicos y chicas, las proporciones
00:02:27
de edades, de gente mayor, adulta
00:02:29
y joven, incluso a lo mejor habría
00:02:31
que coger gente de todas las comunidades
00:02:33
por si acaso resulta que una comunidad
00:02:34
es más alta que otra, etc.
00:02:36
Esto es de la...
00:02:39
Esto corresponde a la teoría
00:02:41
del tema de estadística, así que no nos detenemos
00:02:42
mucho, pero sí que vemos esto. Existen
00:02:45
diversos métodos para obtener muestras
00:02:47
representativas de una población.
00:02:48
Digamos que una muestra representativa es una muestra justa,
00:02:50
¿vale? Que es como un reflejo
00:02:53
en miniatura de cómo son
00:02:55
los individuos de esa población.
00:02:56
Uno de los métodos más comunes es el muestreo
00:02:58
aleatorio simple. Es decir, en vez de ponerme
00:03:00
en la puerta de un bingo o ponerme en la puerta
00:03:02
de un pabellón o lo que sea, si yo tuviera
00:03:04
una lista de toda la población,
00:03:06
que puedo conseguir una lista de la población, por ejemplo,
00:03:08
España, y de ahí, aleatoriamente,
00:03:10
al azar, cojo un número de personas.
00:03:13
Por ejemplo, 500. Si yo cojo
00:03:14
500 personas al azar, si realmente es al azar, pues se espera que esas personas mantengan las
00:03:16
proporciones de la población del país, o sea, la proporción entre chicos y chicas, las proporciones
00:03:22
de edades, etcétera, ¿vale? Bueno, no nos detenemos más en esto. Vale, ahora supongamos entonces que
00:03:27
sabemos, supongamos que sabemos que la estatura en España sigue una distribución normal de media
00:03:33
170, o sea, ya sabemos que la media de estatura en España es 170 y desviación típica 12, ¿vale? Media 170, desviación típica 12. Entonces eso sigue una curva como esta.
00:03:39
Ya sabéis lo que significa la curva, que hay mucha gente que mide 170, incluso 172, 174, 168, ¿vale? Entre 160, 180, hay mucha gente que mide eso. Algunas personas miden
00:03:50
190, ¿vale? Porque son altas. Ya 2 metros mide muy poquita gente. Y lo mismo al otro lado, ¿no? Ya gente que mide 140, pues tan bajitas hay poco.
00:04:03
Gente que mide 150, pues también es poco, ¿vale? En definitiva, que si voy midiendo a todos y recogiendo los datos, pues me sale esta curva, ¿no?
00:04:13
Bueno, pues ahora imaginemos que hemos cogido muestras de tamaño N, de tamaño el que sea. Por ejemplo, muestras de 100 personas, ¿vale?
00:04:20
Cojo muestras de 100 personas y a esas 100 personas les calculo su media muestral. La media es su estatura. Estoy calculando la media de conjuntos de 100 personas. Estoy calculando la media muestral.
00:04:27
entonces vosotros pensáis que si yo cojo 100 españoles al azar y calculo su media
00:04:40
pues a lo mejor hay muchas muestras que me darían de media 171
00:04:45
por ejemplo, si yo represento aquí cuántas muestras me han dado de media 171
00:04:50
que son muestras de gente un poquito más alta, habíamos dicho que la media era 170
00:04:56
bueno, pues a lo mejor cojo 100 personas y me sale media 171
00:05:00
pues es que he cogido gente un poquito más alta que la media
00:05:03
También podría salir un buen número de muestras cuya media estatura me salga 168. Bueno, pues he cogido muestras un poquito más bajitas, ¿no? Seguramente me va a salir el mayor número es de muestras cuya media de estatura sale 170, ¿vale?
00:05:05
Ya sería raro, fijaos, ya sería raro coger a 100 personas y que la media sustentura fuera 175, porque es ya bastante más alto que la media normal. Y también sería raro coger una muestra de gente con una tendencia muy bajita y cuya media fuera 166.
00:05:21
Lo que quiero decir es que si voy haciendo todas estas medias de muestras, al final resulta que me queda este dibujo. Fijaos, otra curva de distribución normal. ¿Qué significa esto? Que las medias de las muestras que yo escojo, o sea, yo cojo muestras de personas y calculo su media, pues las medias forman a su vez una nueva distribución normal, donde tan raro es que me salgan valores muy altos como valores muy bajos.
00:05:36
Y por lo general, las medias de las muestras estarán en torno a esos valores centrales, como podéis ver aquí. Vamos a hacer entonces una pequeña comparativa muy importante.
00:06:04
Esta sería la población. Imaginemos que esta es la población en España, ¿vale? Y esta es su curva de distribución normal. Y esta sería la curva de distribución normal
00:06:12
si voy cogiendo muestras y calculando la media de estatura en cada muestra, ¿vale? Entonces, características. Mirad, la población tiene una media que era mu, que es 170.
00:06:20
Estupendo. Hay muchísima gente que mide 170. Es el valor que más se repite. Y mi muestra, la media muestral, que era esta X con la radio encima, pues resulta que también el 170 es el valor que más se da.
00:06:31
Lo más normal es que si yo cojo grupos, por ejemplo, de 100 personas, la media de su estatura también sea 170. O sea que la población y las muestras coinciden en la media.
00:06:44
Pero ahora fijaos en esto, como había dicho, si yo voy cogiendo a gente en mi población, pues hay algunas personas que miden 1,90, pues hay gente alta.
00:06:55
Entonces hay un grupo de personas que miden 1,90. Ya hay poquita gente que mide a 2 metros y 2,10 ya pues muy poquitos.
00:07:02
Alguno habrá, pero muy poquitos. Sin embargo, fijaos, en mi curva de las muestras es imposible coger un grupo de 100 personas y que la media de su estatura esté de 190.
00:07:07
O sea, ya como no estoy cogiendo una persona, sino una muestra, por ejemplo, de 100 o incluso de 1000. Imagina que cojo 1000 personas. Es imposible que la media me salga 190. Entonces, lo que quiero decir con esto es que cómo se distribuyen las medias de una muestra es una curva normal muchísimo más estrechita, muchísimo más comprimida en torno a los valores centrales, ¿vale?
00:07:17
donde la población tiene una desviación típica que era sigma, las muestras son curvas muchísimo más compactas, entonces realmente su desviación es esta, responde a esta fórmula, es la misma desviación que la población dividido entre raíz de n, dividido entre la raíz del número de personas que tengan las muestras, ¿vale?
00:07:36
Por ejemplo, 100 o raíz entre lo que sea. De modo que, como veis, como lo estoy dividiendo entre raíz del número de personas de la muestra, pues la desviación es más pequeña y la curva me sale más estrecha.
00:07:56
Y esto es importante. Cuanta más gente coja en las muestras, o sea, si en vez de coger una muestra de 100, cojo una muestra de 10.000 personas, pues con más razón la media me sale más cerca del valor central.
00:08:07
Si cojo una muestra de 10.000 personas, ya es rarísimo que la media de sus estaturas me salga 1.80, por ejemplo, porque tanta gente, tanta gente, no pueden ser todos altos, ¿comprendéis?
00:08:21
Entonces, cuando yo calculo la media de las muestras, esta media sigue una distribución normal más estrechita, con la misma media, pero con la desviación típica partido de raíz de n, ¿vale?
00:08:32
Si esto es una distribución normal mu y sigma, las muestras, la media de las muestras sigue una distribución normal de misma media, mu, o sea, la media sí que va a acabar dando la misma, pero la desviación típica es partido de raíz de n.
00:08:43
Vamos a ver un ejemplo que es como esto se puede ir practicando. Supongamos que sabemos que la duración media de las bombillas de una determinada marca sigue una distribución normal de media 1500 horas y desviación típica 160, ¿vale?
00:08:56
tengo unas bombillas que duran de media a 1500 horas con una desviación típica de 160. Si escogemos una bombilla al azar, ¿cuál es la probabilidad de que funcione más de 1524 horas?
00:09:08
Hemos dicho que la media era 1500, pues ¿cuál es la probabilidad de que una bombilla funcione más de 1524 horas? Bueno, ya lo veremos. Pero si cogemos una muestra de 100 bombillas
00:09:19
y calculamos su duración media, cojo 100 bombillas y calculo la duración media de las 100. ¿Cuál es la probabilidad de que sea superior a 1524? Eso ya es distinto.
00:09:27
Entonces, ¿cómo se hace? Pues vamos allá, mirad, con una bombilla tenía una distribución normal de media 1500 y desviación típica 160, ¿recordáis? Entonces lo que hacemos es calcular la probabilidad de durar más de 1524 horas, que es lo que vemos en el dibujo.
00:09:37
Entonces, había que tipificar, ¿os acordáis? La X la paso a la Z, es decir, Z es X menos la media partido de la variación típica, o sea, 1.524 menos 1.500 partido de 160 me da 0,15. La probabilidad de durar más de 1.524 horas es la probabilidad de que Z sea superior a 0,15.
00:09:52
Y para ser superior a 0,15 realmente calculábamos 1 menos ser inferior a 0,15. Esto lo miraba en la tabla, resulta que me da 0,4404. Hay un 44,04% de probabilidades de que una bombilla dure más de 1524 horas.
00:10:09
O por así decirlo, el 44% de las bombillas podría durar más de 1524 horas, ¿vale? Bombillas individuales. Pero si cojo una muestra de 100 bombillas, miro a ver cuánto duran las 100 y calculo la media de su duración, mi distribución ya es esta, media mu, pero la desviación típica es sigma partido de raíz de n, ¿vale?
00:10:26
que en vez de ser 160 va a ser
00:10:46
160 partido raíz de 100
00:10:48
la raíz de 100 es 10, o sea que al final va a dar
00:10:50
16 de desviación típica
00:10:52
o sea, distribución normal 1500 y 16
00:10:54
en vez de 160, vale
00:10:56
y me pide cuál es la probabilidad de que la media
00:10:58
de esa muestra sea superior a 1524
00:11:00
no de que una bombilla dure más
00:11:02
sino de que la media de las 100 bombillas
00:11:04
sea superior a 1524
00:11:06
entonces tipifico, pero fijaos, ahora al tipificar
00:11:07
la fórmula es esta, claro, es
00:11:10
media menos la media poblacional
00:11:12
partido de, no de desviación típica, sino de desviación típica partido raíz de n, ¿vale? En definitiva, ahora al poner los números, abajo no va 160, sino que ahora es 16, ¿vale?
00:11:14
Y esto me sale 1,5. Entonces, la probabilidad de que la media de esa muestra sea superior a 1524 es igual a la probabilidad de que z sea superior a 1,5.
00:11:24
y entonces esto es 1 menos 0,5, fijaos, lo miro en la tabla y ahora da 0,0668.
00:11:35
O sea, solo hay un 6,68% de probabilidad de que si cojo 100 bombillas, la media de su duración sea superior a 1594.
00:11:41
Porque claro, no es que una bombilla me salga, no, es que la media de las 100 bombillas supere eso y eso ya es mucho más difícil.
00:11:49
Venga, cerramos con un ejercicio más para seguir practicando.
00:11:56
Se conoce que el peso de las lubinas producidas en una piscifactoría se puede aproximar por una distribución normal de media 600, ¿vale?
00:11:59
Y desviación típica 100, o sea, tenemos unas lubinas cuyo peso medio es 600 con una desviación típica de 100.
00:12:06
Considerando una muestra aleatoria simple de 20 lubinas, cálculese la probabilidad de que su peso medio sea inferior a 550 gramos.
00:12:13
O sea, ahora cojo 20 lubinas, no una, una muestra de 20 lubinas y me piden cuál es la probabilidad de que el peso medio de las 20 sea inferior a 550 gramos, ¿vale?
00:12:19
Tenía aquí la piscifactoría, cada lubina tiene esta distribución de media 600, desviación típica 100. Pero si cojo 20, entonces ahora n en la fórmula es 20, sigo una distribución de media 600 y desviación 100 entre raíz de 20. Sigma entre raíz de n. Esta es la distribución que utilizo yo en los ejercicios.
00:12:28
Y entonces realmente me están pidiendo cuál es la probabilidad de que la media del peso de esas 20 lubinas sea inferior a 550, ¿vale? Pues tipifico, pero claro, tipifico con esta fórmula, es x menos media partido de desviación típica partido de raíz de n, entonces me sale 550 menos 600 partido de 100 partido de raíz de 20 y esto me sale menos 2,236.
00:12:47
Entonces la probabilidad de que la media de 20 lubinas sea inferior a 550 gramos es lo mismo que Z sea inferior a menos 2,236. Tengo un valor negativo, pero ya sabéis, cambio el signo y cambio el símbolo, es la probabilidad de que Z sea mayor que tanto.
00:13:10
La probabilidad de ser mayor que es 1 menos la probabilidad de ser menor que. Esto ya lo miro en la tabla y me sale 1 menos 0,9873, total 0,0127. O sea, la probabilidad de que cogiendo 20 lubinas el peso medio de las 20 sea inferior a 550 es muy pequeño, la probabilidad es 0,0127, o sea, 1,27%.
00:13:24
- Materias:
- Matemáticas
- Autor/es:
- Paco Gil
- Subido por:
- Francisco G.
- Licencia:
- Reconocimiento - Compartir igual
- Visualizaciones:
- 140
- Fecha:
- 13 de abril de 2020 - 11:56
- Visibilidad:
- Público
- Centro:
- IES VICTORIA KENT
- Duración:
- 13′ 46″
- Relación de aspecto:
- 16:10 El estándar usado por los portátiles de 15,4" y algunos otros, es ancho como el 16:9.
- Resolución:
- 1280x800 píxeles
- Tamaño:
- 40.97 MBytes