Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

08 Inferencia estadística

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 13 de abril de 2020 por Francisco G.

140 visualizaciones

Este vídeo pertenece a una lista de 11 vídeos en los que intento explicar la distribución normal y ejercicios.

Descargar la transcripción

Vamos a entrar ya en la inferencia estadística. ¿Qué es la inferencia estadística? Bueno, pues la inferencia estadística trata de averiguar características de una población a partir del estudio de una muestra de esta. 00:00:00
¿De acuerdo? Si yo quiero conocer tendencias, datos, parámetros, lo que sea de una población, como por ejemplo de un país, yo muchas veces no puedo encuestar a todo el país. Lo que hago es estudiar una muestra, un conjunto de individuos de esa gran población. Yo solo estudio una muestra. 00:00:13
Por ejemplo, imaginad que queremos conocer cuál es la estatura media en España, ¿vale? ¿Qué es lo que tendría que hacer para obtener esta media de estatura en España? Pues lo justo, lo realmente justo sería coger a todos los españoles, a partir de una determinada edad, que ya sepa que van a medir eso, que no van a crecer más, y medirles. Medir a todos los españoles y calcular la media de eso. 00:00:28
Pero como comprenderéis, es prácticamente una tarea imposible conseguir eso, estar midiendo a todos los españoles. Entonces, ¿qué es lo que se hace? Pues se coge una muestra de españoles, un pequeño, o no tan pequeño, pero en cualquier caso, un conjunto de españoles. 00:00:49
y de ellos saco una media de estatura, una media que por cierto tiene este símbolo, es una X con una rayita encima. ¿Por qué este símbolo distinto? Porque esta es la media muestral. 00:01:04
Esto significa que es la media de una muestra, mientras que Mu es la media de toda la población, lo que yo realmente quiero averiguar, pero cojo una muestra y hago la media de su estatura 00:01:16
y esa es la media muestral. Entonces, ¿cómo consigo yo la media de una muestra? Pues muy fácil, me pongo por ejemplo en la puerta de un pabellón de baloncesto 00:01:25
esperando que salgan los chicos de entrenar y entonces les voy midiendo y saco la media de altura. ¿Esa muestra me vale? Pues hombre, no, porque precisamente en un pabellón de baloncesto 00:01:33
seguro que hay chicos muy altos, entonces no sería una muestra que sea más representativa, no sería una muestra justa, porque esa gente va a medir seguramente más de lo que mide 00:01:42
por lo general un individuo español. 00:01:51
Entonces, ¿qué es lo que puedo hacer? Pues mira, me pongo 00:01:53
en la puerta de un bingo, porque para jugar 00:01:55
al bingo no hay que ser ni alto ni bajito, ¿verdad? 00:01:57
Y mido todas las personas que salen de ahí. 00:01:59
Pues hombre, tampoco. 00:02:01
Porque a lo mejor en el bingo solo tengo 00:02:03
una representación de gente ya 00:02:05
con determinada edad, porque no es un juego 00:02:07
al que vaya gente de todas las edades. 00:02:09
Lo que quiero decir con esto es que para coger 00:02:11
una muestra representativa, 00:02:13
si es que es lo que se quiere coger, que muchas veces 00:02:15
no, pero deberíamos querer coger una muestra 00:02:17
representativa, fiel del reflejo 00:02:19
de la sociedad, tenemos que coger una muestra 00:02:21
que mantenga las proporciones 00:02:23
de esa población, o sea, la proporción 00:02:25
entre chicos y chicas, las proporciones 00:02:27
de edades, de gente mayor, adulta 00:02:29
y joven, incluso a lo mejor habría 00:02:31
que coger gente de todas las comunidades 00:02:33
por si acaso resulta que una comunidad 00:02:34
es más alta que otra, etc. 00:02:36
Esto es de la... 00:02:39
Esto corresponde a la teoría 00:02:41
del tema de estadística, así que no nos detenemos 00:02:42
mucho, pero sí que vemos esto. Existen 00:02:45
diversos métodos para obtener muestras 00:02:47
representativas de una población. 00:02:48
Digamos que una muestra representativa es una muestra justa, 00:02:50
¿vale? Que es como un reflejo 00:02:53
en miniatura de cómo son 00:02:55
los individuos de esa población. 00:02:56
Uno de los métodos más comunes es el muestreo 00:02:58
aleatorio simple. Es decir, en vez de ponerme 00:03:00
en la puerta de un bingo o ponerme en la puerta 00:03:02
de un pabellón o lo que sea, si yo tuviera 00:03:04
una lista de toda la población, 00:03:06
que puedo conseguir una lista de la población, por ejemplo, 00:03:08
España, y de ahí, aleatoriamente, 00:03:10
al azar, cojo un número de personas. 00:03:13
Por ejemplo, 500. Si yo cojo 00:03:14
500 personas al azar, si realmente es al azar, pues se espera que esas personas mantengan las 00:03:16
proporciones de la población del país, o sea, la proporción entre chicos y chicas, las proporciones 00:03:22
de edades, etcétera, ¿vale? Bueno, no nos detenemos más en esto. Vale, ahora supongamos entonces que 00:03:27
sabemos, supongamos que sabemos que la estatura en España sigue una distribución normal de media 00:03:33
170, o sea, ya sabemos que la media de estatura en España es 170 y desviación típica 12, ¿vale? Media 170, desviación típica 12. Entonces eso sigue una curva como esta. 00:03:39
Ya sabéis lo que significa la curva, que hay mucha gente que mide 170, incluso 172, 174, 168, ¿vale? Entre 160, 180, hay mucha gente que mide eso. Algunas personas miden 00:03:50
190, ¿vale? Porque son altas. Ya 2 metros mide muy poquita gente. Y lo mismo al otro lado, ¿no? Ya gente que mide 140, pues tan bajitas hay poco. 00:04:03
Gente que mide 150, pues también es poco, ¿vale? En definitiva, que si voy midiendo a todos y recogiendo los datos, pues me sale esta curva, ¿no? 00:04:13
Bueno, pues ahora imaginemos que hemos cogido muestras de tamaño N, de tamaño el que sea. Por ejemplo, muestras de 100 personas, ¿vale? 00:04:20
Cojo muestras de 100 personas y a esas 100 personas les calculo su media muestral. La media es su estatura. Estoy calculando la media de conjuntos de 100 personas. Estoy calculando la media muestral. 00:04:27
entonces vosotros pensáis que si yo cojo 100 españoles al azar y calculo su media 00:04:40
pues a lo mejor hay muchas muestras que me darían de media 171 00:04:45
por ejemplo, si yo represento aquí cuántas muestras me han dado de media 171 00:04:50
que son muestras de gente un poquito más alta, habíamos dicho que la media era 170 00:04:56
bueno, pues a lo mejor cojo 100 personas y me sale media 171 00:05:00
pues es que he cogido gente un poquito más alta que la media 00:05:03
También podría salir un buen número de muestras cuya media estatura me salga 168. Bueno, pues he cogido muestras un poquito más bajitas, ¿no? Seguramente me va a salir el mayor número es de muestras cuya media de estatura sale 170, ¿vale? 00:05:05
Ya sería raro, fijaos, ya sería raro coger a 100 personas y que la media sustentura fuera 175, porque es ya bastante más alto que la media normal. Y también sería raro coger una muestra de gente con una tendencia muy bajita y cuya media fuera 166. 00:05:21
Lo que quiero decir es que si voy haciendo todas estas medias de muestras, al final resulta que me queda este dibujo. Fijaos, otra curva de distribución normal. ¿Qué significa esto? Que las medias de las muestras que yo escojo, o sea, yo cojo muestras de personas y calculo su media, pues las medias forman a su vez una nueva distribución normal, donde tan raro es que me salgan valores muy altos como valores muy bajos. 00:05:36
Y por lo general, las medias de las muestras estarán en torno a esos valores centrales, como podéis ver aquí. Vamos a hacer entonces una pequeña comparativa muy importante. 00:06:04
Esta sería la población. Imaginemos que esta es la población en España, ¿vale? Y esta es su curva de distribución normal. Y esta sería la curva de distribución normal 00:06:12
si voy cogiendo muestras y calculando la media de estatura en cada muestra, ¿vale? Entonces, características. Mirad, la población tiene una media que era mu, que es 170. 00:06:20
Estupendo. Hay muchísima gente que mide 170. Es el valor que más se repite. Y mi muestra, la media muestral, que era esta X con la radio encima, pues resulta que también el 170 es el valor que más se da. 00:06:31
Lo más normal es que si yo cojo grupos, por ejemplo, de 100 personas, la media de su estatura también sea 170. O sea que la población y las muestras coinciden en la media. 00:06:44
Pero ahora fijaos en esto, como había dicho, si yo voy cogiendo a gente en mi población, pues hay algunas personas que miden 1,90, pues hay gente alta. 00:06:55
Entonces hay un grupo de personas que miden 1,90. Ya hay poquita gente que mide a 2 metros y 2,10 ya pues muy poquitos. 00:07:02
Alguno habrá, pero muy poquitos. Sin embargo, fijaos, en mi curva de las muestras es imposible coger un grupo de 100 personas y que la media de su estatura esté de 190. 00:07:07
O sea, ya como no estoy cogiendo una persona, sino una muestra, por ejemplo, de 100 o incluso de 1000. Imagina que cojo 1000 personas. Es imposible que la media me salga 190. Entonces, lo que quiero decir con esto es que cómo se distribuyen las medias de una muestra es una curva normal muchísimo más estrechita, muchísimo más comprimida en torno a los valores centrales, ¿vale? 00:07:17
donde la población tiene una desviación típica que era sigma, las muestras son curvas muchísimo más compactas, entonces realmente su desviación es esta, responde a esta fórmula, es la misma desviación que la población dividido entre raíz de n, dividido entre la raíz del número de personas que tengan las muestras, ¿vale? 00:07:36
Por ejemplo, 100 o raíz entre lo que sea. De modo que, como veis, como lo estoy dividiendo entre raíz del número de personas de la muestra, pues la desviación es más pequeña y la curva me sale más estrecha. 00:07:56
Y esto es importante. Cuanta más gente coja en las muestras, o sea, si en vez de coger una muestra de 100, cojo una muestra de 10.000 personas, pues con más razón la media me sale más cerca del valor central. 00:08:07
Si cojo una muestra de 10.000 personas, ya es rarísimo que la media de sus estaturas me salga 1.80, por ejemplo, porque tanta gente, tanta gente, no pueden ser todos altos, ¿comprendéis? 00:08:21
Entonces, cuando yo calculo la media de las muestras, esta media sigue una distribución normal más estrechita, con la misma media, pero con la desviación típica partido de raíz de n, ¿vale? 00:08:32
Si esto es una distribución normal mu y sigma, las muestras, la media de las muestras sigue una distribución normal de misma media, mu, o sea, la media sí que va a acabar dando la misma, pero la desviación típica es partido de raíz de n. 00:08:43
Vamos a ver un ejemplo que es como esto se puede ir practicando. Supongamos que sabemos que la duración media de las bombillas de una determinada marca sigue una distribución normal de media 1500 horas y desviación típica 160, ¿vale? 00:08:56
tengo unas bombillas que duran de media a 1500 horas con una desviación típica de 160. Si escogemos una bombilla al azar, ¿cuál es la probabilidad de que funcione más de 1524 horas? 00:09:08
Hemos dicho que la media era 1500, pues ¿cuál es la probabilidad de que una bombilla funcione más de 1524 horas? Bueno, ya lo veremos. Pero si cogemos una muestra de 100 bombillas 00:09:19
y calculamos su duración media, cojo 100 bombillas y calculo la duración media de las 100. ¿Cuál es la probabilidad de que sea superior a 1524? Eso ya es distinto. 00:09:27
Entonces, ¿cómo se hace? Pues vamos allá, mirad, con una bombilla tenía una distribución normal de media 1500 y desviación típica 160, ¿recordáis? Entonces lo que hacemos es calcular la probabilidad de durar más de 1524 horas, que es lo que vemos en el dibujo. 00:09:37
Entonces, había que tipificar, ¿os acordáis? La X la paso a la Z, es decir, Z es X menos la media partido de la variación típica, o sea, 1.524 menos 1.500 partido de 160 me da 0,15. La probabilidad de durar más de 1.524 horas es la probabilidad de que Z sea superior a 0,15. 00:09:52
Y para ser superior a 0,15 realmente calculábamos 1 menos ser inferior a 0,15. Esto lo miraba en la tabla, resulta que me da 0,4404. Hay un 44,04% de probabilidades de que una bombilla dure más de 1524 horas. 00:10:09
O por así decirlo, el 44% de las bombillas podría durar más de 1524 horas, ¿vale? Bombillas individuales. Pero si cojo una muestra de 100 bombillas, miro a ver cuánto duran las 100 y calculo la media de su duración, mi distribución ya es esta, media mu, pero la desviación típica es sigma partido de raíz de n, ¿vale? 00:10:26
que en vez de ser 160 va a ser 00:10:46
160 partido raíz de 100 00:10:48
la raíz de 100 es 10, o sea que al final va a dar 00:10:50
16 de desviación típica 00:10:52
o sea, distribución normal 1500 y 16 00:10:54
en vez de 160, vale 00:10:56
y me pide cuál es la probabilidad de que la media 00:10:58
de esa muestra sea superior a 1524 00:11:00
no de que una bombilla dure más 00:11:02
sino de que la media de las 100 bombillas 00:11:04
sea superior a 1524 00:11:06
entonces tipifico, pero fijaos, ahora al tipificar 00:11:07
la fórmula es esta, claro, es 00:11:10
media menos la media poblacional 00:11:12
partido de, no de desviación típica, sino de desviación típica partido raíz de n, ¿vale? En definitiva, ahora al poner los números, abajo no va 160, sino que ahora es 16, ¿vale? 00:11:14
Y esto me sale 1,5. Entonces, la probabilidad de que la media de esa muestra sea superior a 1524 es igual a la probabilidad de que z sea superior a 1,5. 00:11:24
y entonces esto es 1 menos 0,5, fijaos, lo miro en la tabla y ahora da 0,0668. 00:11:35
O sea, solo hay un 6,68% de probabilidad de que si cojo 100 bombillas, la media de su duración sea superior a 1594. 00:11:41
Porque claro, no es que una bombilla me salga, no, es que la media de las 100 bombillas supere eso y eso ya es mucho más difícil. 00:11:49
Venga, cerramos con un ejercicio más para seguir practicando. 00:11:56
Se conoce que el peso de las lubinas producidas en una piscifactoría se puede aproximar por una distribución normal de media 600, ¿vale? 00:11:59
Y desviación típica 100, o sea, tenemos unas lubinas cuyo peso medio es 600 con una desviación típica de 100. 00:12:06
Considerando una muestra aleatoria simple de 20 lubinas, cálculese la probabilidad de que su peso medio sea inferior a 550 gramos. 00:12:13
O sea, ahora cojo 20 lubinas, no una, una muestra de 20 lubinas y me piden cuál es la probabilidad de que el peso medio de las 20 sea inferior a 550 gramos, ¿vale? 00:12:19
Tenía aquí la piscifactoría, cada lubina tiene esta distribución de media 600, desviación típica 100. Pero si cojo 20, entonces ahora n en la fórmula es 20, sigo una distribución de media 600 y desviación 100 entre raíz de 20. Sigma entre raíz de n. Esta es la distribución que utilizo yo en los ejercicios. 00:12:28
Y entonces realmente me están pidiendo cuál es la probabilidad de que la media del peso de esas 20 lubinas sea inferior a 550, ¿vale? Pues tipifico, pero claro, tipifico con esta fórmula, es x menos media partido de desviación típica partido de raíz de n, entonces me sale 550 menos 600 partido de 100 partido de raíz de 20 y esto me sale menos 2,236. 00:12:47
Entonces la probabilidad de que la media de 20 lubinas sea inferior a 550 gramos es lo mismo que Z sea inferior a menos 2,236. Tengo un valor negativo, pero ya sabéis, cambio el signo y cambio el símbolo, es la probabilidad de que Z sea mayor que tanto. 00:13:10
La probabilidad de ser mayor que es 1 menos la probabilidad de ser menor que. Esto ya lo miro en la tabla y me sale 1 menos 0,9873, total 0,0127. O sea, la probabilidad de que cogiendo 20 lubinas el peso medio de las 20 sea inferior a 550 es muy pequeño, la probabilidad es 0,0127, o sea, 1,27%. 00:13:24
Materias:
Matemáticas
Autor/es:
Paco Gil
Subido por:
Francisco G.
Licencia:
Reconocimiento - Compartir igual
Visualizaciones:
140
Fecha:
13 de abril de 2020 - 11:56
Visibilidad:
Público
Centro:
IES VICTORIA KENT
Duración:
13′ 46″
Relación de aspecto:
16:10 El estándar usado por los portátiles de 15,4" y algunos otros, es ancho como el 16:9.
Resolución:
1280x800 píxeles
Tamaño:
40.97 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid