Saltar navegación

Activa JavaScript para disfrutar de los vídeos de la Mediateca.

PR5. 1. Introducción - Contenido educativo

Ajuste de pantalla

El ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:

Subido el 14 de febrero de 2025 por Raúl C.

23 visualizaciones

Descargar la transcripción

Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES 00:00:12
Arquitecto Pedro Gumiel de Alcalá de Henares y os doy la bienvenida a esta serie de videoclases 00:00:17
de la unidad PR5 dedicada a la teoría de muestras y las distribuciones en el muestreo. 00:00:22
En la videoclase de hoy estudiaremos elementos de la teoría de muestras. 00:00:31
En esta primera videoclase de la unidad vamos a introducir conceptos elementales que vamos 00:00:35
a utilizar a lo largo de ella. Comenzando por la diferencia entre población y muestra. Como podéis 00:00:51
leer aquí vamos a llamar población al conjunto de individuos que es objeto de un cierto estudio 00:00:59
estadístico. Por ejemplo si queremos estudiar cierta característica de la población española 00:01:04
pues todos los habitantes de España. Si queremos estudiar cierta característica de los estudiantes 00:01:09
del IES Arquitecto Pedro Gumel en un cierto curso académico serán todos los estudiantes matriculados 00:01:14
en ese curso académico en el IES Arquitecto Pedro Gumiel. 00:01:19
Si en un momento dado no podemos o no queremos estudiar al conjunto completo de individuos, 00:01:22
a la población completa, lo que haremos será de ella tomar una muestra. 00:01:28
Se llama muestra a cualquier subconjunto de la población. 00:01:32
El interés de tomar una muestra se debe a distintas posibilidades. 00:01:36
Hay ciertos estudios que son por su propia naturaleza destructivos. 00:01:41
Por ejemplo, si queremos comprobar cuál es el punto de ruptura de una certa viga que sale fabricada en una certa máquina, 00:01:46
lo que se hace es tomar la viga, aplicarle presión hasta que rompe o hasta que se dobla, se deforma. 00:01:52
Cada vez que hacemos esto con una viga se destruye y no podemos hacerlo con todas, 00:01:59
puesto que entonces toda la producción se destruiría y no tiene sentido. 00:02:03
Haremos esto con una parte, no con todas. Haremos esto con una muestra. 00:02:07
En el caso en el que queremos estudiar a toda la población española, en un momento dado puede ser que eso quede fuera de nuestro alcance. 00:02:11
No tenemos recursos, ya sea materiales o bien económicos, como para hacer un estudio a toda la población. 00:02:18
Mucho menos, imaginaos, si fuera toda la población mundial. 00:02:24
En ese caso, tomamos una muestra, tomamos un subconjunto de la población que la represente. 00:02:27
presente. La clave para a la hora de seleccionar una muestra, veremos más adelante, es que esta 00:02:31
muestra debe ser representativa. Dado que no estamos estudiando a toda la población sin 00:02:38
únicamente un subconjunto, buscamos que ese subconjunto pueda representar a la población 00:02:44
completa. De tal forma que las conclusiones que extraigamos estudiando la muestra sean no las 00:02:49
mismas pero lo más parecidas posible a las que obtendríamos si estudiáramos a la población. 00:02:55
Acerca de la representatividad de la muestra hablaremos un poco más adelante. 00:03:00
Si hemos decidido no estudiar la población completa sino una muestra, tenemos que ver cómo seleccionamos esta muestra. 00:03:06
A la acción de muestrear la población se le llama muestreo y existen distintos tipos que describo a continuación. 00:03:14
Se llama muestreo aleatorio simple, aquel en el cual se selecciona los elementos de la muestra uno tras otro utilizando un determinado experimento aleatorio. 00:03:21
Por ejemplo, tengo 100 individuos en la muestra, de los cuales quiero estudiar únicamente el de porciento, solamente a 10, sorteo uno de los 100, sorteo uno de los 99 restantes y así sucesivamente hasta que he seleccionado a los 10. 00:03:31
Si hago esto así, lo que hago es un muestreo aleatorio simple. 00:03:44
Un muestro sistemático tiene únicamente un experimento aleatorio para seleccionar al primer elemento y a partir de ahí utilizo algo sistemático. 00:03:48
Por ejemplo, si de 100 elementos estoy seleccionando a 10 y los tengo ordenados del 1 al 100, lo que puedo hacer es sortear el primero 00:03:58
y a partir de ahí, contando descarto 9 el décimo en la lista a continuación, lo selecciono, descarto 9 el décimo, lo selecciono y así sucesivamente. 00:04:04
El primero lo he seleccionado aleatoriamente y a partir de ahí utilizo una regla sistemática. Cada 10 tomo 1. 00:04:15
Un muestreo estratificado, como veis aquí, lo que hago es seleccionar un cierto número de individuos en cada estrato, es el término técnico, o bien en cada grupo en que se divide la población. 00:04:23
Si, por ejemplo, quiero hacer un estudio en los estudiantes del IES Arquitecto Pedro Gumel, puedo tener interés en considerar los distintos niveles. 00:04:34
primero, segundo, tercero, cuarto de la ESO, primero, segundo de bacheato, como distintos grupos, 00:04:42
llamaríamos estratos, y lo que voy a hacer es dentro de cada estrato, dentro de cada grupo, 00:04:48
hacer una selección, un muestreo, por ejemplo. Así pues, lo que tengo es una población dividida 00:04:52
en estratos, en este caso serían los niveles, y dentro de cada estrato voy a hacer una selección, 00:04:57
voy a tomar una muestra. Puedo hacerlo de esta manera o puedo considerar, por ejemplo, 00:05:02
la población española y considerar que cada una de las comunidades autónomas y las ciudades 00:05:06
autónomas, represé a un estrato y quiero hacer una selección dentro de cada 00:05:12
estrato. También tenemos lo que se llama un muestreo por conglomerados. 00:05:16
En este caso lo que voy a hacer es 00:05:21
lo siguiente. Divido la población y en un muestreo monotápico 00:05:23
lo que voy a hacer es seleccionar algunos conglomerados para que 00:05:28
representen la población. En este caso sería equivalente a 00:05:31
si quiero estudiar la población de Elías Arquitecto Pedro Gomiel, puedo 00:05:35
dividir por conglomerados pensando en que cada uno de los grupos, cada uno de los niveles, perdón, es un 00:05:39
conglomerado y en un muestreo monotápico selecciono, por ejemplo, los conglomerados pares, segundo y 00:05:44
cuarto de la ESO, segundo de bachillerato, por ejemplo, y estudio todos ellos como representantes 00:05:50
de la población completa. O bien, por ejemplo, divido la población española por comunidades 00:05:55
autónomas, ahí tengo los conglomerados, y selecciono algunas de ellas y voy a hacer el estudio, por 00:06:02
ejemplo en, lo selecciono de la manera que quiera que sea, Andalucía, Extremadura y Navarra. En un 00:06:07
muestreo bietápico lo que voy a hacer es una combinación de un muestreo monotápico y un 00:06:14
muestreo aleatorio. Voy a seleccionar ciertos conglomerados y de cada uno de ellos tomo una 00:06:19
muestra, que puedo hacer por ejemplo con un muestreo aleatorio simple o sistemático o 00:06:25
estratificado, como lo quiera considerar. Y así, por ejemplo, pues volviendo al ejemplo de la 00:06:28
población española seleccionó algunos conglomerados para estudiar y que 00:06:34
representen la población española y había pensado en andalucía extremadura 00:06:39
y navarra y ahora aún así eso es menos que la población española completa pero 00:06:43
la población de cada una de esas comunidades autónomas es muy grande me 00:06:48
hacen una muestra y por ejemplo puedo seleccionar aleatoriamente mediante un 00:06:51
muestreo aleatorio simple pues mil habitantes de cada una de esas 00:06:55
comunidades, por ejemplo. El hecho de observar una muestra en lugar de la población completa 00:06:59
introduce errores. Las conclusiones que obtengamos potencialmente van a ser diferentes y es inevitable 00:07:06
puesto que no estamos estudiando toda la población sino únicamente un subconjunto de esta. Las 00:07:14
conclusiones que extraigamos no tienen por qué coincidir. Buscaremos hacer el muestreo de tal 00:07:21
forma que las conclusiones sean lo más parecidas posibles a las de la población e intentaremos 00:07:28
utilizar técnicas matemáticas, a eso va a estar destinada esta unidad y la siguiente, de tal forma 00:07:34
que nos garantice que las diferencias que obtengamos sean lo menores posibles. No obstante, va a haber 00:07:39
una serie de errores que van a ser inevitables. El primero, que es consustancial al proceso de 00:07:46
muestreo, el mero hecho de tomar una muestra introduce errores, es lo que se llama error 00:07:51
muestral. Por el hecho de estar considerando una muestra como representante de la población 00:07:55
completa, estamos cometiendo un error. También tenemos el que se llama error sistemático 00:08:01
o sesgo, y este está asociado no al mero hecho de que tenemos una muestra, sino a cómo 00:08:07
se ha seleccionado, si esta muestra es suficientemente representativa de la población o no. Esto 00:08:13
se debe fundamentalmente a no tomar una muestra, un muestreo suficientemente aleatorio. El muestreo 00:08:21
ideal es el muestreo aleatorio simple, en el cual si yo quiero de la población completa de estudiantes 00:08:30
del IES Arquitecto Pedro Gumiel, pongamos 780 alumnos, seleccionar 20, lo que hago es de el 00:08:36
conjunto de los 780 sorteo uno, de los restantes sorteo otro y así sucesivamente hasta que completo 00:08:43
la muestra. Podría haber hecho el muestreo de una forma distinta. Podría haber pensado en un muestreo 00:08:49
por conglomerados bietápico y lo que voy a hacer es considerar como conglomerados los distintos 00:08:58
niveles y selecciono únicamente primero de la ESO y dentro de estos voy a seleccionar una muestra y 00:09:03
voy a hacer un muestreo aleatorio simple de 20 estudiantes de primero de la ESO, puesto que este 00:09:10
es el conglomerado que he decidido utilizar. Esto no es necesariamente representativo de la 00:09:16
población completa, depende de la variable estadística que esté utilizando. Pero imaginad, 00:09:23
por ejemplo, que estoy estudiando la estatura de los estudiantes y a todos nos entra en la cabeza 00:09:28
que los estudiantes de primero de la ESO son significativamente más bajitos en promedio que 00:09:34
los estudiantes de primero o segundo de bachillerato y es inevitable, es una cuestión de edad. Si estoy 00:09:40
haciéndole ese estudio estoy cometiendo en primer lugar un error muestral porque estoy tomando una 00:09:45
muestra y estoy cometiendo un sesgo puesto que estoy sistemáticamente tomando estudiantes que 00:09:51
se sabe que son más bajitos que el conjunto de todos los estudiantes. Aquí hacerlo de esta manera 00:09:58
me introduce además del error muestral un error sistemático que depende de cuál sea la variable 00:10:07
estadística, si lo que estoy estudiando es la distancia a la cual viven los estudiantes del 00:10:12
instituto, medida en metros o en kilómetros, o bien el tiempo que tardan en llegar, medio minutos o en 00:10:18
horas, no necesariamente el considerar sólo estudiantes de primero de la ESO me va a introducir 00:10:23
un error sistemático, puesto que en este caso la variable que estoy estudiando no parece que 00:10:29
dependa de cuál sea la edad, no depende del nivel. Así pues, el error muestral se comete siempre, 00:10:35
Es inevitable. Un error sistemático o bien sesgo se comete dependiendo de cuál sea la variable estadística. 00:10:42
No siempre elegir un estrato de la forma en la que he comentado en el ejemplo anterior es tan arriesgado. 00:10:51
No es una locura coger solamente estudiantes de primero de la ESO. 00:11:00
Puede hacer que el estudio sea más simple. El muestreo y el estudio puede ser muy sencillo. 00:11:03
y no necesariamente estoy introduciendo un sesgo, un error por sesgo, un error sistemático en las conclusiones. 00:11:08
Acerca de esto hablaremos mucho más en clase con los ejemplos y con los ejercicios que resolvamos a continuación. 00:11:15
Hace un momento hablaba de una variable estadística, una hipotética variable estadística que queríamos estudiar. 00:11:24
En esta sección vamos a hablar de parámetros estadísticos. 00:11:29
Como podéis ver, son cualquier valor numérico que describa esa variable estadística, 00:11:32
esa característica de la población o muestra, dependiendo de qué sea lo que estemos estudiando. 00:11:36
Nosotros vamos a utilizar como parámetros el tamaño, la proporción, la media y la 00:11:42
varianza. Utilizaremos símbolos distintos en función de si estamos hablando o describiendo 00:11:48
los parámetros de la población o bien de una muestra. El tamaño poblacional se representará 00:11:53
siempre por la letra N mayúscula. El tamaño de una muestra determinada se representará 00:12:00
con la letra n minúscula. La proporción poblacional se representará con la letra pi minúscula mientras 00:12:05
que la proporción de una determinada muestra se representará con la letra p minúscula. La media, 00:12:12
la media aritmética de una determinada variable estadística, desde luego cuantitativa, en una 00:12:17
población se representará por la letra mu minúscula mientras que la media aritmética en 00:12:23
una muestra se determinará x o se denotará x minúscula con una barra encima. Para la varianza 00:12:29
poblacional utilizaremos sigma al cuadrado, para la varianza en una muestra concreta utilizaremos 00:12:36
s al cuadrado. Nosotros en general no podremos estudiar, no querremos estudiar poblaciones 00:12:43
completas, pero sí queremos caracterizar las poblaciones y lo que vamos a hacer es utilizar 00:12:50
los parámetros muestrales que sí podremos determinar en la idea de intentar caracterizar 00:12:56
de la forma más fiel posible el correspondiente parámetro poblacional. De una determinada variable 00:13:03
cuantitativa tal vez no podremos calcular la media poblacional porque la población sea muy 00:13:09
grande, porque el estudio sea destructivo, como ya he mencionado anteriormente. Tomaremos una muestra. 00:13:15
De la muestra sí podremos calcular la media. ¿De qué forma podemos sacar conclusiones de la media poblacional con únicamente la media muestral? La media y posiblemente la varianza. A eso vamos a dedicar las siguientes clases. 00:13:20
Vamos a finalizar esta videoclase hablando del teorema del límite central, que tiene una enorme importancia, puesto que os recuerdo que hace un momento dije que utilizaríamos los parámetros muestrales para intentar caracterizar los parámetros poblacionales que son aquellos en los que tenemos interés. 00:13:38
Cuando más adelante hablemos de la distribución en el muestreo, de la proporción y de la media aritmética, 00:13:55
que son los dos parámetros fundamentales que vamos a estudiar en esta unidad y en la siguiente, 00:14:00
veréis que hablo que la proporción muestral, la media muestral, están distribuidas normalmente, siguiendo una distribución normal. 00:14:05
¿Por qué una distribución normal? Pues bien, la razón es esta, el teorema del límite central. 00:14:15
Nos dice que si tenemos un conjunto de variables aleatorias independientes idénticamente distribuidas, 00:14:19
y no me dice el tipo de distribución, pueden ser todas ellas normales, todas ellas binomiales, la que quiera que sea, 00:14:26
con tal de que todas ellas tengan la misma media y la misma desviación típica, o bien la misma varianza, por supuesto, 00:14:32
entonces el teorema dice que la suma de todas ellas se va a distribuir normalmente, 00:14:38
esto es, siguiendo una distribución normal, con media n por la media de todas ellas 00:14:45
y con desviación típica, que va a ser la raíz cuadrada de n por la desviación típica de todas ellas. 00:14:51
En el límite, cuando n tiende a infinito, aquí, subyacente, tenemos una ley de los grandes números. 00:14:57
Siempre que tengamos algo se distribuye de una cierta manera, cuando n tiende a infinito, 00:15:03
hemos de pensar en que tenemos una ley de los grandes números. 00:15:07
Como corolario, si no tenemos la suma de las variables, sino que tenemos la suma dividida entre n, esto es la media aritmética, 00:15:11
lo que tendremos es que esa media aritmética se va a distribuir según una distribución normal, se va a distribuir normalmente, 00:15:19
con media la misma que la de las variables aleatorias subyacentes y con desviación típica que va a ser la de las variables aleatorias subyacentes 00:15:26
dividido entre la raíz de n. 00:15:34
Este resultado va a ser importante y va a ser uno de los que utilicemos en esta sección, en la 3, más adelante. 00:15:37
En el aula virtual de la asignatura tenéis disponibles otros recursos y cuestionarios. 00:15:46
Asimismo, tenéis más información en las fuentes bibliográficas y en la web. 00:15:52
No dudéis en traer vuestras dudas e inquietudes a clase o al foro de dudas en el aula virtual. 00:15:57
Un saludo y hasta pronto. 00:16:03
Idioma/s:
es
Materias:
Matemáticas
Etiquetas:
Flipped Classroom
Niveles educativos:
▼ Mostrar / ocultar niveles
  • Bachillerato
    • Segundo Curso
Autor/es:
Raúl Corraliza Nieto
Subido por:
Raúl C.
Licencia:
Reconocimiento - Compartir igual
Visualizaciones:
23
Fecha:
14 de febrero de 2025 - 17:45
Visibilidad:
Público
Centro:
IES ARQUITECTO PEDRO GUMIEL
Duración:
16′ 31″
Relación de aspecto:
1.78:1
Resolución:
1280x720 píxeles
Tamaño:
40.67 MBytes

Del mismo autor…

Ver más del mismo autor


EducaMadrid, Plataforma Educativa de la Comunidad de Madrid

Plataforma Educativa EducaMadrid