Activa JavaScript para disfrutar de los vídeos de la Mediateca.
PR5. 1. Introducción - Contenido educativo
Ajuste de pantallaEl ajuste de pantalla se aprecia al ver el vídeo en pantalla completa. Elige la presentación que más te guste:
Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES
00:00:12
Arquitecto Pedro Gumiel de Alcalá de Henares y os doy la bienvenida a esta serie de videoclases
00:00:17
de la unidad PR5 dedicada a la teoría de muestras y las distribuciones en el muestreo.
00:00:22
En la videoclase de hoy estudiaremos elementos de la teoría de muestras.
00:00:31
En esta primera videoclase de la unidad vamos a introducir conceptos elementales que vamos
00:00:35
a utilizar a lo largo de ella. Comenzando por la diferencia entre población y muestra. Como podéis
00:00:51
leer aquí vamos a llamar población al conjunto de individuos que es objeto de un cierto estudio
00:00:59
estadístico. Por ejemplo si queremos estudiar cierta característica de la población española
00:01:04
pues todos los habitantes de España. Si queremos estudiar cierta característica de los estudiantes
00:01:09
del IES Arquitecto Pedro Gumel en un cierto curso académico serán todos los estudiantes matriculados
00:01:14
en ese curso académico en el IES Arquitecto Pedro Gumiel.
00:01:19
Si en un momento dado no podemos o no queremos estudiar al conjunto completo de individuos,
00:01:22
a la población completa, lo que haremos será de ella tomar una muestra.
00:01:28
Se llama muestra a cualquier subconjunto de la población.
00:01:32
El interés de tomar una muestra se debe a distintas posibilidades.
00:01:36
Hay ciertos estudios que son por su propia naturaleza destructivos.
00:01:41
Por ejemplo, si queremos comprobar cuál es el punto de ruptura de una certa viga que sale fabricada en una certa máquina,
00:01:46
lo que se hace es tomar la viga, aplicarle presión hasta que rompe o hasta que se dobla, se deforma.
00:01:52
Cada vez que hacemos esto con una viga se destruye y no podemos hacerlo con todas,
00:01:59
puesto que entonces toda la producción se destruiría y no tiene sentido.
00:02:03
Haremos esto con una parte, no con todas. Haremos esto con una muestra.
00:02:07
En el caso en el que queremos estudiar a toda la población española, en un momento dado puede ser que eso quede fuera de nuestro alcance.
00:02:11
No tenemos recursos, ya sea materiales o bien económicos, como para hacer un estudio a toda la población.
00:02:18
Mucho menos, imaginaos, si fuera toda la población mundial.
00:02:24
En ese caso, tomamos una muestra, tomamos un subconjunto de la población que la represente.
00:02:27
presente. La clave para a la hora de seleccionar una muestra, veremos más adelante, es que esta
00:02:31
muestra debe ser representativa. Dado que no estamos estudiando a toda la población sin
00:02:38
únicamente un subconjunto, buscamos que ese subconjunto pueda representar a la población
00:02:44
completa. De tal forma que las conclusiones que extraigamos estudiando la muestra sean no las
00:02:49
mismas pero lo más parecidas posible a las que obtendríamos si estudiáramos a la población.
00:02:55
Acerca de la representatividad de la muestra hablaremos un poco más adelante.
00:03:00
Si hemos decidido no estudiar la población completa sino una muestra, tenemos que ver cómo seleccionamos esta muestra.
00:03:06
A la acción de muestrear la población se le llama muestreo y existen distintos tipos que describo a continuación.
00:03:14
Se llama muestreo aleatorio simple, aquel en el cual se selecciona los elementos de la muestra uno tras otro utilizando un determinado experimento aleatorio.
00:03:21
Por ejemplo, tengo 100 individuos en la muestra, de los cuales quiero estudiar únicamente el de porciento, solamente a 10, sorteo uno de los 100, sorteo uno de los 99 restantes y así sucesivamente hasta que he seleccionado a los 10.
00:03:31
Si hago esto así, lo que hago es un muestreo aleatorio simple.
00:03:44
Un muestro sistemático tiene únicamente un experimento aleatorio para seleccionar al primer elemento y a partir de ahí utilizo algo sistemático.
00:03:48
Por ejemplo, si de 100 elementos estoy seleccionando a 10 y los tengo ordenados del 1 al 100, lo que puedo hacer es sortear el primero
00:03:58
y a partir de ahí, contando descarto 9 el décimo en la lista a continuación, lo selecciono, descarto 9 el décimo, lo selecciono y así sucesivamente.
00:04:04
El primero lo he seleccionado aleatoriamente y a partir de ahí utilizo una regla sistemática. Cada 10 tomo 1.
00:04:15
Un muestreo estratificado, como veis aquí, lo que hago es seleccionar un cierto número de individuos en cada estrato, es el término técnico, o bien en cada grupo en que se divide la población.
00:04:23
Si, por ejemplo, quiero hacer un estudio en los estudiantes del IES Arquitecto Pedro Gumel, puedo tener interés en considerar los distintos niveles.
00:04:34
primero, segundo, tercero, cuarto de la ESO, primero, segundo de bacheato, como distintos grupos,
00:04:42
llamaríamos estratos, y lo que voy a hacer es dentro de cada estrato, dentro de cada grupo,
00:04:48
hacer una selección, un muestreo, por ejemplo. Así pues, lo que tengo es una población dividida
00:04:52
en estratos, en este caso serían los niveles, y dentro de cada estrato voy a hacer una selección,
00:04:57
voy a tomar una muestra. Puedo hacerlo de esta manera o puedo considerar, por ejemplo,
00:05:02
la población española y considerar que cada una de las comunidades autónomas y las ciudades
00:05:06
autónomas, represé a un estrato y quiero hacer una selección dentro de cada
00:05:12
estrato. También tenemos lo que se llama un muestreo por conglomerados.
00:05:16
En este caso lo que voy a hacer es
00:05:21
lo siguiente. Divido la población y en un muestreo monotápico
00:05:23
lo que voy a hacer es seleccionar algunos conglomerados para que
00:05:28
representen la población. En este caso sería equivalente a
00:05:31
si quiero estudiar la población de Elías Arquitecto Pedro Gomiel, puedo
00:05:35
dividir por conglomerados pensando en que cada uno de los grupos, cada uno de los niveles, perdón, es un
00:05:39
conglomerado y en un muestreo monotápico selecciono, por ejemplo, los conglomerados pares, segundo y
00:05:44
cuarto de la ESO, segundo de bachillerato, por ejemplo, y estudio todos ellos como representantes
00:05:50
de la población completa. O bien, por ejemplo, divido la población española por comunidades
00:05:55
autónomas, ahí tengo los conglomerados, y selecciono algunas de ellas y voy a hacer el estudio, por
00:06:02
ejemplo en, lo selecciono de la manera que quiera que sea, Andalucía, Extremadura y Navarra. En un
00:06:07
muestreo bietápico lo que voy a hacer es una combinación de un muestreo monotápico y un
00:06:14
muestreo aleatorio. Voy a seleccionar ciertos conglomerados y de cada uno de ellos tomo una
00:06:19
muestra, que puedo hacer por ejemplo con un muestreo aleatorio simple o sistemático o
00:06:25
estratificado, como lo quiera considerar. Y así, por ejemplo, pues volviendo al ejemplo de la
00:06:28
población española seleccionó algunos conglomerados para estudiar y que
00:06:34
representen la población española y había pensado en andalucía extremadura
00:06:39
y navarra y ahora aún así eso es menos que la población española completa pero
00:06:43
la población de cada una de esas comunidades autónomas es muy grande me
00:06:48
hacen una muestra y por ejemplo puedo seleccionar aleatoriamente mediante un
00:06:51
muestreo aleatorio simple pues mil habitantes de cada una de esas
00:06:55
comunidades, por ejemplo. El hecho de observar una muestra en lugar de la población completa
00:06:59
introduce errores. Las conclusiones que obtengamos potencialmente van a ser diferentes y es inevitable
00:07:06
puesto que no estamos estudiando toda la población sino únicamente un subconjunto de esta. Las
00:07:14
conclusiones que extraigamos no tienen por qué coincidir. Buscaremos hacer el muestreo de tal
00:07:21
forma que las conclusiones sean lo más parecidas posibles a las de la población e intentaremos
00:07:28
utilizar técnicas matemáticas, a eso va a estar destinada esta unidad y la siguiente, de tal forma
00:07:34
que nos garantice que las diferencias que obtengamos sean lo menores posibles. No obstante, va a haber
00:07:39
una serie de errores que van a ser inevitables. El primero, que es consustancial al proceso de
00:07:46
muestreo, el mero hecho de tomar una muestra introduce errores, es lo que se llama error
00:07:51
muestral. Por el hecho de estar considerando una muestra como representante de la población
00:07:55
completa, estamos cometiendo un error. También tenemos el que se llama error sistemático
00:08:01
o sesgo, y este está asociado no al mero hecho de que tenemos una muestra, sino a cómo
00:08:07
se ha seleccionado, si esta muestra es suficientemente representativa de la población o no. Esto
00:08:13
se debe fundamentalmente a no tomar una muestra, un muestreo suficientemente aleatorio. El muestreo
00:08:21
ideal es el muestreo aleatorio simple, en el cual si yo quiero de la población completa de estudiantes
00:08:30
del IES Arquitecto Pedro Gumiel, pongamos 780 alumnos, seleccionar 20, lo que hago es de el
00:08:36
conjunto de los 780 sorteo uno, de los restantes sorteo otro y así sucesivamente hasta que completo
00:08:43
la muestra. Podría haber hecho el muestreo de una forma distinta. Podría haber pensado en un muestreo
00:08:49
por conglomerados bietápico y lo que voy a hacer es considerar como conglomerados los distintos
00:08:58
niveles y selecciono únicamente primero de la ESO y dentro de estos voy a seleccionar una muestra y
00:09:03
voy a hacer un muestreo aleatorio simple de 20 estudiantes de primero de la ESO, puesto que este
00:09:10
es el conglomerado que he decidido utilizar. Esto no es necesariamente representativo de la
00:09:16
población completa, depende de la variable estadística que esté utilizando. Pero imaginad,
00:09:23
por ejemplo, que estoy estudiando la estatura de los estudiantes y a todos nos entra en la cabeza
00:09:28
que los estudiantes de primero de la ESO son significativamente más bajitos en promedio que
00:09:34
los estudiantes de primero o segundo de bachillerato y es inevitable, es una cuestión de edad. Si estoy
00:09:40
haciéndole ese estudio estoy cometiendo en primer lugar un error muestral porque estoy tomando una
00:09:45
muestra y estoy cometiendo un sesgo puesto que estoy sistemáticamente tomando estudiantes que
00:09:51
se sabe que son más bajitos que el conjunto de todos los estudiantes. Aquí hacerlo de esta manera
00:09:58
me introduce además del error muestral un error sistemático que depende de cuál sea la variable
00:10:07
estadística, si lo que estoy estudiando es la distancia a la cual viven los estudiantes del
00:10:12
instituto, medida en metros o en kilómetros, o bien el tiempo que tardan en llegar, medio minutos o en
00:10:18
horas, no necesariamente el considerar sólo estudiantes de primero de la ESO me va a introducir
00:10:23
un error sistemático, puesto que en este caso la variable que estoy estudiando no parece que
00:10:29
dependa de cuál sea la edad, no depende del nivel. Así pues, el error muestral se comete siempre,
00:10:35
Es inevitable. Un error sistemático o bien sesgo se comete dependiendo de cuál sea la variable estadística.
00:10:42
No siempre elegir un estrato de la forma en la que he comentado en el ejemplo anterior es tan arriesgado.
00:10:51
No es una locura coger solamente estudiantes de primero de la ESO.
00:11:00
Puede hacer que el estudio sea más simple. El muestreo y el estudio puede ser muy sencillo.
00:11:03
y no necesariamente estoy introduciendo un sesgo, un error por sesgo, un error sistemático en las conclusiones.
00:11:08
Acerca de esto hablaremos mucho más en clase con los ejemplos y con los ejercicios que resolvamos a continuación.
00:11:15
Hace un momento hablaba de una variable estadística, una hipotética variable estadística que queríamos estudiar.
00:11:24
En esta sección vamos a hablar de parámetros estadísticos.
00:11:29
Como podéis ver, son cualquier valor numérico que describa esa variable estadística,
00:11:32
esa característica de la población o muestra, dependiendo de qué sea lo que estemos estudiando.
00:11:36
Nosotros vamos a utilizar como parámetros el tamaño, la proporción, la media y la
00:11:42
varianza. Utilizaremos símbolos distintos en función de si estamos hablando o describiendo
00:11:48
los parámetros de la población o bien de una muestra. El tamaño poblacional se representará
00:11:53
siempre por la letra N mayúscula. El tamaño de una muestra determinada se representará
00:12:00
con la letra n minúscula. La proporción poblacional se representará con la letra pi minúscula mientras
00:12:05
que la proporción de una determinada muestra se representará con la letra p minúscula. La media,
00:12:12
la media aritmética de una determinada variable estadística, desde luego cuantitativa, en una
00:12:17
población se representará por la letra mu minúscula mientras que la media aritmética en
00:12:23
una muestra se determinará x o se denotará x minúscula con una barra encima. Para la varianza
00:12:29
poblacional utilizaremos sigma al cuadrado, para la varianza en una muestra concreta utilizaremos
00:12:36
s al cuadrado. Nosotros en general no podremos estudiar, no querremos estudiar poblaciones
00:12:43
completas, pero sí queremos caracterizar las poblaciones y lo que vamos a hacer es utilizar
00:12:50
los parámetros muestrales que sí podremos determinar en la idea de intentar caracterizar
00:12:56
de la forma más fiel posible el correspondiente parámetro poblacional. De una determinada variable
00:13:03
cuantitativa tal vez no podremos calcular la media poblacional porque la población sea muy
00:13:09
grande, porque el estudio sea destructivo, como ya he mencionado anteriormente. Tomaremos una muestra.
00:13:15
De la muestra sí podremos calcular la media. ¿De qué forma podemos sacar conclusiones de la media poblacional con únicamente la media muestral? La media y posiblemente la varianza. A eso vamos a dedicar las siguientes clases.
00:13:20
Vamos a finalizar esta videoclase hablando del teorema del límite central, que tiene una enorme importancia, puesto que os recuerdo que hace un momento dije que utilizaríamos los parámetros muestrales para intentar caracterizar los parámetros poblacionales que son aquellos en los que tenemos interés.
00:13:38
Cuando más adelante hablemos de la distribución en el muestreo, de la proporción y de la media aritmética,
00:13:55
que son los dos parámetros fundamentales que vamos a estudiar en esta unidad y en la siguiente,
00:14:00
veréis que hablo que la proporción muestral, la media muestral, están distribuidas normalmente, siguiendo una distribución normal.
00:14:05
¿Por qué una distribución normal? Pues bien, la razón es esta, el teorema del límite central.
00:14:15
Nos dice que si tenemos un conjunto de variables aleatorias independientes idénticamente distribuidas,
00:14:19
y no me dice el tipo de distribución, pueden ser todas ellas normales, todas ellas binomiales, la que quiera que sea,
00:14:26
con tal de que todas ellas tengan la misma media y la misma desviación típica, o bien la misma varianza, por supuesto,
00:14:32
entonces el teorema dice que la suma de todas ellas se va a distribuir normalmente,
00:14:38
esto es, siguiendo una distribución normal, con media n por la media de todas ellas
00:14:45
y con desviación típica, que va a ser la raíz cuadrada de n por la desviación típica de todas ellas.
00:14:51
En el límite, cuando n tiende a infinito, aquí, subyacente, tenemos una ley de los grandes números.
00:14:57
Siempre que tengamos algo se distribuye de una cierta manera, cuando n tiende a infinito,
00:15:03
hemos de pensar en que tenemos una ley de los grandes números.
00:15:07
Como corolario, si no tenemos la suma de las variables, sino que tenemos la suma dividida entre n, esto es la media aritmética,
00:15:11
lo que tendremos es que esa media aritmética se va a distribuir según una distribución normal, se va a distribuir normalmente,
00:15:19
con media la misma que la de las variables aleatorias subyacentes y con desviación típica que va a ser la de las variables aleatorias subyacentes
00:15:26
dividido entre la raíz de n.
00:15:34
Este resultado va a ser importante y va a ser uno de los que utilicemos en esta sección, en la 3, más adelante.
00:15:37
En el aula virtual de la asignatura tenéis disponibles otros recursos y cuestionarios.
00:15:46
Asimismo, tenéis más información en las fuentes bibliográficas y en la web.
00:15:52
No dudéis en traer vuestras dudas e inquietudes a clase o al foro de dudas en el aula virtual.
00:15:57
Un saludo y hasta pronto.
00:16:03
- Idioma/s:
- Materias:
- Matemáticas
- Etiquetas:
- Flipped Classroom
- Niveles educativos:
- ▼ Mostrar / ocultar niveles
- Bachillerato
- Segundo Curso
- Autor/es:
- Raúl Corraliza Nieto
- Subido por:
- Raúl C.
- Licencia:
- Reconocimiento - Compartir igual
- Visualizaciones:
- 23
- Fecha:
- 14 de febrero de 2025 - 17:45
- Visibilidad:
- Público
- Centro:
- IES ARQUITECTO PEDRO GUMIEL
- Duración:
- 16′ 31″
- Relación de aspecto:
- 1.78:1
- Resolución:
- 1280x720 píxeles
- Tamaño:
- 40.67 MBytes