1 00:00:12,210 --> 00:00:19,410 Hola a todos. Soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES Arquitecto Pedro Gumiel de Alcalá de Henares. 2 00:00:19,809 --> 00:00:25,289 Y os doy la bienvenida a esta serie de videoclases de la unidad PR6 dedicada a la inferencia estadística. 3 00:00:26,469 --> 00:00:35,299 En la videoclase de hoy estudiaremos elementos de la inferencia estadística. 4 00:00:47,840 --> 00:00:54,479 En esta primera videoclase vamos a introducir ciertos términos que vamos a utilizar a lo largo de toda la unidad. 5 00:00:54,479 --> 00:01:02,320 En primer lugar, y como podéis ver, vamos a denominar parámetro al valor numérico que describa una cierta característica de una población. 6 00:01:02,920 --> 00:01:10,340 Nosotros estaremos interesados en dos parámetros, fundamentalmente, en la proporción poblacional y en la media poblacional. 7 00:01:11,439 --> 00:01:16,659 Vamos a llamar estadístico al valor numérico que describa una característica de una muestra. 8 00:01:16,659 --> 00:01:29,640 Y así, si de una población completa tomamos una muestra, estaremos interesados en estadísticos que van a ser, por paralelismo al caso de las poblaciones, la proporción muestral y la media muestral. 9 00:01:30,519 --> 00:01:40,200 Con carácter general, nosotros estaremos interesados en los valores de los parámetros poblacionales, que en general serán desconocidos y que intentaremos determinar de cierta manera. 10 00:01:40,200 --> 00:01:50,200 Para ello, como describíamos en la unidad anterior, tomaremos una muestra de la población y ésta la podremos estudiar y de ella determinaremos los estadísticos correspondientes. 11 00:01:51,120 --> 00:02:01,079 Y entonces, por ejemplo, calcularemos la proporción muestral intentando estudiarla o determinar o caracterizar la proporción poblacional. 12 00:02:01,459 --> 00:02:07,560 Igualmente, estudiaríamos la media muestral intentando caracterizar cuál sería la media poblacional. 13 00:02:07,560 --> 00:02:16,919 Vamos a denominar estimador al estadístico muestral que vayamos a utilizar para estimar un cierto parámetro poblacional. 14 00:02:18,300 --> 00:02:31,280 En general, ya os decía, el parámetro poblacional en el que estaremos interesados será la proporción o bien la media y con carácter general utilizaremos como estimador el estadístico muestral correspondiente. 15 00:02:31,280 --> 00:02:47,860 Y en principio ya veremos las razones en la siguiente videoclase, en la siguiente sección, cuando hablemos de estimación puntual. Utilizaremos para estimar la media poblacional la media muestral, para estimar la proporción poblacional la proporción muestral. 16 00:02:47,860 --> 00:02:56,439 Tendremos un cierto estadístico, el estadístico muestral, que utilizaremos para estimar un cierto parámetro poblacional y a ese le vamos a llamar estimador. 17 00:02:57,539 --> 00:03:05,400 De entre todos los estimadores posibles vamos a elegir siempre aquel que sea óptimo, aquel que sea mejor. 18 00:03:05,400 --> 00:03:08,819 Y para ello le vamos a pedir dos características. 19 00:03:08,819 --> 00:03:18,900 La primera es esta que vemos aquí. Denominamos estimador centrado o bien insesgado a aquel cuya esperanza matemática coincida con el valor del parámetro poblacional. 20 00:03:19,419 --> 00:03:29,340 Y le des la siguiente. No voy a utilizar como estimador un estadístico muestral que no me vaya a dar como esperanza matemática, como valor esperado, el parámetro que yo quiera. 21 00:03:29,340 --> 00:03:44,659 Así pues, necesitaré encontrar uno que coloquialmente decimos apunte bien, que cuando lo calculemos se aproxime o que realmente a ser posible acierte con el valor del correspondiente parámetro poblacional. 22 00:03:44,659 --> 00:03:57,099 Y ya veremos más adelante que para el caso de la media y para el caso de la proporción utilizaremos el estadístico muestral como estimador del parámetro poblacional porque es un estimador centrado. 23 00:03:57,099 --> 00:04:11,879 De entre todos los estimadores centrados, nosotros deberíamos buscar aquel que sea eficiente o de mínima varianza, que es aquel cuya varianza sea menor que la de cualquier otro estimador del mismo parámetro poblacional. 24 00:04:11,879 --> 00:04:26,860 No solamente buscamos uno que apunte, insisto, coloquialmente, sino que la dispersión de los valores que arroja sea la menor posible. Pedimos que no solamente acierte, sino que esté siempre lo más próximo posible al valor real. 25 00:04:27,100 --> 00:04:49,319 Voy a comentar un ejemplo. Supongamos que nosotros quisiéramos estimar la media poblacional, el parámetro media poblacional de una cierta característica con una cierta población. Puesto que no podemos estudiar la población entera, porque entonces lo haríamos y se acabó, lo que vamos a hacer es recurrir a lo que veíamos en la unidad anterior y tomar una muestra de tamaño n. 26 00:04:49,319 --> 00:04:55,920 n el tamaño de la muestra. De la muestra vamos a poder calcular, por ejemplo, la media, la media 27 00:04:55,920 --> 00:05:01,420 muestral, el estadístico media muestral y vamos a utilizar la media muestral, ese estadístico, 28 00:05:01,560 --> 00:05:06,040 como estimador del correspondiente parámetro poblacional que sería la media poblacional. 29 00:05:07,680 --> 00:05:13,939 Nosotros, incluso para un mismo tamaño n dado, podemos tomar distintas muestras distintas. Si 30 00:05:13,939 --> 00:05:18,439 hacemos un muestreo aleatorio simple, el experimento aleatorio con el cual seleccionamos 31 00:05:18,439 --> 00:05:22,899 los n elementos de la población para que sea nuestra muestra, no va a arrojar cada vez que 32 00:05:22,899 --> 00:05:28,660 lo repitamos exactamente los mismos elementos. De tal forma que con distintas muestras, todas 33 00:05:28,660 --> 00:05:36,860 ellas igualmente probables, tenemos distintos valores del estadístico muestral, que es 34 00:05:36,860 --> 00:05:43,199 nuestro estimador del parámetro poblacional. ¿Qué es lo que ocurre? Que nosotros podemos estudiar, 35 00:05:43,199 --> 00:05:56,699 A eso dedicamos la unidad anterior. ¿Cuál es la distribución de todos esos estadísticos? En este caso, en el ejemplo que estoy comentando, podemos determinar cuáles o podemos estudiar la distribución de las medias muestrales. 36 00:05:56,819 --> 00:06:08,819 Y en su momento, en la unidad anterior, veíamos que se distribuía conforme una distribución normal con media mu, la media poblacional, y con varianza, la varianza poblacional, dividido entre n, n, el tamaño de la muestra. 37 00:06:08,819 --> 00:06:38,220 Bueno, pues la media muestral como estimador de la media poblacional es un estimador centrado, puesto que el valor central de la distribución de todas las posibles medias muestrales tiene como esperanza, como media, el valor del parámetro poblacional. Lo dije antes, distribución normal con media mu, la media poblacional. Así pues, la media muestral es un estimador centrado para la media poblacional. 38 00:06:38,819 --> 00:06:48,399 Lo siguiente que podemos preguntarnos es cómo construimos el estimador para que sea lo más eficiente posible, buscando que la varianza sea la mínima posible. 39 00:06:49,379 --> 00:06:52,600 Bueno, pues lo que tenemos que hacer es pensar en la otra parte. 40 00:06:53,399 --> 00:07:01,399 Las medias muestrales siguen una, la distribución de las medias muestrales sigue una normal con media mu y varianza la poblacional entre n. 41 00:07:02,079 --> 00:07:05,160 La varianza poblacional es una dada, no podemos hacer nada con ella. 42 00:07:05,160 --> 00:07:19,160 Pero podemos minimizar la varianza de esa distribución aumentando lo más posible el valor de n, el tamaño muestral, puesto que está dividiendo en la expresión de la varianza de la media muestral, de la distribución de las medias muestrales. 43 00:07:19,160 --> 00:07:33,540 Y así pues aquí tenemos escondida una de las leyes de los grandes números. Para un valor de n tamaño muestral lo más grande posible obtendríamos una distribución de las medias muestrales que tendría la varianza lo más pequeña posible. 44 00:07:33,540 --> 00:07:40,339 Entonces, el estimador más eficiente posible sería el que correspondiera a una muestra de tamaño el más grande posible. 45 00:07:41,560 --> 00:07:45,480 En el caso de poblaciones infinitas, este tamaño tendería a infinito. 46 00:07:45,860 --> 00:07:48,939 En el caso de poblaciones finitas, esto no podría hacerse de esta manera, 47 00:07:49,300 --> 00:07:52,600 salvo que estuviéramos extrayendo la muestra con reemplazamiento. 48 00:07:53,019 --> 00:07:57,699 En ese caso, el mayor tamaño posible para una muestra dada sería el tamaño de la población. 49 00:07:58,379 --> 00:08:02,279 Y, por supuesto, en este caso, el estimador muestral es el mejor posible, 50 00:08:02,279 --> 00:08:24,759 Porque estamos estudiando la población, la media muestral, cuando estamos la población completa, nuestra muestra es la población completa, es idénticamente igual a la media poblacional y desde luego que la varianza sería cero, puesto que cada vez que tomáramos la población estaríamos calculando el mismo valor, idénticamente el mismo valor que sería la media poblacional. 51 00:08:24,759 --> 00:08:42,580 En este caso, la mínima varianza es cero. Tendríamos un estimador, por supuesto, centrado y sería el más eficiente posible. Desde luego, si estudiamos la población completa, nos evitamos toda esta discusión y obtenemos el mejor parámetro posible. Es que el mejor, perdón, estimador del parámetro es que es el propio parámetro. 52 00:08:42,580 --> 00:08:56,659 Con carácter general esto no va a poder hacerse y de ahí el interés de toda esta unidad. Insisto en que nosotros estaremos interesados en determinar, en caracterizar los parámetros poblacionales. 53 00:08:56,659 --> 00:09:26,200 Nosotros únicamente podremos calcular estadísticos muestrales y lo que haremos será tomar un estadístico muestral como estimador del parámetro poblacional y utilizaremos como estimadores estadísticos cuya distribución sea tal que el estimador sea, desde luego, centrado, esto es, la esperanza matemática del estimador sea el valor del parámetro poblacional y lo más eficiente posible, esto es, con la varianza menor posible. 54 00:09:29,379 --> 00:09:34,940 En el aula virtual de la asignatura tenéis disponibles otros recursos y cuestionarios. 55 00:09:35,679 --> 00:09:39,779 Asimismo, tenéis más información en las fuentes bibliográficas y en la web. 56 00:09:40,600 --> 00:09:45,360 No dudéis en traer vuestras dudas e inquietudes a clase o al foro de dudas en el aula virtual. 57 00:09:45,899 --> 00:09:47,299 Un saludo y hasta pronto.