1 00:00:12,210 --> 00:00:19,410 Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES Arquitecto Pedro Gumiel de Alcalá de Henares. 2 00:00:19,850 --> 00:00:25,309 Y os doy la bienvenida a esta serie de videoclases de la unidad PR6 dedicada a la inferencia estadística. 3 00:00:26,489 --> 00:00:34,659 En la videoclase de hoy estudiaremos la estimación puntual. 4 00:00:35,759 --> 00:00:50,950 En esta videoclase vamos a estudiar la estimación puntual. 5 00:00:51,570 --> 00:00:59,390 Recordemos que en la videoclase anterior, en la introducción, hablábamos de parámetros poblacionales, en principio desconocidos y que queríamos determinar, 6 00:00:59,969 --> 00:01:05,230 estadísticos muestrales, que podíamos determinar en cuanto tomáramos una muestra y la estudiáramos, 7 00:01:05,730 --> 00:01:12,629 y un estimador iba a ser un estadístico muestral que utilizábamos para intentar caracterizar un parámetro poblacional. 8 00:01:13,170 --> 00:01:18,049 Bien, pues un estimador puntual es aquel que va a tomar un único valor real. 9 00:01:18,049 --> 00:01:30,670 En aquella videoclase hablábamos de estimadores centrados y eficientes, eran las características que le pedíamos a un estimador para que realmente fuera útil a la hora de estimar el parámetro poblacional. 10 00:01:30,670 --> 00:01:38,269 centrado, quería decir que en la distribución del estadístico muestral el valor esperado, 11 00:01:38,609 --> 00:01:44,909 el valor medio, se correspondía con el parámetro poblacional y en cuanto a eficientes se refería 12 00:01:44,909 --> 00:01:50,950 a que la varianza de esa distribución de los estadísticos fuera la menor posible. Pues bien, 13 00:01:50,950 --> 00:01:56,890 en el caso de las distribuciones binomial y normal son estimadores centrados y eficientes 14 00:01:56,890 --> 00:02:03,150 para los parámetros de centralización, esto es, para la binomial la proporción y para la normal la media, 15 00:02:03,890 --> 00:02:05,430 bueno, pues lo que podríamos esperar. 16 00:02:05,670 --> 00:02:09,710 Y lo que comenté como ejemplo en la videoclase anterior a la que me estoy refiriendo, 17 00:02:10,569 --> 00:02:15,469 para la proporción poblacional pi es estimador centrado y eficiente la proporción muestral p, 18 00:02:15,990 --> 00:02:21,669 para la media poblacional mu es estimador centrado y eficiente la media muestral x. 19 00:02:21,669 --> 00:02:28,030 comparar. En aquel momento hablaba de la media poblacional y la media muestral como estimador 20 00:02:28,030 --> 00:02:32,370 de la media poblacional. No decía que era un estimador puntual. Y no es el único estimador, 21 00:02:32,490 --> 00:02:37,349 veremos en la siguiente sección otro tipo de estimadores que son estimadores por intervalo, 22 00:02:37,430 --> 00:02:42,330 van a ser intervalos de confianza. Volviendo a lo que tenemos entre manos. En su momento recordé 23 00:02:42,330 --> 00:02:49,250 en la videoclase anterior lo que vimos en la unidad anterior, hablando de muestreo. Yo quiero 24 00:02:49,250 --> 00:02:55,409 determinar, voy a utilizar esto como ejemplo, la media de una cierta población y no la puedo 25 00:02:55,409 --> 00:02:59,750 determinar puesto que no puedo estudiar la población completa. Voy a tomar una muestra 26 00:02:59,750 --> 00:03:06,509 significativa, representativa, de tamaño n de esa población y de esa población, de esa muestra, 27 00:03:06,509 --> 00:03:13,090 perdón, sí voy a poder calcular la media muestra del x con barra. Por supuesto yo puedo tomar 28 00:03:13,090 --> 00:03:20,849 distintas muestras con el mismo tamaño. Si hago un muestreo aleatorio simple, el experimento aleatorio 29 00:03:20,849 --> 00:03:25,810 que utilizo para seleccionar los miembros, los elementos de la muestra, no siempre va a arrojar 30 00:03:25,810 --> 00:03:31,370 los mismos elementos. Así pues, en un caso obtendré un valor determinado de la media muestral porque 31 00:03:31,370 --> 00:03:36,389 tengo una muestra concreta. En el siguiente caso, con una muestra diferente, puedo obtener un valor 32 00:03:36,389 --> 00:03:40,930 distinto de la media muestral. ¿Qué es lo que ocurre? Que la distribución de todas estas medias 33 00:03:40,930 --> 00:03:46,669 muestrales sigue una distribución estadística conocida, en concreto una distribución normal 34 00:03:46,669 --> 00:03:53,009 con media igual a la media poblacional. Por eso la media muestral es un estimador centrado de la 35 00:03:53,009 --> 00:03:57,449 media poblacional, puesto que su distribución tiene como esperanza matemática, se distribuye 36 00:03:57,449 --> 00:04:04,090 alrededor de la media poblacional. Y en cuanto a la varianza de esa distribución de las medias 37 00:04:04,090 --> 00:04:10,490 muestrales, era la varianza poblacional dividido entre n. Y para que el estimador sea lo más 38 00:04:10,490 --> 00:04:14,509 eficiente posible, tengan la varianza lo más pequeña posible, ya discutíamos que lo que 39 00:04:14,509 --> 00:04:19,509 necesitábamos era que el tamaño de la población fuera lo mayor posible y aquí tenemos una de las 40 00:04:19,509 --> 00:04:24,709 leyes de los grandes números. ¿Por qué menciono esto? Aparte de para entender qué quiere decir 41 00:04:24,709 --> 00:04:30,370 una vez más estimador centrado y hablar una vez más de la eficiencia del estimador, pues para 42 00:04:30,370 --> 00:04:36,589 hacer hincapié en algo que va a ser importante más adelante. A nosotros en general en bachillerato 43 00:04:36,589 --> 00:04:44,589 se nos va a pedir que estudiemos la proporción poblacional a partir de la proporción muestral o bien la media poblacional a partir de la media muestral. 44 00:04:45,829 --> 00:04:55,589 Para el caso concreto de la media muestral, la distribución de las medias muestrales depende no solamente de la media poblacional y nos va a servir para determinarla, 45 00:04:56,250 --> 00:05:00,610 sino que para caracterizarla necesitamos de la varianza poblacional, lo acabo de decir. 46 00:05:00,610 --> 00:05:08,649 Es decir, la distribución de las medidas mostrales sigue una distribución normal centrada en la medida poblacional y con varianza la varianza poblacional entre n. 47 00:05:09,170 --> 00:05:17,009 Así pues, en general, en los ejercicios, se nos va a dar como dato el valor de la desviación típica o bien de la varianza poblacional. 48 00:05:17,970 --> 00:05:26,449 Esto no es realista. Si nosotros no conocemos la medida poblacional porque no conocemos la población, tanto menos vamos a conocer la varianza poblacional. 49 00:05:26,449 --> 00:05:42,610 Existen distintas condiciones en las cuales podemos hacer ciertas aproximaciones que no van a ser adecuadas, pero ¿qué ocurre si nosotros no conociéramos ni pudiéramos estimar de ninguna otra manera cuál es el valor de la varianza poblacional? 50 00:05:43,050 --> 00:05:54,810 En ese caso podemos pensar en utilizar la varianza muestral por paralelismo para estimar la varianza poblacional o bien la desviación típica muestral para estimar la desviación típica poblacional. 51 00:05:54,810 --> 00:06:14,670 Y aquí quiero hacer hincapié en algo. Hemos de tener cuidado con un detalle. El estimador centrado y eficiente, que es lo que nosotros necesitamos, centrado es que apunte, entre comillas, ya sabéis, que la distribución esté alrededor del valor poblacional que yo necesito y eficiente de mínima varianza, que la dispersión sea lo menor posible. 52 00:06:15,490 --> 00:06:21,829 Para los parámetros de dispersión, en este caso estoy pensando en la varianza, bueno, pues tenemos un problema. 53 00:06:22,810 --> 00:06:26,810 Para la varianza poblacional, me salto un momentito esta línea de aquí arriba, sigma cuadrado, 54 00:06:27,810 --> 00:06:36,629 el estimador centrado y eficiente es no la varianza amostral, sino esta función de la varianza amostral, que tiene pinta de ser complicada. 55 00:06:37,250 --> 00:06:48,490 Es n-1 partido por n en el tamaño de la población, por n entre n-1, n minúscula, el tamaño de la muestra, y este s al cuadrado si es la varianza muestral. 56 00:06:48,490 --> 00:07:00,629 Así pues, el estimador centrado y eficiente de la varianza poblacional no es directamente la varianza muestral, sino que es esta función un tanto compleja. 57 00:07:00,629 --> 00:07:08,449 ¿Quién es entonces directamente el estimador muestral del correspondiente parámetro poblacional? 58 00:07:08,449 --> 00:07:14,050 Pues no ocurre con la varianza, sino ocurre con la así denominada cuasivarianza. 59 00:07:14,689 --> 00:07:21,610 Para la cuasivarianza poblacional, si es estimador centrado y eficiente, la cuasivarianza muestral. 60 00:07:22,509 --> 00:07:27,310 Nosotros nunca, hasta este momento, hemos hablado de cuasivarianza y por esa razón, 61 00:07:27,310 --> 00:07:43,250 Lo primero, porque esto es importante, lo estoy mencionando, y para que quede bien definido, aquí tenemos esta nota al pie, que sabéis que no me gusta utilizar, prefiero contarlo de viva palabra, pero en este caso es lo bastante complejo como para que sea necesario. 62 00:07:43,250 --> 00:07:52,009 recordad cómo se definían las varianzas poblacionales y muestrales era la suma de los 63 00:07:52,009 --> 00:07:58,089 cuadrados de las desviaciones con respecto de la media en el caso de la población sumo para todos 64 00:07:58,089 --> 00:08:03,329 los elementos de la población y la media es la media poblacional en el caso de la varianza 65 00:08:03,329 --> 00:08:09,250 muestral lo que hago sumar para todos los elementos de la muestra y la media que utilizo 66 00:08:09,250 --> 00:08:15,050 es la media muestral y lo que hacíamos era dividir entre el tamaño. Cuando teníamos la 67 00:08:15,050 --> 00:08:20,670 varianza poblacional dividía entre n mayúscula tamaño de la población y cuando tenía la varianza 68 00:08:20,670 --> 00:08:26,209 muestral dividía entre n minúscula el tamaño de la media muestra, perdón, el tamaño de la muestra. 69 00:08:27,189 --> 00:08:34,929 En el caso de las cuasivarianzas el parámetro o bien el estadístico, dependiendo si hablo de la 70 00:08:34,929 --> 00:08:40,850 población o de la muestra se calcula de forma análoga lo único que en lugar de dividir entre 71 00:08:40,850 --> 00:08:47,389 el tamaño, ya sea de la población o de la muestra, se divide entre n-1, ya sea n el tamaño de la 72 00:08:47,389 --> 00:08:55,909 población o n minúscula el tamaño de la muestra. ¿Por qué entre n-1? Hay distintos argumentos 73 00:08:55,909 --> 00:09:03,169 matemáticos por los cuales para poder estimar no la varianza tenemos que utilizar la cuasivarianza 74 00:09:03,169 --> 00:09:13,769 Y es que, puesto que ya hemos tenido que determinar o bien ya hemos tenido que estimar la media polacional o la media amostral, es lo que hablamos de la teoría de los grados de libertad. 75 00:09:13,929 --> 00:09:19,350 Hemos perdido un grado de libertad y entonces no podemos dividir entre n, sino entre n menos 1. 76 00:09:21,049 --> 00:09:26,409 Grados de libertad es un concepto matemático lo bastante complicado como para que ahora no pueda hablar de ello. 77 00:09:26,409 --> 00:09:51,450 Pero la idea es esa, en última instancia. En general, en estadística, utilizamos las cuasivarianzas por comodidad, porque directamente para la cuasivarianza poblacional, y la definición es similar a la de la varianza, lo único que hay que tener en cuenta es que divido entre n-1 en lugar de n, como decía, para la cuasivarianza poblacional, es estimador centrado y eficiente directamente en la cuasivarianza muestra. 78 00:09:51,450 --> 00:10:05,429 ¿Qué es lo que ocurre? Que si la diferencia entre la varianza y la cuasivarianza es únicamente este denominador n o n-1, hay una relación muy sencilla algebraica entre las cuasivarianzas y las varianzas. 79 00:10:05,830 --> 00:10:19,169 La cuasivarianza poblacional es n entre n-1, la varianza poblacional, con n el tamaño de la población, y la cuasivarianza muestral es n entre n-1 por la varianza muestral, siendo n el tamaño de la muestra. 80 00:10:19,169 --> 00:10:39,269 Ahora, si nosotros lo que hacemos es pensar en que la cuasi-varianza poblacional se estima de una forma centrada y eficiente por la cuasi-varianza muestral y lo que hacemos es la transformación necesaria y la correspondiente para transformar estas cuasi-varianzas en varianzas, evidentemente la fórmula a la que vamos a llegar es esta. 81 00:10:40,029 --> 00:10:49,629 Para la varianza muestral, la función de la varianza muestral, perdón, para la varianza poblacional, esta función de la varianza muestral va a ser el estimador centrado y eficiente. 82 00:10:50,789 --> 00:11:06,269 Eso quiere decir que nosotros o bien estamos utilizando cuasivarianzas y utilizamos esta cuasivarianza muestral como estimador de la cuasivarianza poblacional y buscamos transformar los cálculos porque en la distribución que he mencionado anteriormente va la varianza, no la cuasivarianza. 83 00:11:06,269 --> 00:11:35,289 O bien podemos hacer lo siguiente. Considerar que en los límites en los que el tamaño de la población es suficientemente grande, idealmente tendiendo a infinito, y el tamaño de la muestra también es suficientemente grande, idealmente tendiendo a infinito, este n-1 partido por n tiende a 1, este n entre n-1 tiende a 1, y en ese caso la varianza poblacional sería un estimador centrado y eficiente para la varianza poblacional. 84 00:11:35,289 --> 00:11:56,789 Aquí tenemos una vez más una de las leyes de los grandes números. Si la población es o consideramos que es suficientemente grande y el tamaño de la muestra consideramos que es suficientemente grande, en ese caso podemos considerar por aproximación, puesto que esto sería uno, que la varianza muestral sería un estimador centrado y eficiente para la varianza población. 85 00:11:56,789 --> 00:12:14,639 Por esta razón no es descabellado lo que haremos en los ejercicios en el futuro. Si se nos da la varianza poblacional, en el caso en el que estemos estudiando la media poblacional a través de la media muestral, si la varianza poblacional se nos da, la utilizaremos. 86 00:12:14,639 --> 00:12:24,659 Si la varianza poblacional no se nos da, utilizaremos la varianza muestral como estimador centrado y eficiente para la varianza poblacional. 87 00:12:25,019 --> 00:12:35,919 Pero lo que quiero que tengáis claro es que esto ocurre únicamente en los límites en los que consideremos que el tamaño de la población y el tamaño de la muestra, ambos, son suficientemente grandes. 88 00:12:36,139 --> 00:12:38,440 Idealmente, ambos tienden a infinito. 89 00:12:38,440 --> 00:12:45,440 Y no olvidéis que es la cuasivarianza muestral quien es estimador centrado y eficiente de la cuasivarianza poblacional. 90 00:12:46,460 --> 00:12:56,440 Y los estadísticos utilizamos con carácter general la cuasivarianza en lugar de la varianza por esta propiedad buena a la hora de estimar de las cuasivarianzas, 91 00:12:57,559 --> 00:13:03,440 aparte de otras disquisiciones que exceden del ámbito de las matemáticas de bachillerato. 92 00:13:03,440 --> 00:13:09,340 bachillerato. Con esto que hemos visto ya se pueden resolver estos ejercicios 1 y 2 que 93 00:13:09,340 --> 00:13:17,019 resolveremos en clase y que resolveremos en una videoclase posterior. En el aula virtual de la 94 00:13:17,019 --> 00:13:23,440 asignatura tenéis disponibles otros recursos y cuestionarios. Asimismo tenéis más información 95 00:13:23,440 --> 00:13:28,679 en las fuentes bibliográficas y en la web. No dudéis en traer vuestras dudas e inquietudes 96 00:13:28,679 --> 00:13:33,279 a clase o al foro de dudas en el aula virtual. Un saludo y hasta pronto. 97 00:13:33,440 --> 00:13:33,740 CC por Antarctica Films Argentina