1 00:00:12,269 --> 00:00:17,510 Hola a todos, soy Raúl Corraliza, profesor de matemáticas de bachillerato en el IES 2 00:00:17,510 --> 00:00:21,890 arquitecto Pedro Gumiel de Alcalá de Henares, y os doy la bienvenida a esta serie de videoclases 3 00:00:21,890 --> 00:00:26,769 de la unidad PR4 dedicada a las variables aleadoras continuas y a la distribución normal. 4 00:00:27,390 --> 00:00:36,219 En la videoclase de hoy estudiaremos el uso de la distribución normal como aproximación 5 00:00:36,219 --> 00:00:50,960 de la binomial. En esta videoclase vamos a estudiar cómo utilizar la distribución normal 6 00:00:50,960 --> 00:00:53,600 como aproximación de la distribución binomial. 7 00:00:54,380 --> 00:01:00,439 Si comparáis la forma de la gráfica de la función de probabilidad de una distribución binomial 8 00:01:00,439 --> 00:01:03,359 y de la función de densidad de probabilidad de una distribución normal, 9 00:01:04,120 --> 00:01:09,060 habréis podido ver que la forma es bastante similar, una campana muy similar de forma. 10 00:01:09,180 --> 00:01:11,659 No es idénticamente a la misma, pero es muy, muy, muy similar. 11 00:01:12,340 --> 00:01:14,780 La diferencia fundamental entre ambas es que, por supuesto, 12 00:01:15,579 --> 00:01:19,280 la función de densidad de una distribución normal es una función continua 13 00:01:19,280 --> 00:01:21,540 como corresponde a una variable aleatoria continua, 14 00:01:21,959 --> 00:01:24,780 mientras que la función de probabilidad de una distribución binomial 15 00:01:24,780 --> 00:01:30,260 es una función discontinua, es una función discreta 16 00:01:30,260 --> 00:01:32,959 como corresponde a una variable aleatoria discreta. 17 00:01:33,280 --> 00:01:37,000 Pues bien, hay un teorema que nos va a permitir utilizar la distribución normal 18 00:01:37,000 --> 00:01:38,739 como aproximación de la binomial. 19 00:01:38,900 --> 00:01:41,000 Se trata del teorema de De Moivre-Laplace 20 00:01:41,000 --> 00:01:47,079 y en el caso en el que n, el número de repeticiones en la distribución binomial, 21 00:01:47,079 --> 00:01:51,359 tienda a infinito, fijaos que vamos a acabar haciendo uso de una de las leyes 22 00:01:51,359 --> 00:01:55,420 de los grandes números, podemos utilizar una distribución 23 00:01:55,420 --> 00:01:59,120 normal como aproximación de la binomial. Y la idea es 24 00:01:59,120 --> 00:02:02,180 esta. Si nosotros necesitáramos 25 00:02:02,180 --> 00:02:06,939 utilizar o describir una variable aleatoria binomial 26 00:02:06,939 --> 00:02:11,240 con n repeticiones y p probabilidad de éxito y n 27 00:02:11,240 --> 00:02:14,960 toma un valor muy grande, en el límite del infinito, 28 00:02:14,960 --> 00:02:28,139 podemos utilizar en el lugar de esta x una variable y que va a ser normal con media n por p y con 29 00:02:28,139 --> 00:02:35,319 desviación típica raíz cuadrada de n por p por 1 menos p. Fijaos que lo que tenemos aquí es una 30 00:02:35,319 --> 00:02:41,659 distribución normal con media la media de la distribución binomial y con desviación típica 31 00:02:41,659 --> 00:02:49,280 la desviación típica de la distribución binomial. Podemos dar un paso más y, puesto que nosotros no 32 00:02:49,280 --> 00:02:53,819 vamos a utilizar en general distribuciones normales cualesquiera sino la distribución 33 00:02:53,819 --> 00:03:00,199 normal estándar, podemos estandarizar esta variable. Y lo que vamos a hacer es utilizar en su lugar 34 00:03:00,199 --> 00:03:06,439 una variable aleatoria x que va a ser normal estándar y que vamos a construir restándole a 35 00:03:06,439 --> 00:03:12,240 está ahí su media y dividiendo entre su desviación típica. En última instancia lo que vamos a hacer 36 00:03:12,240 --> 00:03:20,759 es considerar no esta y sino esta z que se va a calcular restándole a x su media n por p y 37 00:03:20,759 --> 00:03:26,879 dividiendo entre su desviación típica, red cuadrada de n por p por 1 menos p. Esta variable z así 38 00:03:26,879 --> 00:03:33,080 construida va a seguir una distribución normal estándar con media 0 y desviación típica 1. 39 00:03:33,080 --> 00:03:42,800 Cabe preguntarse qué quiere decir eso de n tendiendo infinito, puesto que evidentemente n tendiendo infinito no lo vamos a poder conseguir. 40 00:03:43,900 --> 00:03:50,080 Recuerdo que en su momento, hablando de la ley de los grandes números, dije que deberíamos llamarle en realidad ley de los enormemente grandes números, 41 00:03:50,259 --> 00:03:57,539 puesto que en realidad, siendo estrictos, eso de que las probabilidades convergen cuando n tende infinito se observa con repeticiones, 42 00:03:57,639 --> 00:04:01,740 con un número de repeticiones enormemente grande, mucho más grande del que uno podría esperar. 43 00:04:01,740 --> 00:04:16,420 Bueno, pues efectos prácticos y como podéis ver aquí, vamos a empezar a utilizar esta aproximación considerándola suficientemente adecuada, no estrictamente precisa, pero suficientemente adecuada, para valores de n que sean mayores que 10. 44 00:04:16,420 --> 00:04:19,860 Y evidentemente, cuanto mayor sea n, mayor que 10, mejor será. 45 00:04:21,500 --> 00:04:25,959 Necesitamos que las probabilidades de éxito y de fracaso sean suficientemente próximas a 0,5, 46 00:04:26,139 --> 00:04:31,819 puesto que la distribución binomial no lo es, salvo que la probabilidad de éxito sea idénticamente igual a 0,5. 47 00:04:32,240 --> 00:04:39,139 Será suficientemente simétrica cuando la probabilidad lo sea, pero suficientemente próxima a 0,5, quiero decir. 48 00:04:39,939 --> 00:04:47,680 Esto ocurrirá cuando consideremos que n por p sea mayor que 5 y n por 1 menos p también sea mayor que 5. 49 00:04:48,339 --> 00:04:54,300 Dependiendo de qué literatura consultéis o a quién preguntéis, os podéis encontrar con criterios ligeramente distintos. 50 00:04:54,300 --> 00:04:58,300 Estos son los más habituales y los que nosotros en bachillerato utilizaremos. 51 00:04:58,300 --> 00:05:03,740 utilizaremos. Insisto, consideraremos que n es suficientemente grande y que la binomial es 52 00:05:03,740 --> 00:05:12,300 suficientemente simétrica como para poder utilizar esta normal estándar en sustitución de la binomial 53 00:05:12,300 --> 00:05:17,060 que sería la correcta cuando el número de repeticiones sea mayor que 10, cuanto mayor mejor, 54 00:05:17,779 --> 00:05:26,959 y cuando n por p sea mayor que 5 y n por 1 menos p también. Algo que debemos tener en cuenta es lo 55 00:05:26,959 --> 00:05:30,500 que se llama la corrección de continuidad, en este caso la corrección de continuidad 56 00:05:30,500 --> 00:05:37,120 de Yates, que consiste en que aunque estemos utilizando una distribución normal no podemos 57 00:05:37,120 --> 00:05:44,459 obviar que en realidad estamos partiendo de una distribución binomial. Y nos encontramos 58 00:05:44,459 --> 00:05:50,420 con el problema de cómo podemos calcular utilizando la distribución normal la probabilidad 59 00:05:50,420 --> 00:05:55,220 de que X binomial tome un valor numérico concreto. En un momento dado nosotros podemos 60 00:05:55,220 --> 00:06:00,019 hacer 10.000 repeticiones de un cierto experimento y nos podemos preguntar por la probabilidad de 61 00:06:00,019 --> 00:06:05,379 que haya exactamente 17 éxitos. Si nosotros queremos utilizar una distribución normal no 62 00:06:05,379 --> 00:06:11,360 podemos calcular directamente esta probabilidad de que la variable z normal estándar que hayamos 63 00:06:11,360 --> 00:06:16,779 construido restándole a x su media y dividiendo entre su desviación típica tome un valor numérico 64 00:06:16,779 --> 00:06:23,839 concreto puesto que en el paso a una distribución continua esa probabilidad para un valor numérico 65 00:06:23,839 --> 00:06:28,800 concreto es 0. Esta discusión la hicimos en el momento en el que hablamos de la función 66 00:06:28,800 --> 00:06:33,560 de densidad de probabilidad de una variable aleatoria continua en la sección 2 de esta 67 00:06:33,560 --> 00:06:39,720 misma unidad. ¿Qué es lo que ocurre? Pues que tenemos que hacer un ajuste para tener 68 00:06:39,720 --> 00:06:47,079 en cuenta esto, que estamos pasando de una variable x que va a tomar valores naturales 69 00:06:47,079 --> 00:06:55,319 0, 1, 2, 3, 4 a una variable y normal o bien z normal estándar que toma valores dentro de toda 70 00:06:55,319 --> 00:07:00,420 la recta real. Y la idea es esta. Cada vez que nos preguntemos por la probabilidad de que una 71 00:07:00,420 --> 00:07:06,180 binomial toma un valor numérico concreto, al hacer la transformación por la normal, lo que vamos a 72 00:07:06,180 --> 00:07:13,220 hacer es a este valor x restarle 0,5 como límite inferior y sumarle 0,5 como límite superior y 73 00:07:13,220 --> 00:07:19,100 transformar esta probabilidad en un punto concreto por la probabilidad en este intervalo, que insisto 74 00:07:19,100 --> 00:07:28,939 construiremos restando y sumando 0,5 a este valor de x. Esto en el caso de y la normal que corresponda 75 00:07:28,939 --> 00:07:34,939 con su media y su desviación típica, el equivalente cuando tengamos la normal estándar. En el caso en 76 00:07:34,939 --> 00:07:41,600 el que se nos pregunte por una probabilidad de una cola a la izquierda x menor o igual que x0, 77 00:07:41,600 --> 00:07:48,600 lo que haremos será también tomar la probabilidad de una cola de la izquierda, pero a la abstisa le sumaremos 0,5. 78 00:07:49,120 --> 00:07:53,379 Cuando la desigualdad sea estricta, le restaremos 0,5. 79 00:07:53,879 --> 00:07:59,040 Cuando se nos pida la probabilidad de una cola de la derecha, x mayor o igual que x0, 80 00:07:59,819 --> 00:08:06,319 cuando la abstisa esté incluida, lo que haremos será poner la probabilidad de que la normal sea mayor o igual que y sub 0, 81 00:08:06,399 --> 00:08:09,579 también va a ser una cola de la derecha, restando 0,5. 82 00:08:09,579 --> 00:08:15,000 Y cuando la desigualdad sea estricta, sin la igualdad, sumaremos 0,5. 83 00:08:15,600 --> 00:08:23,180 Cuando tengamos la probabilidad de un intervalo y los dos extremos estén cerrados, estén incluidos, 84 00:08:23,579 --> 00:08:30,699 en los dos extremos, perdón, en el extremo de la izquierda restaremos 0,5 y en el extremo de la derecha sumaremos 0,5. 85 00:08:31,199 --> 00:08:34,100 Aquí abajo vemos el caso en el que los dos extremos estén abiertos. 86 00:08:34,100 --> 00:08:40,120 En ese caso, en el de la izquierda sumaremos 0,5 y en el de la derecha restaremos 0,5. 87 00:08:41,220 --> 00:08:48,120 Cuando en la probabilidad de ese intervalo el extremo izquierdo está abierto y el derecho cerrado, en ambos casos sumaremos 0,5. 88 00:08:48,639 --> 00:08:55,279 Cuando el extremo de la izquierda esté cerrado y el de la derecha está abierto, en ambos casos restaremos 0,5. 89 00:08:56,220 --> 00:09:12,620 Teniendo esto en mente, teniendo en cuenta la normalización para poder, la estandarización, perdón, para poder consultar la tabla de la distribución normal-estándar, ya podremos resolver estos ejercicios que resolveremos en clase, probablemente resolveremos en alguna videoclase posterior. 90 00:09:15,789 --> 00:09:21,389 En el aula virtual de la asignatura tenéis disponibles otros recursos y cuestionarios. 91 00:09:22,110 --> 00:09:26,230 Asimismo, tenéis más información en las fuentes bibliográficas y en la web. 92 00:09:27,090 --> 00:09:31,809 No dudéis en traer vuestras dudas y inquietudes a clase o al foro de dudas en el aula virtual. 93 00:09:32,409 --> 00:09:33,769 Un saludo y hasta pronto.