1 00:00:00,620 --> 00:00:04,500 En este vídeo vamos a aprender sobre distribuciones de probabilidad discretas. 2 00:00:04,960 --> 00:00:07,940 Hablaremos de función de probabilidad, de función de distribución, 3 00:00:08,539 --> 00:00:12,279 de los parámetros de una distribución discreta y de la distribución binomial. 4 00:00:13,500 --> 00:00:19,579 Una función de probabilidad es una función que a cada elemento del espacio muestral le asigna un valor. 5 00:00:20,859 --> 00:00:22,000 Y lo escribiremos así. 6 00:00:23,379 --> 00:00:28,339 Por ejemplo, en el experimento de tirar un dado de cuatro caras dos veces y sumar los resultados, 7 00:00:28,339 --> 00:00:33,939 tenemos el siguiente espacio muestral. Hemos colocado en la primera fila el resultado del 8 00:00:33,939 --> 00:00:40,460 dado 1 y en la primera columna el resultado del dado 2. Y vamos a llamar x a la variable 9 00:00:40,460 --> 00:00:45,659 aleatoria que representa el resultado del experimento. Por tanto, la probabilidad de 10 00:00:45,659 --> 00:00:52,880 que x, o sea, la suma de los puntos sea 2, es 1 partido por 16, porque el 2 aparece solo 11 00:00:52,880 --> 00:00:59,359 una vez entre los 16 resultados posibles. La probabilidad de que x sea 3 es 2 partido 12 00:00:59,359 --> 00:01:08,719 de 16, porque el 3 aparece dos veces, exactamente igual con 4, 5, 6, 7 y 8, que si lo queremos 13 00:01:08,719 --> 00:01:16,060 poner como función, hacemos que f de 2 sea 1 partido por 16, f de 3 2 partido por 16, 14 00:01:16,299 --> 00:01:21,319 etc. Y le damos forma de función a trozos como las funciones a trozos que nosotros conocemos 15 00:01:21,319 --> 00:01:27,900 y tiene este aspecto. Y a partir de aquí ya podemos representarla. Esta es la representación 16 00:01:27,900 --> 00:01:35,319 gráfica de la función de probabilidad. Entonces f de x es la función de probabilidad de la variable 17 00:01:35,319 --> 00:01:42,200 x y como la función es discreta, es decir, sólo toma valores en los números naturales, entonces 18 00:01:42,200 --> 00:01:49,140 diremos que la variable aleatoria x es discreta. Una función de probabilidad tiene las siguientes 19 00:01:49,140 --> 00:01:54,260 propiedades. En primer lugar, la función toma siempre valores entre 0 y 1, lo cual es lógico 20 00:01:54,260 --> 00:02:00,219 porque se trata de probabilidades. Y en segundo lugar, la suma de todos los valores de la función 21 00:02:00,219 --> 00:02:07,180 siempre tiene que ser 1. En nuestro caso particular tenemos esta función de probabilidad y efectivamente 22 00:02:07,180 --> 00:02:14,659 todos los valores, 1 partido por 16, 2 partido por 16, son todos entre 0 y 1. Y además, si sumamos 23 00:02:14,659 --> 00:02:21,500 todas las probabilidades, f de 2 más f de 3 hasta f de 8, tenemos esa suma que efectivamente 24 00:02:21,500 --> 00:02:29,629 da 1. Una función de distribución a partir de una función de probabilidad es una función 25 00:02:29,629 --> 00:02:37,069 que indica la probabilidad de que la variable aleatoria x sea menor o igual que un valor 26 00:02:37,069 --> 00:02:44,770 dado y la representaremos así. Y también la podemos entender como la suma de las probabilidades 27 00:02:44,770 --> 00:02:54,389 de todos los puntos menores o iguales que x sub i y la representaremos así y diremos que la variable 28 00:02:54,389 --> 00:03:00,310 aleatoria x se distribuye con la función de distribución f de x y lo representaremos así x 29 00:03:00,310 --> 00:03:08,449 virgulilla f de x. En nuestro ejemplo tenemos que f mayúscula, es decir, la función de distribución 30 00:03:08,449 --> 00:03:16,250 para 2 coincide con la función de probabilidad para 2, 1 partido por 16, f mayúscula de 3 es f 31 00:03:16,250 --> 00:03:24,930 minúscula de 2 más f minúscula de 3, para 4, para 5, para 6, para 7 y para 8, que debe dar 1, 32 00:03:25,129 --> 00:03:33,560 porque la suma de todas las probabilidades debe dar 1. La función con función a trozos tiene esa 33 00:03:33,560 --> 00:03:42,199 pinta, que se puede representar, y la representación gráfica tiene este aspecto. Los parámetros de una 34 00:03:42,199 --> 00:03:49,259 distribución son valores que resumen los datos de una variable aleatoria. Y vamos a ver tres. En 35 00:03:49,259 --> 00:03:59,460 primer lugar la media, después la varianza y por último la desviación típica. La media se representa 36 00:03:59,460 --> 00:04:05,280 como el nombre de la variable, en este caso x, con un palote arriba o con la letra griega mu y es la 37 00:04:05,280 --> 00:04:10,960 suma de cada valor por su probabilidad y lo que representa es el valor promedio que tomará la 38 00:04:10,960 --> 00:04:18,339 variable x. La varianza se representa con una v o con la letra sigma al cuadrado y es la suma de 39 00:04:18,339 --> 00:04:23,480 las distancias de x sub i respecto de la media al cuadrado multiplicado por su probabilidad, 40 00:04:23,920 --> 00:04:27,920 aunque nosotros utilizaremos esta otra fórmula que es mucho más operativa. Lo que representa 41 00:04:27,920 --> 00:04:32,699 la varianza es el promedio de desviación de los datos respecto de la media, es decir, 42 00:04:32,839 --> 00:04:37,720 cómo deseparados están los datos respecto de la media. Por último, la desviación típica 43 00:04:37,720 --> 00:04:42,459 no es más que la raíz cuadrada de la varianza. ¿Por qué utilizamos la desviación típica 44 00:04:42,459 --> 00:04:47,019 en lugar de la varianza? Pues porque la desviación típica tiene las mismas unidades que los 45 00:04:47,019 --> 00:04:52,100 datos. Es decir, si los datos se están midiendo en kilos, la desviación típica se mide en 46 00:04:52,100 --> 00:04:57,060 kilos. Si los datos están midiendo puntos en un dado, la desviación típica se mide 47 00:04:57,060 --> 00:05:03,620 en puntos en un dado. En nuestro ejemplo tenemos que x se distribuye con esa función de probabilidad. 48 00:05:06,990 --> 00:05:12,410 Calculamos la media. La media es la suma de x sub i por p sub i, es decir, cada valor 49 00:05:12,410 --> 00:05:18,910 por su probabilidad, o sea, 2 por 1 partido por 16, más 3 por 2 partido por 16, etc. 50 00:05:19,509 --> 00:05:22,870 Hacemos esa operación y nos da 5. Por lo tanto, la media es 5. 51 00:05:22,970 --> 00:05:29,009 Es decir, al hacer este experimento, lo que se espera es que la suma de los puntos sea un 5. 52 00:05:30,189 --> 00:05:34,350 Hacemos la desviación típica. La desviación típica es la raíz cuadrada de esa expresión, 53 00:05:34,649 --> 00:05:39,970 que es el cuadrado de cada punto por su probabilidad, todo sumado y restado el cuadrado de la media. 54 00:05:39,970 --> 00:05:46,709 y eso me da la raíz de 2,5, que es 1,5811. 55 00:05:47,189 --> 00:05:50,970 Por tanto, la desviación típica es 1,5811 puntos. 56 00:05:53,930 --> 00:05:56,769 Te propongo que intentes hacer todo esto con este ejercicio. 57 00:06:01,740 --> 00:06:04,379 Pausa el vídeo porque las soluciones vienen a continuación. 58 00:06:07,189 --> 00:06:08,170 Estas son las soluciones. 59 00:06:08,889 --> 00:06:11,370 Función de probabilidad, espacio muestral, representación. 60 00:06:12,649 --> 00:06:14,490 Función de distribución, representación. 61 00:06:15,490 --> 00:06:17,029 Y los parámetros. 62 00:06:17,029 --> 00:06:22,930 La media es 7, la valencia es 5,83 y la desviación típica 2,415. 63 00:06:24,230 --> 00:06:28,810 La distribución binomial es un caso típico de distribución discreta. 64 00:06:31,930 --> 00:06:38,129 Es una distribución discreta que consiste en hacer una cantidad n de experimentos de éxito-fracaso 65 00:06:38,129 --> 00:06:45,829 en los que la probabilidad de éxito es p de e igual a p y la probabilidad de fracaso es q, es decir, 1 menos p. 66 00:06:45,829 --> 00:06:50,839 Y la distribución binomial se define con dos parámetros. 67 00:06:51,060 --> 00:06:54,120 Por un lado el número de intentos y por otro lado la probabilidad de éxito. 68 00:06:54,680 --> 00:06:56,639 Y la vamos a representar así, BNP. 69 00:06:57,800 --> 00:07:02,180 La media de una distribución binomial se calcula multiplicando N por P 70 00:07:02,180 --> 00:07:06,120 y la varianza se calcula multiplicando N por P y por Q. 71 00:07:06,779 --> 00:07:10,759 Por lo tanto, la desviación típica es la raíz cuadrada de N por P y por Q. 72 00:07:11,379 --> 00:07:14,660 Todo esto se puede demostrar, pero no es objetivo de este curso demostrar que esto es así. 73 00:07:16,160 --> 00:07:20,879 En la distribución binomial, la probabilidad de obtener K éxitos y N menos K fracasos 74 00:07:20,879 --> 00:07:27,980 será la probabilidad de tener primero k éxitos y luego el resto hasta n fracasos, o sea, n menos k. 75 00:07:28,399 --> 00:07:32,279 Como son sucesos independientes, podemos multiplicar todas las probabilidades. 76 00:07:32,839 --> 00:07:37,579 Es decir, multiplicamos la probabilidad de k veces y la probabilidad de fracaso n menos k veces. 77 00:07:38,300 --> 00:07:43,660 Lo ponemos en forma de potencia y como p, la probabilidad de éxito, es p 78 00:07:43,660 --> 00:07:47,319 y la probabilidad de fracaso es 1 menos p, nos queda esa fórmula. 79 00:07:47,319 --> 00:07:52,040 pero k éxitos y n menos k fracasos pueden ocurrir de muchas maneras 80 00:07:52,040 --> 00:07:53,279 así que esto hay que ordenarlo 81 00:07:53,279 --> 00:07:58,680 multiplicamos por tanto por las diferentes ordenaciones de k éxitos y n menos k fracasos 82 00:07:58,680 --> 00:08:01,220 es decir, el número combinatorio n sobre k 83 00:08:01,220 --> 00:08:04,019 por lo tanto, en una distribución binomial 84 00:08:04,019 --> 00:08:09,920 la probabilidad de obtener exactamente k éxitos es n sobre k 85 00:08:09,920 --> 00:08:13,879 por p elevado a k por 1 menos p elevado a 1 menos k 86 00:08:13,879 --> 00:08:17,199 vamos a ver todo esto con un problema de ejemplo 87 00:08:19,720 --> 00:08:23,220 Una mutación genética está presente en 2 de cada 5 personas. 88 00:08:23,759 --> 00:08:25,220 Hacemos un estudio en 9 personas. 89 00:08:25,740 --> 00:08:28,779 ¿Cuántas personas de ese grupo se espera que tengan la mutación? 90 00:08:29,420 --> 00:08:32,700 Bueno, pues esto es un ejemplo de distribución binomial 91 00:08:32,700 --> 00:08:39,720 que se distribuye con una binomial de 9 intentos y probabilidad 2 quintos, es decir, 0,2. 92 00:08:40,240 --> 00:08:43,799 Como nos preguntan cuántas personas se espera que la tengan, 93 00:08:44,419 --> 00:08:45,960 lo que nos están pidiendo es la media. 94 00:08:45,960 --> 00:08:50,120 Y la media es n por p, es decir, 9 por 0,2, 1,8. 95 00:08:50,419 --> 00:08:54,679 O sea, se espera que aparezca la mutación en una o dos personas. 96 00:08:57,159 --> 00:09:00,659 ¿Cuál es la probabilidad de que haya cuatro personas que presentan la mutación? 97 00:09:01,539 --> 00:09:06,580 Bueno, pues llamamos éxito a presentar la mutación y fracaso a no presentarla. 98 00:09:07,259 --> 00:09:13,980 Si tenemos cuatro éxitos, tenemos cinco fracasos, es decir, E, E, E, E, F, F, F, F, F. 99 00:09:13,980 --> 00:09:26,460 La probabilidad de ese suceso, es decir, 4 éxitos y 5 fracasos, es 0,2 multiplicado 4 veces y 0,8 multiplicado 5 veces, porque son sucesos independientes. 100 00:09:26,559 --> 00:09:29,899 Es decir, 0,2 a la 4 por 0,8 a la 5. 101 00:09:31,139 --> 00:09:35,840 Pero, claro, 4 éxitos y 5 fracasos pueden aparecer de muchas maneras. 102 00:09:36,360 --> 00:09:42,399 Es decir, pueden aparecer de 126 maneras, que es 9 sobre 4 o 9 sobre 5, que es lo mismo. 103 00:09:42,399 --> 00:09:47,539 Esto se hace con el número combinatorio 9 sobre 4, me da 126 104 00:09:47,539 --> 00:09:57,779 Y por lo tanto la probabilidad de que x sea exactamente igual a 4 es 9 sobre 4 por 0,2 elevado a 4 por 0,8 elevado a 5 105 00:09:57,779 --> 00:10:01,080 Es decir, 0,0661 106 00:10:01,080 --> 00:10:06,759 Si no queremos hacer los cálculos con la calculadora, podemos buscar en las tablas de la binomial 107 00:10:06,759 --> 00:10:12,179 Las tablas de la binomial están en cualquier libro y están también en internet y tienen más o menos ese aspecto 108 00:10:12,179 --> 00:10:19,779 Para buscar una probabilidad en la tabla de la binomial, lo primero que hacemos es localizar el número de intentos, en nuestro caso 9. 109 00:10:20,419 --> 00:10:24,200 Después localizamos la probabilidad, en nuestro caso 0,2. 110 00:10:24,960 --> 00:10:29,340 Y ahora buscamos el número de aciertos que queremos tener, en nuestro caso 4. 111 00:10:29,940 --> 00:10:39,120 Donde se cruzan el número de aciertos con la probabilidad es la probabilidad que estamos buscando, en este caso 0,0661, que es exactamente lo que teníamos antes. 112 00:10:39,120 --> 00:10:44,580 Ahora, ¿cuál es la probabilidad de que haya más de 6 personas con la mutación? 113 00:10:44,759 --> 00:10:51,860 Bueno, pues la probabilidad de que haya más de 6 personas es la probabilidad de que haya 7, de que haya 8 y de que haya 9 114 00:10:51,860 --> 00:10:57,340 Hacemos todos los cálculos de cada uno de los casos y ese es el resultado 115 00:10:57,340 --> 00:11:01,759 Igual que antes, si no queremos tirar de calculadora, podemos volver a mirar en la tabla 116 00:11:01,759 --> 00:11:07,080 Buscamos el número de intentos, buscamos la columna de nuestra probabilidad, 0,2 117 00:11:07,080 --> 00:11:12,039 y seleccionamos todos los valores que cumplen con el caso que estamos viendo, 118 00:11:12,139 --> 00:11:15,480 es decir, que sea más grande que 6, que son esos tres de ahí. 119 00:11:15,940 --> 00:11:18,919 Si los sumamos, pues efectivamente nos da exactamente lo mismo. 120 00:11:20,019 --> 00:11:23,159 Os dejo ahora aquí con dos preguntas que podéis intentar vosotros. 121 00:11:25,659 --> 00:11:28,500 Pausa del vídeo porque las soluciones van a aparecer a continuación.