1 00:00:00,370 --> 00:00:17,969 Vamos a hacer un poco de recapitulación. La semana pasada lo último que vimos fue los criterios de redondeo. Si os acordáis, como siempre, como tengo la pantalla conectada, si alguien quiere algo que me interrumpa porque no veo el chat. 2 00:00:17,969 --> 00:00:32,990 Hasta que no me meto no lo veo. Entonces, lo último que vimos fue los criterios de redondeo, que es el mecanismo que utilizamos cuando queremos quitar alguna cifra y tenemos que utilizar un criterio que sea lógico y uniforme. 3 00:00:32,990 --> 00:00:45,729 Entonces, lo que hacemos es, cuando la cifra que queremos eliminar está entre el 0 y el 4, redondeamos al número anterior. Por ejemplo, si tengo 6 con 3, redondearía a 6. 4 00:00:45,729 --> 00:01:06,049 Si la cifra que quiero eliminar está entre el 6 y el 9, lo que hago es irme al número siguiente. Si, por ejemplo, tengo 5,8, redondeo a 6 y mi problema o el dilema está cuando tengo la cifra que quiero eliminar es un 5, 5 00:01:06,049 --> 00:01:21,650 que está igual de cerca del número siguiente que del número anterior. Entonces, utilizo un criterio que es que si el número anterior, el que le precede, es impar, le sumo 1. 6 00:01:21,650 --> 00:01:39,150 O sea, 5,15 como el 1 es impar, lo dejo en 5,2. Si el número que lo precede es par, no lo modifico, lo dejo como está. Entonces, 5,25 como este es par, se me redondea a 5,2. 7 00:01:39,150 --> 00:02:00,010 Y esto es lo último que habíamos visto. Y habíamos dejado pendiente ver el manejo de la calculadora científica. Entonces, ahora sí que necesito que me ayudéis, vamos, que me digáis qué calculadoras tenéis, porque yo me he bajado un simulador de calculadora CASIO y tiene un montón de modelos. 8 00:02:00,010 --> 00:02:23,870 ¿Vale? Entonces, yo por ejemplo, la que utilizo siempre es una de las más sencillas, que es la FX82, que no sé ni siquiera si está aquí el simulador. A ver si es esta. No, no es esta. FX82MS. 9 00:02:23,870 --> 00:02:46,169 A ver, es que hay un montón de FX82. A ver si hay alguno 82. Nada, son todas muy parecidas. La mía no es exactamente esta. No sé qué modelo tenéis vosotros, porque normalmente hay básicamente tres tipos. 10 00:02:46,169 --> 00:02:53,169 La que tengo yo y la más, más, más antigua, que esa no os la recomiendo porque no hace regresiones. 11 00:02:53,889 --> 00:03:00,389 Y luego la siguiente, que son todas muy parecidas, que son, ojalá no la encuentre, la que tenía puesta cuando he conectado. 12 00:03:06,780 --> 00:03:09,800 Me vais a perdonar porque ahora no sé cuál es la que estaba puesta. 13 00:03:09,800 --> 00:03:32,900 Bueno, lo podemos hacer con cualquiera 14 00:03:32,900 --> 00:03:34,159 Así que lo único, eso sí 15 00:03:34,159 --> 00:03:36,479 No sé si alguno me estáis escribiendo para que me digáis 16 00:03:36,479 --> 00:03:37,460 Ah, mira aquí, bien 17 00:03:37,460 --> 00:03:40,340 Fx570es 18 00:03:40,340 --> 00:03:42,979 Venga, pues vamos a poner esa porque como nos da igual cualquiera 19 00:03:42,979 --> 00:03:45,039 Fx 20 00:03:45,039 --> 00:03:55,699 Mira, aquí hay una Fx570 21 00:03:55,699 --> 00:03:58,719 Bueno, puede ser, ¿no? 22 00:03:58,740 --> 00:04:00,120 Parecida esta interfaz 23 00:04:00,120 --> 00:04:06,539 Bueno, esta va a ser una que vais a tener muchos, muy parecida, ¿vale? 24 00:04:06,740 --> 00:04:20,560 Entonces, bueno, esta es más moderna, la mía, a ver si puedo conectar la cámara y me veis, y os la enseño, es la FX82MS, que es un modelo un poquito anterior a este. 25 00:04:20,560 --> 00:04:26,920 Y la pantalla no es tan grande, entonces, bueno, pues está más simplificado, ¿no? No nos viene todo tan escrito. 26 00:04:26,920 --> 00:04:39,759 Pero el caso, ¿qué es lo que tenemos que hacer en una calculadora científica? Que casi todas, pongo siempre el ejemplo de Casio, porque la inmensa mayoría son Casio y las que no suelen tener el mismo sistema operativo, vamos, que se manejan igual. 27 00:04:40,560 --> 00:04:51,860 Entonces, en este caso estamos utilizando herramientas estadísticas, ¿no? Entonces, nos iríamos a estadística con estas flechas de aquí y le daríamos al OK, ¿vale? 28 00:04:51,860 --> 00:05:05,060 Nos dice si queremos una variable o dos variables. Nosotros ahora, de primeras, con lo que estamos haciendo ahora, solo tenemos una variable. Por ejemplo, hemos calculado la media, la moda, la desviación típica. 29 00:05:05,540 --> 00:05:21,399 Eso, ¿cómo lo hacemos? Lo que tenemos es una serie de datos y calculamos la media de esa serie de datos. No tenemos dos variables x y que estén relacionadas entre sí. Eso ya lo veremos cuando hagamos la parte de regresión, que tendremos dos variables. 30 00:05:21,399 --> 00:05:38,800 Pero por ahora tenemos una. Esto os lo dice esta calculadora que es más moderna. Si tenéis una más de este estilo, aquí vais a tener Mode, lo veis, y aquí cuando le deis a Mode podéis elegir el modo estadística. 31 00:05:38,800 --> 00:05:46,459 En esta calculadora en concreto, cuando pulsas Mode, te salen unas opciones y el número 2 es la función estadística. 32 00:05:47,259 --> 00:05:56,100 Entonces, tenemos esta de aquí del simulador, que te viene todo más explicado y es simplemente ir navegando con las teclas, 33 00:05:56,620 --> 00:05:59,839 y luego este estilo, que hay que buscarlo un poco más. 34 00:05:59,839 --> 00:06:04,139 Aquí lo que tenemos que saber es que cuando pulsamos Shift, esta tecla de aquí, 35 00:06:04,139 --> 00:06:21,180 Luego, cuando pulsemos un botón, va a activar la función que está en amarillo. Por ejemplo, si pulso Shift y le doy aquí, que pone S-Bar, se me van a abrir las opciones para calcular la varianza, la media, la desviación típica, las funciones estadísticas. 36 00:06:21,180 --> 00:06:32,199 Y aquí en este modelo va a ser todo mucho más automático. Entonces le doy a una variable, le doy a OK y ya me sale una tabla para poder meter mis valores. 37 00:06:32,199 --> 00:07:01,160 Entonces, pues vamos a hacer, por ejemplo, como si fuese un pH, meto el 5,66, venga, ok, 8,35, ok, 7,63, los datos que me den, ¿vale? Me los estoy inventando y 6,79, venga, ok. 38 00:07:01,160 --> 00:07:29,639 Y ahora me voy a calcular los parámetros que sean. Entonces, le doy a OK y me dice, vale, parámetros de una variable, cálculos estadísticos. Le voy a dar a los parámetros y cuando le doy a OK, automáticamente me saca todo, ¿vale? Estas calculadoras que son más modernas, que lo que os digo, son calculadoras de 20 euros, que no es que sea nada muy, muy loco, pero bueno, que te hacen todo automáticamente. 39 00:07:29,639 --> 00:07:50,279 Entonces, aquí tenemos la media de los datos que yo he metido es 7,1075. La suma de todos los datos, esto de aquí acordaos que es sumatorio, ¿vale? 28,43. La suma de todos los datos al cuadrado, 206,0791. Me da dando todos los datos. 40 00:07:50,279 --> 00:08:08,639 Por eso quería que viésemos lo de la calculadora. Aquí tenemos que tener mucho cuidado. Acordaos que cuando tenemos la letra griega, el sigma, estamos hablando de población y cuando tenemos la letra latina, la S, estamos hablando de muestra. 41 00:08:08,639 --> 00:08:28,579 Y daos cuenta que no es exactamente el mismo valor. Aquí nos dice que sigma cuadrado de X es 1,0032 y ese cuadrado es 1,337. Como he metido muy poquitos datos, va a haber más diferencia entre población y muestra. 42 00:08:28,579 --> 00:08:45,179 Entonces, acordaos que, a no ser que se diga lo contrario, nosotros en el laboratorio siempre estamos trabajando con muestras. Estamos trabajando con un número de datos que no es lo suficientemente grande como para trabajar con estadística poblacional. 43 00:08:45,179 --> 00:08:57,320 Entonces, nosotros, si hemos metido ahora en la calculadora los datos de unas medidas de pH, si queremos saber la varianza que tienen, tenemos que irnos aquí, a la S cuadrado, ¿vale? No a la sigma cuadrado. 44 00:08:58,080 --> 00:09:10,940 Y luego lo de siempre, la S cuadrado, acordaos que no es desviación, que es varianza. Si quiero hacer la desviación, ¿qué tendré que hacer? La raíz cuadrada de esto de aquí, pero estas calculadoras me la hacen. 45 00:09:10,940 --> 00:09:26,539 Y aquí la tenemos, ¿vale? Tenemos la varianza, perdón, la desviación. Aquí tenemos n, que es el número de datos, ¿vale? n también es muy importante tenerlo siempre en la cabeza porque lo vamos a utilizar para un montón de cálculos. 46 00:09:27,080 --> 00:09:45,700 Luego tenemos el valor mínimo y tenemos la mediana, que es esta de aquí, y los cuartiles, que no sé si os acordáis que hablábamos que la mediana es ese dato, ese punto en el que tenemos la mitad de los datos por encima y la mitad de los datos por debajo. 47 00:09:45,700 --> 00:10:05,320 Y los cuartiles es, si en vez de dividir nuestros datos en dos, los dividimos en cuatro, el primero será hasta el 25%, la mediana será el Q2, el cuartil 2, el 75% será el Q3 y el 100% sería el Q4, ¿no? El último valor. 48 00:10:06,299 --> 00:10:09,620 ¿Qué más nos da? Y nos da el valor máximo. 49 00:10:09,620 --> 00:10:26,799 Para que veáis que todo lo que hemos estado viendo de todas las fórmulas, cómo calcular la S, que es hacer la raíz cuadrada de la suma de cada uno de los valores menos el valor medio elevado al cuadrado y dividido entre el número total de valores. 50 00:10:27,419 --> 00:10:30,039 Todas esas fórmulas la calculadora nos las hace en un momento. 51 00:10:30,039 --> 00:10:46,960 En el examen y demás, calculadora, pero luego en el laboratorio, en aplicaciones más a nivel, si estáis trabajando en un laboratorio, trabajáis en una empresa o lo que sea, se hace casi todo con hojas de cálculo. 52 00:10:46,960 --> 00:11:05,879 Se utiliza mucho más que la calculadora. Evidentemente, si estás en el laboratorio y tienes que hacer un cálculo rápido, lo haces con la calculadora sin ningún problema, pero que el tratamiento de datos, cuanto más se automatice, más difícil es equivocarse. 53 00:11:05,879 --> 00:11:20,820 Si hacemos los cálculos a mano, en cuanto hagamos una suma mal, ya hemos metido un error insalvable. Con la calculadora, pues más difícil equivocarse y con el Excel, más difícil todavía. 54 00:11:20,820 --> 00:11:39,460 ¿Vale? Entonces, bueno, hemos utilizado esta función para calcular los parámetros estadísticos básicos. Después tenemos, si nos vamos para atrás, tenemos a través de los datos y todo lo que hemos visto hasta ahora nos lo calcula directamente. 55 00:11:39,460 --> 00:11:54,799 ¿Vale? Si tenéis alguna... ¿Alguien ha dicho algo? Vale, la calculadora de Dani. Si tenéis una de este estilo, esta es que no he encontrado el simulador, pero es el otro modelo más habitual. 56 00:11:55,279 --> 00:12:00,340 Entonces, ¿cómo lo haríamos? Por si alguien la tiene, voy a ir un poco paso a paso haciéndolo con la mía, ¿vale? 57 00:12:00,340 --> 00:12:27,700 Le daríamos a mode, aquí, y al número 2, que es estadística, y ahora empezaríamos a meter los datos, igual que hemos hecho con la otra calculadora. Entonces, pues nos empieza a meter 6,3, por ejemplo, 6.3. Y ahora, para separar entre dato y dato, pulso M más, ¿vale? 6,3, M más. Y me sale en mi calculadora N igual a 1. Eso es que he metido el primer valor, ¿vale? 58 00:12:27,700 --> 00:12:52,419 Meto el siguiente directamente, 8,9 m más y me sale n igual a 2. Meto el siguiente, 7,5 m más, 6,3, 5,4. Cada vez que voy metiendo un dato y dándole a m más, me lo va guardando para hacer cálculos estadísticos con esos datos. 59 00:12:52,419 --> 00:12:56,759 y me va diciendo qué número de datos he metido yo. 60 00:12:57,179 --> 00:13:02,460 Esto es útil si estáis metiendo un montón de datos que tenéis escritos en un papel 61 00:13:02,460 --> 00:13:06,840 para saber por dónde vas, al final, para saber que los has metido bien. 62 00:13:07,159 --> 00:13:11,980 Una vez que los tengo dentro, voy a calcular los parámetros estadísticos. 63 00:13:12,159 --> 00:13:18,840 Entonces le doy a Shift, que me activa lo que está en amarillo. 64 00:13:19,080 --> 00:13:22,120 Si yo pulso la tecla normal, aquí me da el 2. 65 00:13:22,419 --> 00:13:33,860 Pero si pulso el Shift, me da las opciones de ese bar, que es la tecla en la que están los parámetros estadísticos. 66 00:13:33,860 --> 00:13:40,120 Entonces, le doy ahí y en mi calculadora me sale lo mismo que salía en la otra, pero menos automático. 67 00:13:40,220 --> 00:13:41,419 Los tengo que ir dando uno por uno. 68 00:13:41,960 --> 00:13:45,860 Me sale X media, X con la barra arriba, 1. 69 00:13:46,120 --> 00:13:50,000 Le doy al 1 y me da que la media es 6,88. 70 00:13:50,000 --> 00:14:06,580 Le vuelvo a dar otra vez a Shift y al 2. Y ahora quiero calcular la desviación. Pues en este caso, en mi calculadora me pone Sigma X o SX. ¿A cuál le tendré que dar? 71 00:14:06,580 --> 00:14:10,649 Perdona, pero 72 00:14:10,649 --> 00:14:12,950 ¿Tiene que verse algo en la pantalla? 73 00:14:13,330 --> 00:14:17,149 Aparte de la web de Amazon 74 00:14:17,149 --> 00:14:20,750 ¿Estás con la pantalla puesta 75 00:14:20,750 --> 00:14:22,490 Además de la web de Amazon 76 00:14:22,490 --> 00:14:23,409 Con la calculadora? 77 00:14:23,409 --> 00:14:29,840 No, tengo esta calculadora 78 00:14:29,840 --> 00:14:30,759 Es un poco raro 79 00:14:30,759 --> 00:14:33,919 Sí, es un poco raro 80 00:14:33,919 --> 00:14:36,700 Lo estoy haciendo con mi calculadora 81 00:14:36,700 --> 00:14:38,600 Y os lo estoy señalando aquí 82 00:14:38,600 --> 00:14:39,419 Porque, a ver 83 00:14:39,419 --> 00:14:40,620 Dime 84 00:14:40,620 --> 00:14:44,080 Por si tenéis este modelo 85 00:14:44,080 --> 00:14:48,679 Ah, vale, lo está señalando en la imagen 86 00:14:48,679 --> 00:14:50,100 Lo está señalando en la imagen 87 00:14:50,100 --> 00:14:52,120 Es que es lo mejor que he conseguido 88 00:14:52,120 --> 00:14:54,019 Creo que se ve mejor que si pongo la cámara 89 00:14:54,019 --> 00:14:56,639 Si no, me voy a grabar desde arriba 90 00:14:56,639 --> 00:14:57,759 No con el portátil 91 00:14:57,759 --> 00:14:59,419 Y os subo el vídeo aparte 92 00:14:59,419 --> 00:15:01,720 Que a lo mejor es más fácil 93 00:15:01,720 --> 00:15:03,879 Pero bueno, la cosa es que le tenéis que dar a Shift 94 00:15:03,879 --> 00:15:05,179 Al 2 95 00:15:05,179 --> 00:15:07,860 Y a las opciones que os ponga 96 00:15:07,860 --> 00:15:10,139 Que os pone Sigma de X, S de X 97 00:15:10,139 --> 00:15:15,580 yo le doy a Sx, que es la desviación de la muestra, y me dice 1,35. 98 00:15:16,179 --> 00:15:19,399 Entonces, por ejemplo, en este modelo, que lo tendréis muchos de este estilo, 99 00:15:19,960 --> 00:15:22,980 no te da, por ejemplo, la varianza, te da solo la desviación. 100 00:15:23,200 --> 00:15:27,200 Entonces yo, una vez que tengo la varianza, lo que hago es elevarlo al cuadrado, 101 00:15:27,240 --> 00:15:31,179 la desviación, perdón, lo elevo al cuadrado, y con eso tengo la varianza. 102 00:15:31,899 --> 00:15:34,460 ¿Quiero volver a la desviación? Hago la raíz cuadrada. 103 00:15:37,389 --> 00:15:39,850 Igual nos ha servido de mucho esto de la calculadora. 104 00:15:41,509 --> 00:15:49,429 No sé si, bueno, voy a intentar a lo mejor grabarme yo haciéndolo, que a lo mejor os sirve de más. 105 00:15:50,230 --> 00:16:04,500 Pero nada, si alguno tiene alguna calculadora distinta, lo que me importa es que sepáis que tenéis que utilizar la S y no la sigma 106 00:16:04,500 --> 00:16:13,419 y que si solamente os da S o S cuadrado, ¿vale? Vuestra calculadora, la otra la podéis hacer o elevando al cuadrado o haciendo la raíz. 107 00:16:13,460 --> 00:16:34,019 ¿Vale? Simplemente eso. Entonces, dicho esto de la calculadora y habiendo visto lo de las cifras significativas y los criterios de redondeo, lo siguiente a lo que vamos a ir es las distribuciones de frecuencias. 108 00:16:34,820 --> 00:16:49,480 ¿Qué es una frecuencia? Una frecuencia es lo que se repite algo. Por ejemplo, si te dicen cuál es la frecuencia en la que te aparece un valor en el laboratorio, 109 00:16:49,899 --> 00:16:54,539 tú contarás el número de veces que te sale ese valor. A eso se le llama la frecuencia. 110 00:16:54,539 --> 00:17:03,740 Entonces, nosotros podemos representar, o bien en forma de tabla o bien como una gráfica, la frecuencia de aparición de cada valor. 111 00:17:03,740 --> 00:17:18,460 Por ejemplo, el ejemplo de siempre de las edades. Si ahora mismo hacemos la distribución de frecuencias de las edades de esta clase, yo qué sé, 22 años, pues a lo mejor hay 5 personas, ¿no? Pues pongo 22 y la frecuencia es 5. 112 00:17:18,460 --> 00:17:28,240 23 años, 3 personas, 29 años, 4 personas, 30 años, 0 personas. Voy contando el número de veces que se repite. 113 00:17:29,039 --> 00:17:34,519 Entonces, eso luego lo puedo representar. Si veo que tengo muchos datos, lo puedo agrupar en clases. 114 00:17:34,519 --> 00:17:41,519 Por ejemplo, cuando se hacen las estadísticas del Instituto Nacional de Estadística de Edades, 115 00:17:41,519 --> 00:18:01,359 No van a poner 0 años, no sé cuántas personas, 1 año, no sé cuántas personas, 2 años, así hasta 100 años. Lo que se hace es agrupar y dices, vale, de 0 a 5 años hay estas personas, de 5 a 10, de 20 a 30, mayores de 80. 116 00:18:01,359 --> 00:18:08,299 Entonces, podemos agrupar y contaríamos cuántas veces se está repitiendo dentro de ese intervalo. 117 00:18:09,680 --> 00:18:13,440 Entonces, bueno, esto simplemente para que lo sepáis, no tenéis que saber hacerlo, 118 00:18:13,559 --> 00:18:17,099 pero tenemos distintos criterios para ver cómo separamos esas clases. 119 00:18:19,420 --> 00:18:24,839 Muchas veces se hace, un criterio que se utiliza mucho es aplicar esta fórmula, 120 00:18:24,839 --> 00:18:48,920 El número de clases es K más 3,32 por el logaritmo del número de datos. Y otro criterio es, por ejemplo, hacer la raíz del número de datos. O sea, si yo tengo, por ejemplo, 50 datos, el número de clases en lo que lo tengo que distribuir, o sea, el número de trocitos entre las que tengo que partir todos mis datos, son raíz de 50. 121 00:18:48,920 --> 00:19:10,579 ¿Vale? Entonces, bueno, luego determinamos el tamaño de cada una de las clases utilizando el rango, esto os lo pongo solo como información por si alguien lo quiere mirar, y elaboramos esa tabla en la que tenemos cada uno de los valores o de las clases y el número de veces que se está repitiendo, ¿vale? 122 00:19:10,579 --> 00:19:25,279 Podemos tener una tabla o una gráfica, que la gráfica de distribución de frecuencias lo que utilizamos son los histogramas, que son gráficos de barras que nos simbolizan cómo se están distribuyendo un conjunto de datos. 123 00:19:25,799 --> 00:19:36,039 ¿Y qué ventajas tienen las gráficas? ¿Por qué las usemos? Porque al final nos dan una información muy visual. Vemos rápidamente cómo se está comportando un determinado grupo de datos. 124 00:19:36,039 --> 00:19:49,559 Esto de aquí sería un histograma, tenemos nuestras barras, este de aquí es el que más se repite, luego estos de aquí, luego este y luego estos 125 00:19:49,559 --> 00:19:58,740 Lo vemos así a simple vista y decimos, vale, pues entre 50 y 55 es el valor que más veces se repite, el valor con más frecuencia 126 00:19:58,740 --> 00:20:09,420 Y podemos hacer también el polígono de frecuencias, que es simplemente, con el histograma, unimos los puntitos de medio de cada una de las clases. 127 00:20:10,099 --> 00:20:18,559 Y sería este gráfico. Entonces, a esto se le llama distribución de frecuencias. ¿Por qué os lo cuento y por qué tiene relevancia? 128 00:20:19,240 --> 00:20:27,119 Porque, según cómo se distribuyan las frecuencias, tenemos distintos tipos de series de distribución. 129 00:20:27,119 --> 00:20:42,119 Entonces, lo más habitual es clasificarla según su forma y la forma más habitual es la distribución normal. Distribución normal que también la habréis oído probablemente como distribución gaussiana. 130 00:20:42,119 --> 00:21:03,140 Entonces, esta distribución tiene muchas peculiaridades que utilizamos en nuestro beneficio que ahora os voy a ir contando. La distribución normal es esto que tenéis aquí, es esta gráfica en la que tenemos un punto máximo que luego disminuye y es totalmente simétrica. 131 00:21:03,140 --> 00:21:17,660 ¿Vale? Eso es importante que la distribución normal es simétrica. Entonces, tenemos un punto máximo, que es este de aquí, que se corresponde con la media de la distribución. 132 00:21:17,660 --> 00:21:31,660 Y luego tenemos una serie de segmentos que tienen una ventaja, que es que independientemente de cuáles sean los valores, se va a cumplir siempre una proporción. 133 00:21:32,119 --> 00:21:45,000 ¿Esto qué quiere decir? Que siempre entre mi media y mi media más la desviación voy a tener un 68% de los datos, más menos la desviación. 134 00:21:45,000 --> 00:21:59,000 Esto es mi media, esto es mi desviación, pues en el trozo que hay entre mi menos desviación y mi más desviación, o sea, dos veces la desviación, van a estar el 68% de los datos repartidos. 135 00:21:59,000 --> 00:22:05,099 partidos. ¿Esto por qué? Tiene una explicación matemática de cómo se integra la ecuación. 136 00:22:05,279 --> 00:22:12,779 Os he puesto un enlace en el aula virtual por si a alguien le interesa. Es la explicación 137 00:22:12,779 --> 00:22:19,000 matemática de cómo se llega a estos porcentajes, que por supuestísimo no hay ni que saber 138 00:22:19,000 --> 00:22:24,880 ni que ni siquiera entender, porque es matemáticamente muy complejo. Pero para que sepáis que esto 139 00:22:24,880 --> 00:22:42,880 No es una invención y que viene de un sitio concreto de integrar el área bajo la curva. Entonces, tenemos que entre la media y la media más menos la desviación están el 68%. 140 00:22:42,880 --> 00:23:08,740 Tenemos también que entre la media y dos veces la desviación por arriba o por abajo están el 95% de los datos. Y tenemos también que el intervalo entre la media y tres veces la desviación hacia arriba o hacia abajo, en todo este trozo, están el 99,7% de los datos. 141 00:23:08,740 --> 00:23:18,240 ¿Vale? Entonces, la ventaja que tiene esto es que nos da igual cuál sea el valor de sigma, de la media, y cuál sea el valor de mu, de la desviación. 142 00:23:18,460 --> 00:23:24,259 Que siempre, siempre, siempre, si es una distribución normal, se cumplen estos porcentajes. ¿Vale? 143 00:23:25,299 --> 00:23:33,000 Y vamos a hacer uso de eso para poder calcular, pues, qué cantidad de muestras vamos a tener por debajo de un determinado valor en una población. 144 00:23:33,000 --> 00:23:49,160 Entonces, esto es lo mismo. Os he dicho que entre la media y la media, más o menos la desviación, están el 68,27% de los datos, ¿no? 145 00:23:49,160 --> 00:24:02,000 Esto de aquí, este trocito entre esto y esto es el 68%. ¿Veis que entre esto y esto están el 99,7%? ¿Y dónde estaría el 100%? 146 00:24:02,000 --> 00:24:28,640 El 100% sería todo lo que hay, esto hay que creérselo también, desde menos infinito hasta más infinito, porque esta curva de aquí, veis que cada vez se va acercando más a este eje, pero nunca lo llega a cortar, ¿vale? Esto se puede extender hasta el menos infinito, esto hasta el más infinito, y sabemos que debajo de esa curva que va de menos infinito a más infinito, está en el 100% de los datos, ¿vale? 147 00:24:28,640 --> 00:24:44,960 Porque lo que os dije al principio, que en estadística muchas veces no tenemos el 100%, entonces aquí tenemos el 99,7, esto ya es un valor que prácticamente está pegado al eje de las X, pero aún así no es el 100%, ¿vale? 148 00:24:44,960 --> 00:25:14,259 ¿Vale? Entonces, hemos dicho que entre la media y la desviación tenemos aproximadamente el 68% de los datos, pues si mi media es 100, por ejemplo, y mi desviación es 15, yo qué sé, sí sé que es una distribución normal, que entre 100 menos 15 y 100 más 15, o sea, entre 85 y 115, están el 68,27% de los datos de mi distribución. 149 00:25:14,960 --> 00:25:29,400 Luego, también sé que entre la media y dos veces la desviación, tanto por arriba como por abajo, están el 95,45% de los datos, ¿vale? 150 00:25:29,400 --> 00:25:45,519 Pues digo, 100, que es la media, más dos veces la desviación, 100 más 30 son 130, y 100 menos dos veces la desviación, menos 30, son 70. 151 00:25:46,019 --> 00:25:57,339 Entonces, yo sé que el 95,45% de los datos está entre 70 y 130, ¿vale? 152 00:25:59,400 --> 00:26:32,339 ¿Hasta aquí? ¿Alguna pregunta? Me voy al chat. Cuanto más alejado de la media, más probabilidad que entre un valor. No entiendo la pregunta. ¿Me la puede replantear Dani? Bueno, vamos a verlo ahora con ejemplos. 153 00:26:32,339 --> 00:27:02,319 A ver, voy a poneros una... 154 00:27:02,339 --> 00:27:20,920 Con el eje de la seque, ¿eso qué quiere decir? Que se va acercando, acercando, acercando y lo cortaría en el infinito, aunque sea una cosa un poco compleja de asimilar, pero bueno, que estas dos barras de aquí se extenderían hasta más infinito y menos infinito. 155 00:27:20,920 --> 00:27:43,380 ¿Vale? Entonces, gracias a que yo sé esos porcentajes y que son fijos, si yo tengo una serie de datos, sé que se distribuyen de manera normal, o sea, que son una distribución normal, y tengo su media y su desviación, yo puedo saber qué porcentaje de los datos están por encima o por debajo de un determinado valor. 156 00:27:43,380 --> 00:27:50,380 ¿Y eso cómo lo hago? Lo hago haciendo uso de las tablas de la distribución normal estándar acumulada. 157 00:27:51,799 --> 00:27:56,319 Las tenéis ya subidas al aula virtual y tenemos distintos tipos de tablas. 158 00:27:57,259 --> 00:28:09,559 Esta que se ve ahora mismo en la pantalla es la versión simplificada, es la más sencilla y luego tenemos otra, que es esta de aquí, que es una un poquito más ampliada, pero se utilizan exactamente igual. 159 00:28:09,559 --> 00:28:28,099 Ahora vemos cómo. Entonces, yo puedo calcular un parámetro que se llama zeta, ¿vale? Que es este de aquí. Y yo puedo calcular zeta sabiendo mi media, mu, y mi desviación, sigma. 160 00:28:29,099 --> 00:28:55,440 Me faltaría solo la X. ¿Y qué es la X? La X es el valor que yo quiero evaluar. Vamos a poner un ejemplo. Imaginaos que tenemos que a partir de un registro histórico sabemos que las medidas de pH de un determinado producto se distribuyen de forma normal con una media de 6,54 y una desviación de 0,14. 161 00:28:55,440 --> 00:29:13,640 Y nos dice, ¿qué porcentaje de las medidas cae entre 6,40 y 6,60? Como yo sé que es una distribución normal y tengo la media, que es mu, y la desviación, que es sigma, yo puedo calcular mi z para estos valores de aquí. 162 00:29:13,640 --> 00:29:35,579 ¿Vale? Entonces, si por ejemplo yo quiero calcular mi Z para 6,40, ¿qué es lo que haría? Diría 6,40 menos 6,54 dividido entre 0,14 y tendría el Z que corresponde a 6,40. 163 00:29:35,579 --> 00:29:49,980 ¿Vale? Si lo hacemos con la calculadora, tendríamos x, 6,40, menos mu, 6,54, dividido entre 0.14. 164 00:29:50,279 --> 00:29:57,160 ¿Y eso qué me da? Me da un valor de menos 1. ¿Vale? Yo he calculado ya mi primera z, pues me voy a mi tabla. 165 00:29:57,160 --> 00:30:22,680 Y veis que aquí tenemos menos 3, menos 2, menos 1, 0, 1, 2. Y aquí tenemos los decimales. O sea, si yo quiero ver, por ejemplo, el valor de 2,5, me iría aquí 2,0, 2,1, 2,2, 2,3, 2,4 y 2,5. ¿Vale? Este 0,5 es lo que tengo que colocar aquí. 166 00:30:22,680 --> 00:30:41,440 Bien, mi resultado de la zeta que hemos hecho me ha dado menos 1. Entonces, ¿qué tengo que hacer? Irme aquí a la tabla, al menos 1.0, ¿no? Y me dice que el valor de zeta es 0,1587. 167 00:30:41,440 --> 00:30:57,180 ¿Esto qué significa? Esto significa que el 15,87% de los valores están por debajo del 6,40. 168 00:31:00,079 --> 00:31:06,619 Ahora, ¿cuántos valores están por debajo del 6,60? ¿Cómo lo calcularíamos? 169 00:31:06,619 --> 00:31:29,660 Es exactamente igual, ¿no? Me cojo y me digo z es igual a 6,60 menos la media, que es 6,54, y dividido entre la desviación, que es 0,14. 170 00:31:29,660 --> 00:32:02,109 Y me da 0,42. Me voy a mi tabla y digo 0,4. Porque no tengo más decimales. Ahora veremos que en la tabla ampliada lo que tenemos son más decimales. Esto es un 0,4. 171 00:32:03,109 --> 00:32:16,210 Y me dice 0,6554, que significa que un 65,54%, o sea, multiplicar esto por 100 porque está en tanto por 1, 172 00:32:16,210 --> 00:32:26,309 un 65,54% de los valores están por debajo de 6,60. 173 00:32:27,569 --> 00:32:31,700 ¿Vale? ¿Hasta aquí todo bien? 174 00:32:33,200 --> 00:32:34,319 ¿Dudas? 175 00:32:34,940 --> 00:32:55,740 Entre más amplio sea el intervalo, sigo sin entenderte, si quieres luego ponte el micrófono y me pregunto si quieres te quedas después, ¿vale? Me lo dices. 176 00:32:55,740 --> 00:33:07,720 Entonces, aquí lo que me está diciendo, este valor que yo calculo de Z, que me da un porcentaje, ¿vale? Esto sí que lo veis, ¿no? 177 00:33:07,720 --> 00:33:18,140 Que está en tanto por 1, o sea, 0,8413 sobre 1 es lo mismo que 84,13 por 100, es multiplicar esto entre 100, ¿no? 178 00:33:18,339 --> 00:33:25,579 Entonces, lo que me está diciendo es el número de datos que hay por debajo de un determinado valor, ¿vale? 179 00:33:25,740 --> 00:33:37,579 por debajo, o sea, si yo tengo que, vamos a intentar dibujarlo, tengo mi distribución 180 00:33:37,579 --> 00:33:47,619 normal que es así, ¿vale? Y aquí en el medio, aquí, esto de aquí que está en el 181 00:33:47,619 --> 00:33:56,220 centro es mi media, ¿vale? Y ahora mismo me están diciendo qué datos están por debajo 182 00:33:56,220 --> 00:34:03,880 de un valor concreto, ¿vale? Pues este es el valor, el valor x, y yo lo que estoy calculando 183 00:34:03,880 --> 00:34:09,639 es todo lo que está por aquí, ¿vale? Por debajo de este lado. Habíamos dicho que el 184 00:34:09,639 --> 00:34:17,480 total es el 100%, ¿no? Porque de menos infinito más infinito es un 100%. Entonces, esto de 185 00:34:17,480 --> 00:34:27,099 aquí, si me sale, ¿qué es lo que me salía? Un 67% y el total es un 100%, significa que 186 00:34:27,099 --> 00:34:39,880 este trocito de aquí hacia adelante será 100 menos 67, ¿no? O sea, un 33%, por ejemplo. 187 00:34:39,880 --> 00:34:50,480 Ahora, lo que me estaban pidiendo en mi ejercicio era que yo dijese cuántos datos estaban comprendidos entre dos valores. 188 00:34:50,480 --> 00:35:13,360 Vamos a dibujarlos para que se vea más sencillo. Tenemos nuestra distribución normal, que es algo así, y teníamos la media, algo así simétrico. 189 00:35:13,360 --> 00:35:29,559 Es que es un poco difícil escribir en esta pizarra. Teníamos la media, que nos decía el ejercicio, que es 6,54 y la desviación 0,14. 190 00:35:29,559 --> 00:35:43,099 ¿Vale? Media aquí 6,54, 6,54 y la desviación 0,14. 191 00:35:43,639 --> 00:35:49,579 Ahora, nos estaba diciendo que qué cantidad de valores estaban entre 6,40 y 6,60, ¿no? 192 00:35:49,579 --> 00:36:01,980 Entonces, tenemos aquí este 6,54, pues vamos a pensar que por aquí está el 6,40, ¿vale? 193 00:36:01,980 --> 00:36:08,280 Esto en esta escala, y por aquí el 6,60, uno un poquito por encima de la media y otro 194 00:36:08,280 --> 00:36:09,300 un poquito por debajo. 195 00:36:10,079 --> 00:36:15,320 Entonces, lo que nos están pidiendo es que digamos el número de datos que están realmente 196 00:36:15,320 --> 00:36:27,849 aquí, ¿no? Entre esto de aquí y esto de aquí, o sea, este trocito, esto de aquí, ¿vale? 197 00:36:27,849 --> 00:36:42,309 Entonces, ¿qué es lo que hago? Pues me calculo mi z para el primero y digo, vale, pues z es igual a x menos mu 198 00:36:42,309 --> 00:36:56,630 dividido entre sigma del primero, ya lo hemos hecho, que es 6,40 menos 6,54 dividido entre 14, 199 00:36:56,630 --> 00:37:23,210 que es igual a menos 1, el zeta de 6,60, pues zeta es igual a 6,60 menos 6,54 dividido entre 0,14 y me daba 0,4. 200 00:37:23,210 --> 00:37:39,429 Ahora, en mi tabla me decía que para z igual a menos 1, el porcentaje era 15,87%, ¿no? 201 00:37:39,429 --> 00:38:00,429 menos 1, 15,87%, ¿vale? Pues lo marco aquí, es 15,87%. Y para Z igual a 0,4, ¿cuánto 202 00:38:00,429 --> 00:38:24,710 ¿cuánto me decía que era? 0,4, 65,54%, ¿vale? Son 65,54%, ¿vale? Y lo que sí que sabemos 203 00:38:24,710 --> 00:38:29,070 es que estos datos que nos da la tabla de Z, lo que nos están diciendo es los valores 204 00:38:29,070 --> 00:38:38,590 que hay por debajo. Entonces, para el primero, para el de 6,40, este 15,87 es todo lo que 205 00:38:38,590 --> 00:38:47,590 está por aquí, por debajo del 6,40. Me está dando esto de aquí. Este porcentaje de aquí 206 00:38:47,590 --> 00:39:02,170 en rojo es 15,87, ¿vale? Esto de aquí son 15,87%. Ahora, el de 6,60, ¿qué fracción 207 00:39:02,170 --> 00:39:11,800 me está dando? Me está dando todo lo que está por debajo de 6,60, me está dando todo 208 00:39:11,800 --> 00:39:26,360 esto, o sea, desde aquí hasta el final, todo esto, ¿vale? Todo esto en azul, esto es un 209 00:39:26,360 --> 00:39:40,309 65,54%. Ahora, yo lo que quiero saber es el trocito amarillo, ¿no? Este de aquí. Entonces, 210 00:39:40,309 --> 00:40:03,119 ¿Cómo lo calcularía? Haciendo el total del 6,60 menos el 6,40 y me queda este trozo de aquí, ¿no? Entonces, la probabilidad de que esté entre este valor y este valor es la resta de esto menos esto. 211 00:40:03,119 --> 00:40:15,960 O sea, que sería 65,54 menos 15,87, que me da 49,67%. 212 00:40:15,960 --> 00:40:25,639 O sea, que esta parte en amarillo, que es la que yo quiero calcular, son 49,67%. 213 00:40:25,639 --> 00:40:37,469 ¿Sí? ¿Más o menos? Vale. 214 00:40:37,469 --> 00:41:02,510 Bien, entonces, aquí tenía unos datos en el que la X era, perdón, la media era 6,54 y la sigma 0,14, pero lo que pasa es que a mí me han dicho que se distribuye como una normal, como se distribuye como una normal, yo esto mismo que he hecho lo puedo hacer con cualquier valor de sigma y de mu que me den, ¿vale? 215 00:41:02,510 --> 00:41:07,409 lo puedo hacer con cualquiera. Entonces, ¿para qué me sirve esto? ¿Por qué nos permite la distribución normal? 216 00:41:07,730 --> 00:41:14,170 Pues conocer la proporción exacta de valores que tenemos dentro de un intervalo determinado. 217 00:41:14,429 --> 00:41:24,010 En este caso hemos calculado la cantidad de valores, la proporción de datos que hay entre 6,40 y 6,60 en esa distribución. 218 00:41:24,010 --> 00:41:34,349 podemos tener infinitas posibilidades de distribuciones normales en función de los valores de sigma y de mu, ¿vale? 219 00:41:34,349 --> 00:41:37,010 De mu la media y sigma la desviación. 220 00:41:38,250 --> 00:41:40,849 Entonces, aquí lo tenéis resuelto, ¿vale? 221 00:41:41,210 --> 00:41:49,090 Calculamos zeta, que es x menos la media entre sigma y la calculamos para 6,40 y para 6,60. 222 00:41:49,090 --> 00:42:02,329 lo que hemos hecho, nos da menos 1 para 6,40 y 0,43 más o menos para 6,60. Ahora nos vamos 223 00:42:02,329 --> 00:42:12,449 a la tabla de Z y buscamos las probabilidades. Nos daba para Z menos 1 0,1587, o sea un 15,87% 224 00:42:12,449 --> 00:42:21,530 de los datos están por debajo de ese 6,40. Para z igual a 0,4 hemos redondeado porque 225 00:42:21,530 --> 00:42:28,989 nuestra tabla no tiene más decimales en este caso. El área acumulada, o sea, lo que tenemos 226 00:42:28,989 --> 00:42:40,610 por debajo de ese valor es 0,6554, o lo que es lo mismo, un 65,54%. 227 00:42:40,610 --> 00:42:50,050 Entonces, el resultado es lo que hemos hecho, la resta entre lo que está por debajo del 6,60 228 00:42:50,050 --> 00:42:57,489 menos el trozo que está por debajo del 6,40, y eso me va a dar el intervalo que hay entre los dos valores, 229 00:42:57,489 --> 00:43:11,929 que es un 49,67% de los datos. Entonces, yo sé que como es una distribución normal, el 49,67% de los datos van a estar entre 6,4 y 6,6. 230 00:43:14,610 --> 00:43:24,369 Entonces, teníamos la tabla que hemos visto, que es más simplificada, que teníamos aquí un número entero, menos 3, menos 2, menos 1, 0, 231 00:43:24,369 --> 00:43:42,630 Y aquí un decimal, 0, 0,1, 0,2. Esta tabla es un poquito más ampliada porque tenemos tres decimales en total, ¿no? Este valor de aquí sería menos 3.0, menos 3.001, menos 3.002, 003, etc. ¿Vale? 232 00:43:42,630 --> 00:44:06,429 Y lo mismo, si tengo, por ejemplo, este de aquí es el 0,5, 0,50, 0,51, 0,52, 0,53, 0,54, ¿vale? 2,04, 2,14, ¿vale? 233 00:44:06,429 --> 00:44:28,409 Tengo aquí los decimales que son. En el caso de antes que nos daba 0,42, me parece 0,43, si hubiésemos tenido esta tabla podríamos haber afinado un poco más, ¿no? 0,4, 0,40, 0,41, 0,42, 0,43, que veis que la diferencia es muy pequeñita, ¿no? 234 00:44:28,409 --> 00:44:48,150 El 0,42 es un 66,28% y el 0,43 un 66,64%. Pero bueno, tratamos de utilizar esta tabla porque es un poco más completa. Entonces, esta lo que sí que tenéis es que saber cómo leerla, ¿vale? 235 00:44:48,150 --> 00:45:15,590 Aquí, en vertical, tenemos dos decimales, 0, lo que sea, 1, lo que sea, 2, lo que sea, y aquí tenemos el tercer decimal. Si es un 0, es que es un 0. Un 1, un 2, un 3, o sea, 0, 90 y 2. 1, 40 y 3. 236 00:45:18,150 --> 00:45:32,210 Entonces, habiendo hecho esto ya, a ver si sacáis este vosotros, ¿vale? Nos dicen, se han realizado varias mediciones de la pureza de una sustancia química y los resultados han seguido una distribución normal, ¿vale? 237 00:45:32,210 --> 00:45:44,090 ya me están dando la pista, con una media del 98% y una desviación estándar del 0,5%, ¿vale? 238 00:45:44,690 --> 00:45:50,269 Como es pureza la estamos dando en porcentaje, antes hablábamos de pH y dábamos un valor sin unidad, 239 00:45:50,829 --> 00:45:55,809 ahora estamos hablando de porcentaje, pero es exactamente lo mismo, si se distribuye como una normal, 240 00:45:55,809 --> 00:46:11,090 que nos lo están diciendo, una distribución normal, los porcentajes que hemos dicho antes se mantienen, que entre la media y más o menos la desviación están en 60 y pico por ciento de los datos, 241 00:46:11,329 --> 00:46:17,989 que entre la media y dos veces la desviación están en 95,4, porque son proporciones que siempre se mantienen. 242 00:46:17,989 --> 00:46:25,429 Entonces, gracias a eso podemos utilizar las tablas y calcular qué porcentaje de los datos está en un determinado intervalo. 243 00:46:25,429 --> 00:46:35,889 Entonces, nos dicen que se han realizado varias mediciones, que tenemos una media del 98% y una desviación del 0,5% 244 00:46:35,889 --> 00:46:46,090 y nos preguntan que qué cantidad, qué porcentaje de las muestras se espera que tenga una pureza superior al 99%. 245 00:46:46,090 --> 00:46:57,179 Entonces, lo que nos están diciendo es que ese 99% que es la X, ¿no? 246 00:46:58,099 --> 00:46:59,079 La X, sí. 247 00:46:59,380 --> 00:47:02,539 Y el porcentaje que se espera es la probabilidad. 248 00:47:02,980 --> 00:47:05,980 Pero la probabilidad de que sea mayor de... 249 00:47:05,980 --> 00:47:09,940 Vale, como nosotros con nuestra fórmula de la Z lo que sabemos es 250 00:47:09,940 --> 00:47:12,820 lo que es menor es lo que podemos calcular. 251 00:47:13,219 --> 00:47:14,139 Pues le damos la vuelta. 252 00:47:14,679 --> 00:47:17,719 Le damos la vuelta, hacemos el 100% menos lo que nos salga, ¿no? 253 00:47:17,960 --> 00:47:21,860 Porque si todo va a ser el 100%, si calculamos lo que está por debajo, 254 00:47:22,719 --> 00:47:25,360 si se lo restamos al 100%, tenemos lo que está por encima. 255 00:47:25,360 --> 00:47:28,659 Entonces, dime, dime, perdona. 256 00:47:29,239 --> 00:47:39,760 No, no, lo voy a decir para que vean cómo hacerlo ellos. Lo voy a decir luego. No, por eso digo. 257 00:47:39,760 --> 00:47:55,940 Ah, vale. Venga, pues si queréis un par de minutillos para hacer las cuentas, voy a colocar a 9805 y 99. A ver, os lo coloco en una pizarra. 258 00:47:55,940 --> 00:47:58,800 es que esto de no tener dos pantallas 259 00:47:58,800 --> 00:48:01,219 a ver, que borro todo esto 260 00:48:01,219 --> 00:48:07,300 y esto, perdonadme porque escriba tan mal 261 00:48:07,300 --> 00:48:09,619 pero es que son muy malas las tablets estas 262 00:48:09,619 --> 00:48:11,760 y es lo mejor que puedo escribir 263 00:48:11,760 --> 00:48:16,300 tenemos nuestra distribución normal 264 00:48:16,300 --> 00:48:23,119 que tiene una media del 98% 265 00:48:23,119 --> 00:48:33,039 Una sigma del 0,5%, si no recuerdo mal, ¿no? 0,5 nos decía el ejercicio. 266 00:48:38,800 --> 00:48:47,840 Y nos pregunta la X mayor del 99%, o sea, nos está diciendo la X que está un poco por encima de la media. 267 00:48:47,840 --> 00:48:59,719 Vamos a pensar que está, vemos el eje de las X y vamos a pensar que está aquí, ¿no? El 99%, ¿vale? 268 00:48:59,940 --> 00:49:11,699 Y lo que nos está pidiendo es qué cantidad de los datos está por encima del 99%, ¿vale? 269 00:49:11,699 --> 00:49:13,960 Es entre el 99% y el infinito. 270 00:49:14,659 --> 00:49:17,960 Entonces, nosotros lo que hacemos, lo primero de todo, es calcular nuestra Z, ¿no? 271 00:49:17,960 --> 00:49:21,199 Que ya sabemos que tiene esta fórmula. 272 00:49:21,199 --> 00:49:35,780 La fórmula Z es igual a X, que es este, es X, el 99%, menos mu, dividido entre sigma. 273 00:49:36,039 --> 00:49:39,900 Acordaos eso, que la Z, o sea, acordaos, no, que no os preocupéis si os sale positiva o negativa, 274 00:49:40,000 --> 00:49:41,280 que la tabla tiene para los dos. 275 00:49:41,699 --> 00:49:47,599 Si la x es mayor que la mu, saldrá positiva, pero si es menor, saldrá negativa, ¿vale? 276 00:49:47,619 --> 00:49:48,780 Que eso no os preocupe. 277 00:49:48,780 --> 00:50:05,820 Entonces, en este caso, z sería igual a x, que es 99, menos mu, que es 98, dividido entre sigma, que es igual a 0,5. 278 00:50:06,739 --> 00:50:14,019 Esto es igual a 99 menos 8 menos 98, 1, entre 0,5 son 2, ¿no? 279 00:50:22,719 --> 00:50:23,199 Vale. 280 00:50:24,539 --> 00:50:26,800 Entonces ya tenemos que Z es igual a 2. 281 00:50:27,039 --> 00:50:28,099 ¿Cuál será el siguiente paso? 282 00:50:28,480 --> 00:50:32,099 Ya hemos calculado el parámetro Z, nos vamos a la tabla, ¿vale? 283 00:50:32,900 --> 00:50:35,980 Pues os la publico aquí, la tenéis en el aula, ¿eh? 284 00:50:35,980 --> 00:50:39,739 Pero bueno, la ponemos aquí para que la veáis vosotros y me digáis. 285 00:50:40,980 --> 00:51:02,179 Entonces, me tendría que ir a la fila del 2, ¿no? Que es 97,72. Como me ha dado un 2 exacto, es 2.0. Entonces, es 0,9772. O sea, un 97,72%. 286 00:51:02,179 --> 00:51:30,650 Vale, entonces para esa Z tengo un 97,72%. Vale, este 97,72 ¿qué es? Es todo lo que está por debajo del 99, ¿no? 287 00:51:30,650 --> 00:51:45,590 O sea, sería todo esto, todo esto desde aquí, todo esto por aquí es un 97,72%. 288 00:51:45,590 --> 00:51:53,690 Pero a mí, como muy bien habéis dicho, lo que me están pidiendo es lo que está por encima del 99, no por debajo. 289 00:51:53,690 --> 00:52:17,070 Entonces, si por debajo está el 97,72 y el total de todo tiene que ser el 100%, lo que está por encima, que es 100 menos 97,72. 290 00:52:17,070 --> 00:52:26,230 Y eso me da 100 menos 97,72 es un 2,28%. 291 00:52:26,230 --> 00:52:42,349 Entonces, en respuesta a la pregunta del ejercicio, ¿qué porcentaje de los datos tendrán más de un 99% de pureza? 292 00:52:42,349 --> 00:52:45,929 Pues serán un 2,28% de los datos. 293 00:52:47,070 --> 00:53:07,829 ¿Vale? Al final lo he hecho yo. Os voy a decir el último, para que lo hagáis vosotros y a ver si nos da lo mismo. 294 00:53:07,829 --> 00:53:25,130 Nos dice que en una fábrica se producen frascos de 100 mililitros de una solución y el volumen de esta disolución sigue una distribución normal con una media de 100 mililitros y una desviación de un mililitro. 295 00:53:25,130 --> 00:53:40,829 O sea, mu son 100 y sigma es 1. Y nos dice que si el control de calidad rechaza los frascos que contienen menos de 98,5% mililitros, ¿qué porcentaje de los frascos se rechazará? 296 00:53:41,409 --> 00:55:32,849 Os lo dejo un par de minutillos y ahora lo vemos. Venga, vamos a resolverlo. ¿Lo habéis hecho alguno? 297 00:55:33,690 --> 00:55:34,030 Sí. 298 00:55:34,469 --> 00:55:35,150 ¿Cuánto nos da? 299 00:55:35,150 --> 00:55:37,889 6,68% 300 00:55:37,889 --> 00:55:39,829 6,68%, vale 301 00:55:39,829 --> 00:55:40,710 ¿Alguien más lo ha hecho? 302 00:55:46,989 --> 00:55:59,250 La x 303 00:55:59,250 --> 00:56:04,699 menos, dividido entre sigma 304 00:56:04,699 --> 00:56:05,900 entonces tenemos 305 00:56:05,900 --> 00:56:09,159 nuestra x que es 98,5 306 00:56:09,159 --> 00:56:10,179 menos 100 307 00:56:10,179 --> 00:56:12,760 dividido entre 1, que eso nos da 308 00:56:12,760 --> 00:56:14,320 1,5 309 00:56:14,320 --> 00:56:16,460 menos 1,5, perdón 310 00:56:16,460 --> 00:56:18,820 es esto menos esto, dividido entre esto 311 00:56:18,820 --> 00:56:20,400 vale, pues tenemos la z 312 00:56:20,400 --> 00:56:22,420 de menos 1,5 y lo que hacemos 313 00:56:22,420 --> 00:56:23,559 es irnos a la tabla 314 00:56:23,559 --> 00:56:39,699 Y tenemos menos 1,5, que es 0,0668, que multiplicado por 100, efectivamente, lo que me has dicho es un 6,68%, ¿no? 315 00:56:41,139 --> 00:56:52,559 Eso es lo que nos queda por debajo del valor que estamos evaluando, o sea, que ese porcentaje, ese 6,68, sería lo que rechazaríamos de nuestro lote, ¿vale? 316 00:56:52,559 --> 00:57:13,030 Estos que hemos hecho los tenéis todos resueltos, para que no os preocupéis. ¿Cuál estamos haciendo? Este ya lo hemos hecho. Un 6,68%, son menores de 98,5% y por lo tanto se rechazan. 317 00:57:13,030 --> 00:57:42,630 ¿Vale? Entonces, como no quiero meterme en muchas más cosas, sí que os voy a contar esto porque está muy relacionado. Esto que hemos visto de la distribución normal, hay un teorema en estadística que se llama teorema del límite central que lo que nos dice es que cuando tenemos muchas variables aleatorias, una suma de variables aleatorias, cuando va creciendo el número, o sea, cuando tenemos cada vez más medidas, se va apareciendo cada vez más a una distribución normal. 318 00:57:43,030 --> 00:57:59,869 Entonces, la suma de un gran número de variables aleatorias se distribuye aproximadamente como una normal. Si tenemos un número de muestras suficientemente grande, podemos asumir que se está comportando en muchas ocasiones de manera normal. 319 00:57:59,869 --> 00:58:10,949 Y esa es la gran ventaja que tenemos, que realmente si sabemos que se distribuye de una manera concreta y sabemos qué proporción hay o qué relación hay entre esa ecuación, 320 00:58:11,110 --> 00:58:17,090 tenemos un montón de información independientemente de cuál sea la media, cuál sea la desviación, etc. 321 00:58:17,510 --> 00:58:26,030 Esto pensad, por ejemplo, que pasa mucho cuando estamos midiendo un error. Los errores aleatorios se distribuyen de una forma normal. 322 00:58:26,610 --> 00:58:38,130 ¿Esto qué quiere decir? Imaginaos que yo aquí estoy midiendo, pues eso, un pH, siempre pongo el mismo ejemplo, o una concentración, lo que queráis, me da lo mismo. 323 00:58:38,590 --> 00:58:51,849 Imaginaos que el valor real, entre comillas, el valor verdadero es 7. Pues yo cuando hago medidas, a lo mejor hay una vez que mida 7,1, 6,9, 7,2, 7,1 otra vez. 324 00:58:51,849 --> 00:59:00,630 Entonces, cuanto más cerca esté de mi valor real, más probabilidad hay de que me equivoque un poquito, ¿no? 325 00:59:00,630 --> 00:59:11,230 O sea, es mucho más probable que yo mida, si el valor real es 7, un 7,1 o un 6,9, a que mida un valor de 9, ¿no? 326 00:59:11,489 --> 00:59:13,750 Esta probabilidad es mucho más baja. 327 00:59:13,750 --> 00:59:25,829 Entonces, cuando yo estoy midiendo errores aleatorios, lo que más se agrupa alrededor de mi valor central o de mi valor real son los valores que están muy cerquita. 328 00:59:26,889 --> 00:59:33,150 Según me voy alejando de mi valor real, cada vez es más difícil que cuando yo me equivoque de un número tan distinto. 329 00:59:33,329 --> 00:59:37,989 Entonces, esta distribución va cayendo. Si os dais cuenta, se distribuye de una manera normal. 330 00:59:37,989 --> 00:59:49,670 Y esto me ayuda mucho porque yo voy a poder calcular y cuantificar muchas variables haciendo uso de esta propiedad que tienen los datos de distribuirse alrededor de un valor central. 331 00:59:51,190 --> 01:00:02,670 Y esto es un poco la base del cálculo de los intervalos de confianza. Esto lo habéis calculado más veces en otros módulos. 332 01:00:07,989 --> 01:00:30,789 Alguien, bueno, no sé si lo tenéis, no me quiero repetir, pero no sé si lo tenéis trabajado, los intervalos de confianza, cuando nosotros por ejemplo expresamos un resultado, que hemos hecho una medida y decimos pues mi pH, el pH que yo he medido, de estas 10 medidas tiene una media de 7,4 más menos 0,1. 333 01:00:30,789 --> 01:00:50,190 Por ejemplo, que eso significa, si yo digo, a ver que escriba aquí, no sé si se puede borrar la pantalla entera para el próximo día a mirar páginas, igual puedo hacer otra página. 334 01:00:50,190 --> 01:01:11,809 Bueno, si yo tengo un intervalo de confianza de una medida que yo he hecho, que es, pues, eso, la concentración es 7,5 más menos 0,2 molar, lo que sea. 335 01:01:11,809 --> 01:01:35,230 ¿Eso qué significa? Que yo estoy diciendo que mis datos están entre 7,5 menos 0,2 y 7,5 más 0,2. O sea que mis datos están entre 7,3 y 7,7. 336 01:01:35,690 --> 01:01:44,389 Esto es un intervalo de confianza. Yo doy un intervalo, o sea, una fracción en la que te digo que va a estar comprendido el valor real. 337 01:01:44,710 --> 01:01:52,150 Cuando digo valor real es para que se me entienda. No es correcto decir valor real, pero que mi valor va a estar comprendido entre estos dos, 338 01:01:52,630 --> 01:02:00,769 siempre que este sea mi intervalo de confianza. Entonces, para calcular eso, hacemos uso de todo este conocimiento que hemos visto previamente. 339 01:02:00,769 --> 01:02:13,769 Os he puesto un vídeo en el aula virtual, que es un poco tarde y como es un poco largo lo podéis ver por vuestra cuenta si queréis, que nos explica de dónde sale todo esto de la distribución normal. 340 01:02:13,909 --> 01:02:23,510 Solamente por si a alguien le interesa y lo quiere ver porque tiene curiosidad. No os asustéis y que nadie se piense que esto es parte del temario ni nada parecido. 341 01:02:23,510 --> 01:02:39,750 Solamente es para que, bueno, pues eso, pues si a alguien le interesa. Entonces, el próximo día, porque hoy ya me parece que nos vamos a meter en mucho, vamos a terminar con esto y a calcular los intervalos de confianza, ¿vale? 342 01:02:39,750 --> 01:02:44,889 que os hago un avance, vamos a hacer uso de tablas estadísticas 343 01:02:44,889 --> 01:02:47,190 igual que hemos utilizado la de la distribución normal 344 01:02:47,190 --> 01:02:51,750 la semana que viene cuando queramos calcular los intervalos de confianza 345 01:02:51,750 --> 01:02:54,889 vamos a utilizar la tabla de la T de Student 346 01:02:54,889 --> 01:03:00,130 y bueno, si vemos esta es la fórmula, vamos a analizarla un poco 347 01:03:00,130 --> 01:03:05,050 tenemos la media, que ya la sabemos calcular tanto a mano como con la calculadora 348 01:03:05,050 --> 01:03:07,849 la T, que es la T de Student 349 01:03:07,849 --> 01:03:12,329 la S que es la desviación típica o desviación estándar 350 01:03:12,329 --> 01:03:14,510 que lo mismo, la sabemos calcular también 351 01:03:14,510 --> 01:03:16,710 tanto a mano que es un poco ferragoso 352 01:03:16,710 --> 01:03:18,170 como con la calculadora 353 01:03:18,170 --> 01:03:21,130 y dividido entre la raíz de N 354 01:03:21,130 --> 01:03:23,090 que N es el número de datos 355 01:03:23,090 --> 01:03:25,030 ¿vale? entonces en realidad tenemos todo 356 01:03:25,030 --> 01:03:27,349 solo tenemos que saber cómo utilizar 357 01:03:27,349 --> 01:03:29,530 o cómo buscar nuestro valor 358 01:03:29,530 --> 01:03:31,309 en nuestra tabla de la TED Student 359 01:03:31,309 --> 01:03:35,230 ¿vale? pero eso creo que ya ha sido un poco intenso 360 01:03:35,230 --> 01:03:41,090 Así que esto lo continuamos el próximo día para no meternos en más.